萩原研究室では 会話のできるロボット頭脳 を目指しています。人間が他の動物に比べて大きく優れている点として、言語の使用があげられます。例えば「山」は、わずか3本の縦線と、1本の横線からなっています。でも「山」から、多くの山や峰、その風景などをイメージすることができます。

つまり、文字とはとても高いレベルで抽象化されたものと考えることができます。そして私たちは、この文字を組み合わせて言語として使用し、さらに抽象レベルの高い情報処理を行なっています。このような処理を人工頭脳に行なわせるにはどうしたらよいでしょうか?

例えば「春」を広辞苑で調べると、四季の最初の季節、正月、勢いの盛んな時、青年期などと解説されています。しかし、暖かく眠気を誘う、桜の季節、入学式、木々や草花の芽が出る、新緑、など、私たちが「春」に対して持つイメージはあまり出てきません。

萩原研究室では、ディジタル化されたさまざまな言語資源(*)とニューラルネットワークWebなどを組み合わせたロボット頭脳の構築をめざしています。

(*)言語資源:さまざまな電子化辞書やコーパス(文例集)など

右図は萩原研にある言語資源

1) ディジタル化された言語資源の
統合

 人間が持つ膨大かつ常識的な知識ベースを構築します。これは大脳皮質での長期記憶部に、記憶の分類では、宣言的知識の記憶意味記憶に対応します。(将来的にはこの部分もニューラルネットワーク化を行ないます。)

2) ニューラルネットワーク 
人間の短期記憶前頭葉での思考に対応します。入力言語情報をニューラルネットワーク形式に展開し、長期記憶部へのアクセスを行なう事により、物事の概念やより深い意味の理解が可能となります。例えば、「リンゴ」に対しては、甘酸っぱい、果物、赤、青森でよくとれる、ジュースにもなる、などなどです。このように入力文章に答えが含まれていないような場合でも、長期記憶部へのアクセスを行なう事により正しい解答を出力したり、あるいはさらにレベルの高い推論あるいは創造などを可能とします。

3) Web Intelligence、視覚情報処理、感性情報処理との統合

  時々刻々変化する現在の状況への対応、さらに広範囲な知識を求めて、言語資源のみならずWebへのアクセスも同時に行ないWeb Intelligenceのアプローチも用います。

Webは、電子化辞書などの言語資源とは異なり、ミスや誤りなども多く含まれています。そこではWebから得られる相異なる情報から、機械学習などより正しい情報を選択抽出する方法などの研究も必要になってきます。さらに視覚情報処理、感性情報処理との融合もめざしてロボット頭脳の構築をめざします。

具体的な研究テーマには以下のものがあります。

言語処理ニューラルネットワーク
Neural Network for language procesisng

言語を扱っているのは生体の脳です。ならば/理方式も脳を模擬するのが自然で、効果的です。

デジタル化言語資源を脳の長期記憶とみなし、自然言語文から質問に答えることができるニューラルネットワークです。

ネットワーク構造の改良と豊富な言語資源の有効利用により、さらに高度な知的処理をめざします。

深層学習ニューラルネットワーク
Deep Learning Neural Networks


 画像認識、音声認識、化学などの多くの分野で極めて優れた特性を示す革新的な新しい情報処理方式です。萩原研究室では、
 ・連想メモリへの応用
 ・自動学習アルゴリズム
 ・人工頭脳モデルへの適用
 ・(未発表技術 複数)
など、基礎研究から応用をめざした研究まで広く行っています。
 
画像からの解釈文生成
Image understanding and explanation


 色や線分情報などの物理的特徴量に基づく従来のパターン認識、物体認識の次をめざしています。
 Webでの情報や言語資源等も利用して被写体を認識し、その総合的な理解をめざします。こうして画像全体をわかりやすく説明する文章を生成します。
 
常識の自動獲得
Automatic acquisition of common sense


 人工知能の研究分野で困難な問題の一つが、常識の扱い、特にその自動獲得です。常識は明示的に表現されていることが少なく、また表現するとしても膨大量の記述が必要になるからです。したがって、if-thenルールなどを使っての常識の表現には限界があります。
 Web-Intelligenceと言語資源を効果的に用いることにより、自然言語入力文に対する常識判断が可能になりました。
「笑い」(漫才台本)自動生成
Comedy scripts automatic generation


 人間の会話において、笑いはとても重要です。例えば欧米でのスピーチではユーモアが不可欠です。

 漫才は身振り等を含めてこれらが集約されたものです。一般書籍などから「笑い」「ユーモア」のポイントやコツ・原理を学び、これを実際のシステムとして構築していきます。豊富な言語資源が重要な役割を果たします。

 
ロボットによる漫才
Comedy by robots


 Pepperなど、ロボットが家庭に普及して行く時代を迎えようとしています。ますます身近になるロボットは、お手伝いさんロボット、あるいはペットロボット的な役割のみならず、人間を楽しませてくれるエンターテイナーな役割も望まれるようになると考えられます。
 
高齢者との会話システム
Automatic acquisition of common sense


 日本は世界一の超高齢社会に突入しています。高齢者の方々をサポートするシステムの需要は極めて高く、市場規模も大きくなります。会話によって、知的活動を支え、生活に潤いを与えるような知的会話ロボットをめざします。

キャッチフレーズ自動生成
Catch phrases automatic generation

 キャッチフレーズには、ユニークさと共にわかりやすさ、豊かな語彙力など高度な知的レベルが要求されます。

 デジタル化された各種言語資源とWeb 情報を有効に活用して、専門家に匹敵するキャッチフレーズの生成をめざします。同時に具体的アプリケーションにより、人間の高度な知的情報処理のメカニズムの解明に迫ります。

「楽しい」会話文自動生成
A system for funny conversation

 人間の会話において、笑いはとても重要です。例えば欧米でのスピーチではユーモアが不可欠です。一般書籍などから「笑い」「ユーモア」のポイントやコツ・原理を学び、これを実際の対話システムとして構築していきます。ここでも豊富な言語資源が重要な役割を果たします。

ブログからの情報統合システム
 Information integration from blogs

 ブログにはさまざまなものがあり、またその情報量も多く、有益なブログも多いです。ここではそのようなブログに記載されている多くの情報をまとめ、ユーザにわかりやすい形で提示するシステムの開発を行っています。

-ちょっと前の言語系研究 -

想起・推論・文生成を行う言語処理ニューラルネットワーク

笑いを生み出すことわざすかしの自動生成

高齢者を対象とする会話システム

Webを知識源としたニューラルネット型質問→解答システム