人間が外界から得る情報の8割は視覚情報といわれています。人工頭脳の構築において、視覚情報処理は極めて要素です。
画像工学やコンピュータビジョンなどの工学的な分野で、いわゆるパターン認識の研究が盛んに行なわれて来ました。しかしながら人間の視覚機能のように、状況の変化や明るさの変化、回転や移動などに対しても有効なパターン認識技術はまだ開発されていません。なぜでしょうか? 私たちは、人間の優れた視覚機能にもっと学ぶべきと考えています。 これまでのパターン認識は、例えばリンゴの写真を入力すると、「リンゴ」という認識結果が与えられるだけでした。これでは単なる
画像情報 → 文字情報
の変換にすぎません。
萩原研では、脳での情報処理を学び、それを工学的に応用する方向で研究を行なっています。脳では視覚情報が入力されると、「色」「形」「動き」などの要素に分けた処理が行なわれます。同時に対象物体のみならず、周囲からの情報も用いて認識や理解を行ないます。さらに脳に蓄積されている知識、経験、言語、そして感性を用いてさまざまな高度な処理が行なわれます。
萩原研の視覚情報処理は、近年大きな進展があったコンピュータビジョンの分野でのアイデア、例えば特徴点の抽出法、統合方法なども積極的に導入しています。このようにして、画像認識から画像理解、画像解釈をめざした研究を行なっています。そして最終的には、言語情報処理と感性情報処理との融合によるロボット頭脳の実現をめざしています。
具体的な研究テーマには以下のものがあります。
Image understanding and explanation 色や線分情報などの物理的特徴量に基づく従来のパターン認識、物体認識の次をめざしています。 Webでの情報や言語資源等も利用して被写体を認識し、その総合的な理解をめざします。こうして画像全体をわかりやすく説明する文章を生成します。 |
Deep Learning Neural Networks 画像認識、音声認識、化学などの多くの分野で極めて優れた特性を示す革新的な新しい情報処理方式です。萩原研究室では、 ・連想メモリへの応用 ・自動学習アルゴリズム ・人工頭脳モデルへの適用 ・(未発表技術 複数) など、基礎研究から応用をめざした研究まで広く行っています。 |
Image generation from sentences 通常の画像認識や画像理解は、画像から単語や文への変換といえます。 本研究は、入力文章を解析し、その内容やイメージに合う画像を生成するというユニークな研究です。 |
Bayesian Neural Networks 私達は目で見た物を、記憶と照合して認識し、またそれを言葉で表現したり、理解したりします。そして多くの場合、物体のイメージも考慮されます。 このように、人間は視覚情報、言語情報、感性情報を総合的に処理していると考えられ、これを行うニューラルネットワークの研究を行っています。 |
Image understanding and explanation 生物の視覚情報処理を模擬したニューラルネットワークとしてネオコグニトロンという優れたモデルがあります。これに最近発展の著しい脳科学の知見を取り入れて、高機能化、知的情報処理との統合をめざします。 |
-ちょっと前の画像系研究 -
・ 画像の認識と理解
・ 視覚情報処理に基づくニューラルネットワークを用いた画像認識システム