サーベイミーティング0627

本日は金(B4)と迫田(B4)の2名が発表を行いました。

アテンション機構を用いたゲート付きマルチモーダルセンチメント分析

金の発表は「商品や事物に対しての批評動画を入力として話者の感情を分類するタスク」への新手法についてでした。入力が動画であるので動画像、音声、また音声を書き起こしたテキストデータというマルチモーダルな入力を上手く扱うことが求められます。紹介された論文の提案手法では、入力としてある3種類のデータのうち音声ベクトルと映像ベクトルがノイズになるような状況に対応するため、まずゲートに相当するニューラルネットを学習させ不要な情報を除去するものとなっています。その後LSTMに入力データを流しこんだのちに、注意機構を用いて性能を向上させたとのことでした。最近は注意機構が各分野で多用されており、また性能向上が見られたという報告も多いため、目が離せない手法となっています。

Thinking Fast and Slow with Deep Learning and Tree Search

迫田の発表は強化学習とゲーム木探索を組み合わせる手法についてでした。この分野ではDeepMindが発表したAlphaGo,AlphaGoZeroなどが有名ですが、ほぼ同時期に行われた類似研究である本論文を紹介しました。これもまたニューラルネットワークにより方策及び状態価値関数を近似し、モンテカルロ木探索を用いてゲーム木探索を行うというものになっています。教師情報としてモンテカルロ木探索から得られる方策を直接用いることでより良い学習が行えたとのことです。

発表が行われたタイミングも数か月しか変わらず、この分野の競争の激しさがうかがえます。強化学習は大きく流行している分野ですが、中でも環境が既知であるような強化学習としてボードゲームは非常に興味深い題材であると思っています。

[文責:迫田(B4)]