サーベイミーティング0608

本日は井上(M1)と和田(M2)が発表を行いました。

Neural Joking Machine

井上の発表はNeural Joking Machineについてでした。これはデータセットとして「ボケてbokete」から画像と(面白い)キャプションの対を収集し、それを用いてキャプション生成を行うというものです。ニューラルネットワークのアーキテクチャはほぼ既存のものを使用しており、学習させるデータだけが異なるという状況でも明らかに性能の差が出るそうです。

着眼点が変わっていて面白い研究だといえますが、一方で教師データの重要性を物語る結果ともなっており、良い知見を含むものだとも感じます。

表記揺れ検出への挑戦

和田の発表は独自に実装したものについてでした。基本的には「Encoder-Decoderでレシピの材料名を正規化する」といったクックパッド開発者ブログを下敷きにしたものであり、文字ベースのLSTMを用いたseq2seqによって表記揺れを解消しようとするものとなります。

和田の実験では辞書などから得られたひらがなと漢字表現のペア(「みつけだす」と「見つけ出す」)などを大量に用意し学習させていましたが、ペア間で出力が変わってしまったり、同じものが出力されても違う言葉になっていたりと、なかなか一筋縄ではいかないようでした。

簡単な表記揺れならば形態素解析などを行う方が良い精度が出ると考えられるため、seq2seqはより複雑な表記揺れに対する性能が良くなってほしいところであり、そのためにはもう一つ、二つ大きな工夫が必要そうかなと感じました。

[文責:迫田(B4)]