東北大学 大学院情報科学研究科 Graduate School of Information Sciences, Tohoku University 東北大学 大学院情報科学研究科 Graduate School of Information Sciences, Tohoku University 東北大学 大学院情報科学研究科 Graduate School of Information Sciences, Tohoku University 東北大学 大学院情報科学研究科 Graduate School of Information Sciences, Tohoku University
 
 
 
 

#01 研究者、駈ける。 Days of Aobayama #01 研究者、駈ける。 Days of Aobayama

ビッグデータから知をつむぐ。 乾 健太郎 東北大学大学院 情報科学研究科 システム情報科学専攻 教授 ビッグデータから知をつむぐ。 乾 健太郎 東北大学大学院 情報科学研究科 システム情報科学専攻 教授

コンピュータは言葉を
理解しうるか。

言葉(自然言語)は、人間の想念を乗せるビークルだ。しかし現在、コンピュータがそれを自在に乗りこなすことは容易ではない、と言わざるを得ない。言葉には省略があり、修飾や比喩があり、行間が含意するものがある。規則性から離れた表現が使われ、時代を映す新語が登場する。言葉は難しい。

人工知能の根幹をなす課題といわれる“言葉の壁”-「自然言語処理」の最前線を走り続けるのが乾健太郎教授だ。曰く「コンピュータが文脈の襞にある意味を推測するには、広範な常識や知識が必要」。その習得と蓄積を後押ししているのが、機械学習とビッグデータである。機械学習は、計算機自身がデータの背景にある法則や傾向を探って自ら学び、自動解析・予測することを目指すものだ。さて、学ぶにはテキストが要る。近年、機械学習を加速度的に洗練させているのが、インターネット上にある膨大な言語データである。もちろんそこには君たちがSNSでつぶやいた言葉も含まれる。

行間を読む。
世界最速、仮説推論方式。

インターネット上にあるテキストビッグデータから言語知識や常識を自動獲得し、大規模知識データベースを形成。そこから仮説推論する方法を開発したのが乾教授らのグループだ。驚くべきはその動作速度で、米国の従来システムより1万倍以上のスピードだという。世界でもあまり類のないアプローチによる基礎研究である点、そしてオープンソースとして開かれていることなどが評価され、第14回(2015年)ドコモ・モバイル・サイエンス賞を受賞。他にもインパクトの高い多くの賞に輝いている。

仮説推論技術に期待されるのは、自然言語処理が不得手とする“行間を読む”ことや、因果関係を組み合わせて説明することである。この技術がさらに進展・成熟していくことで、ウェブ上の集合知を掘り起して編集し、ユーザーにとって価値ある「知」として新たに創出したり、情報信頼性を担保するための多角的な分析・検証につなげたりすることができる。さらには画像・映像といった視覚情報と統合させることで人工知能やIoTの進化も加速していくことだろう。

1コマの授業が、
進路を決する。

たった一度の出来事が、その後の人生を決定づけることがある。乾教授の場合がそうだ。学部生時代に履修していた人工知能の授業、その1コマで自然言語処理が取り上げられた。言葉という人間の高度・複雑かつ柔軟な知的営みを、数学・論理・プログラムで計算・分析処理することへの可能性に-これはおもしろそうだ、やってみたい!-知的探究心は沸き立った。こうして「文系分野への就職希望」だった青年は、当時黎明期だった自然言語処理への道を歩むことになるのである。

座右の銘は、世阿弥が唱えた「離見の見(りけんのけん)」。視野狭窄に陥らないよう、独善的に走らぬよう自身を客観視する姿勢は、研究者としても、一個人としても大切なのではと話す。プライベートでは和服を愛する粋人でもある。共同研究のひとつは、居酒屋で隣り合った人との出会いが縁となり結ばれた。ウェブ上の集合知にも、リアルな社会での一期一会にも、等しく可能性の萌芽を見出す。自由で柔らかな感性が、先進研究をドライブさせる力なのかもしれない。