コンピュータは言葉を
理解しうるか。
言葉(自然言語)は、人間の想念を乗せるビークルだ。しかし現在、コンピュータがそれを自在に乗りこなすことは容易ではない、と言わざるを得ない。言葉には省略があり、修飾や比喩があり、行間が含意するものがある。規則性から離れた表現が使われ、時代を映す新語が登場する。言葉は難しい。
人工知能の根幹をなす課題といわれる“言葉の壁”-「自然言語処理」の最前線を走り続けるのが乾健太郎教授だ。曰く「コンピュータが文脈の襞にある意味を推測するには、広範な常識や知識が必要」。その習得と蓄積を後押ししているのが、機械学習とビッグデータである。機械学習は、計算機自身がデータの背景にある法則や傾向を探って自ら学び、自動解析・予測することを目指すものだ。さて、学ぶにはテキストが要る。近年、機械学習を加速度的に洗練させているのが、インターネット上にある膨大な言語データである。もちろんそこには君たちがSNSでつぶやいた言葉も含まれる。
行間を読む。
世界最速、仮説推論方式。
インターネット上にあるテキストビッグデータから言語知識や常識を自動獲得し、大規模知識データベースを形成。そこから仮説推論する方法を開発したのが乾教授らのグループだ。驚くべきはその動作速度で、米国の従来システムより1万倍以上のスピードだという。世界でもあまり類のないアプローチによる基礎研究である点、そしてオープンソースとして開かれていることなどが評価され、第14回(2015年)ドコモ・モバイル・サイエンス賞を受賞。他にもインパクトの高い多くの賞に輝いている。
仮説推論技術に期待されるのは、自然言語処理が不得手とする“行間を読む”ことや、因果関係を組み合わせて説明することである。この技術がさらに進展・成熟していくことで、ウェブ上の集合知を掘り起して編集し、ユーザーにとって価値ある「知」として新たに創出したり、情報信頼性を担保するための多角的な分析・検証につなげたりすることができる。さらには画像・映像といった視覚情報と統合させることで人工知能やIoTの進化も加速していくことだろう。
1コマの授業が、
進路を決する。
たった一度の出来事が、その後の人生を決定づけることがある。乾教授の場合がそうだ。学部生時代に履修していた人工知能の授業、その1コマで自然言語処理が取り上げられた。言葉という人間の高度・複雑かつ柔軟な知的営みを、数学・論理・プログラムで計算・分析処理することへの可能性に-これはおもしろそうだ、やってみたい!-知的探究心は沸き立った。こうして「文系分野への就職希望」だった青年は、当時黎明期だった自然言語処理への道を歩むことになるのである。
座右の銘は、世阿弥が唱えた「離見の見(りけんのけん)」。視野狭窄に陥らないよう、独善的に走らぬよう自身を客観視する姿勢は、研究者としても、一個人としても大切なのではと話す。プライベートでは和服を愛する粋人でもある。共同研究のひとつは、居酒屋で隣り合った人との出会いが縁となり結ばれた。ウェブ上の集合知にも、リアルな社会での一期一会にも、等しく可能性の萌芽を見出す。自由で柔らかな感性が、先進研究をドライブさせる力なのかもしれない。