
抽象的な世界を具体的な世界に変える、
統計科学にはそんな魅力がある。
まだ寒さの残る3月、東北大学百周年記念会館川内萩ホールにピアノの美しい音色が響いた。演奏者は、東北大学大学院情報科学研究科で統計数理学研究室を主宰する荒木由布子教授。譜面台に楽譜はなく、1時間もの間、身体の内側から音がほとばしるように、荒木教授は鍵盤に向き合い続けた。「久しぶりに弾いたので、腕が痛い」と笑う荒木教授は、「ピアニストの先生に師事し、ピアノ練習に没頭していた子供時代、そして発表会での緊張など、さまざまな記憶や思いがあふれてきた」と話す。
統計科学では、数学に基づいて理論(統計モデル)をつくる。その理論を具体的に表現するものとして発展してきたのが計算機科学だ。「実世界のさまざまな現象に統計モデルを適用し、分析し、新たな情報を得て次の行動につなげる、という統計科学研究の一連の流れは、音楽の創造過程、さらには演奏や鑑賞での感動にも通じるものがある」と荒木教授はいう。「音楽は、『楽典』という理論(ルール)に基づき、楽器から奏でられる音を組み合わせることで曲となります。私の好きなショパンやドビュッシー、バッハ、ベートーヴェン、ラフマニノフの楽曲もみなそう。理論があって、私たちの感動がある。一方、数理的な理論の厳密性と、現実世界の複雑な問題に適用できる柔軟性を兼ね備えている統計科学には、社会や人々のくらしを動かす力があります。音楽や数学など、抽象的な世界への関心の強かった私にとって、抽象的な世界を具体的な世界に変える、そんな強烈な魅力が統計科学にはあったのです」。

関数データ解析での革新的手法の提供、
そして新たな統計モデルの開発へ。
高校時代は数学が面白く数学を楽しんでいた一方で、進路は文系志望だったという荒木教授。「日本の古典文学の響きが綺麗で、大学生になったら古典の世界をじっくり味わってみたいと考えていました」。担任だった数学の先生の勧めもあって、最終的には理系志望に切り替え、カナダ・レスブリッジ大学へ留学。そこで出合ったのが統計科学だった。「データを通じて現象をモデル化し、解釈することの面白さに気付いたのがきっかけでした。データ駆動型のアプローチに可能性を感じ、カナダ・カルガリー大学に編入、さらに大学院の修士課程に進みました」。ここで荒木教授は、関数データ解析※1を用いて人間の歩行データを分析、運動学的データのダイナミクスを統計的にモデル化することに挑戦し、新しい統計モデルの可能性を示した。
九州大学大学院博士課程への進学を機に帰国した荒木教授は、関数データ解析の統計モデルの理論的開発に向け、研究をさらに深化させた。関数データの次元縮小のための規準として一般化情報量規準(GIC)※2を世界に先駆けて提案、高次元データのモデル選択における信頼性の向上に寄与した。またこの時期、それまでの研究成果を医学・生物統計学へと展開し、胃がんCT画像解析への応用、さらには脳3次元MRIデータと患者背景因子を組み合わせ、アルツハイマー病の脳萎縮部位を特定する新手法の提案も行っている。
データ科学の発展に伴い、「統計科学の応用分野はバイオ統計、材料科学、経済学、認知科学などへ拡張し続けている」と話す荒木教授。「情報科学研究科に籍を置く研究者としては、統計モデルを計算機科学と組み合わせることで新たな解析手法を生み出すなど、統計科学と情報科学との融合を図っていきたいと考えています」。

「AI of AI」プロジェクトを通して、
研究者が直面する研究課題への貢献を。
2024年度、情報科学研究科では「統計科学研究センター」を新たに立ち上げた。越境する学問のきっかけづくりを狙って国内外の研究者を招いての統計科学セミナーを2024年度だけで22回開催、2025年度以降も継続する。さらに、インターンシップ型統計科学プロジェクトを開始するという。この動きの背景にあるのが、従来の手法から最先端の分析手法までを網羅し、研究者の意思決定を支援するAI of AI(AoA)の構想である。AoAは、研究者が直面する課題に応じて、最適なデータ分析手法を自動選択し、結果を解釈するという。その提唱者である荒木教授は、その意義をこう説明する。「それぞれの分野の専門的な見解が融合して初めてAIが成立する、というのが私のAIについての理解です。各分野の深化に加えて複数の分野を組み合わせなければ、新しいことはできないのではないか。そうした問題意識もあって、センターには、数学、計算機科学だけでなく、生命科学、情報通信、ロボティクス、自然言語処理、認知科学、科学哲学、社会科学、メディア論、芸術・デザインなど、多様な分野の研究者に参加いただきました。セミナーなどの開催を通じてシーズ探索を進め、10年後を目途に何らかの形のAoAを実現させたいです」。
測定技術と社会のデジタル化の急激な発展により、分析対象のデータの多様性と不確実性はますます増大している。そこで問われるのが、モデルの「柔軟性」だと荒木教授は考えている。「今手元にあるデータにぴったりフィットさせようとすれば、モデルはより複雑になります。しかし、将来得られるデータに対してもフィット可能なものとするには、過剰な誤差(ばらつき)を取り除いたシンプルなモデルの方が有利です。モデルの複雑さとフィットのよさをどうバランスさせるか、科学のさまざまな分野の進展に対する統計科学としての対応力が問われているのではないでしょうか」。
統計科学の研究を基盤に、「人々が日々心地よく前向きな気持ちで過ごせる世界を実現したい」という荒木教授。「AI時代」を迎えた今、ピアノの鍵盤をコンピュータのキーボードに置き換え、目の前に広がるデータの大海原にどんな調べを奏でてくれるのだろう。