研究テーマ

計算言語学

コンピュータを用いて言語の意味がどのように理解されるか、ということを明らかにする研究に取り組んでいます。

言語資源構築

自然言語処理や言語学・国語学、言語教育・言語学習などのための言語資源(ツール、コーパス、辞書)構築に取り組んでいます。

言語生成と評価

大規模言語モデルなどを用いた言語理解・言語生成とその評価に関する研究に取り組んでいます。

研究プロジェクト

2024年現在、以下のような研究プロジェクトに取り組んでいます。

JST さきがけ「意思決定のための自然言語処理による未来予測」

JST さきがけ「文理融合による人と社会の変革基盤技術の共創」領域で、自然言語処理と社会科学の交差点を目指して大規模言語モデルで社会科学がどう変わるかの研究に取り組んでいます。(2027年3月まで)

科研費基盤 B 「深層学習による言語生成の評価データセットの構築と品質推定」

一橋・NAIST・愛媛大のグループで、言語生成の評価データセットの構築や品質推定手法の研究に取り組んでいます。言語処理学会年次大会でテーマセッションの提案をしたりしつつ、国内の研究コミュニティを形成していこう、と考えています。(2025年3月まで)

Google Gemma Academic Program "Leveraging Multilingual LLMs to Enhance Cross-Cultural Creativity and Understanding"

Google の Gemma を含む大規模言語モデルを用いて多言語・多文化理解を推進するような手法の研究に取り組んでいます。(2025年末まで)

NICT 委託研究「マルチモーダル情報理解と制御可能なテキスト生成の研究開発」

東工大岡崎研究室が代表となっているマルチモーダルな言語生成のプロジェクトについて、分担として日本語のテキスト平易化タスクのデータセット作成と手法の研究に取り組んでいます。作成したデータセットを使った共通タスクの開催を検討しています。(2026年3月まで)

科研費基盤 A「多様性尊重の深化に伴う科学的分類の再検討と再構築」

一橋の寺尾先生が代表となって、様々な研究グループが一緒になって言語や人種・生物などの科学的分類の再構築を行う、というプロジェクトで、言語を中心とした多言語モデルによる分類についての検討を行う予定です。(2027年3月まで)