一橋大学 SDS

計算言語学研究室

研究室紹介

2023年4月から、一橋大学ソーシャル・データサイエンス研究科に、計算言語学研究室（小町研究室）ができました。言語によるコミュニケーションを可能にする原理や、どのように言語が理解されているのかの探究といった、基礎的・基盤的な研究に挑みます。また、基礎的・基盤的な研究のためのデータセット・ツールキットの構築・開発や評価にも、継続して取り組みます。

2025年4月修士に入学希望（2024年受験希望）の方は出願期間前にお問い合わせください。出願期間後はお問い合わせにお答えすることができないので、ご了承ください。

2024/04/22 四大学連合のリレートーク "生成AI" の一橋大学×東京工業大学の回で東工大の笹原先生と対談した記事が「生成AIと人の共創--クリエイティビティとフェイクニュース」として掲載されました。また、人と情報テクノロジーの共生のための人工知能の哲学2.0の構築というフロジェクトで2022年に受けたインタビューも公開されています。
2024/04/02 TLG GROUP のサイトに「多言語ゼロショット学習とは？言語処理とデータサイエンスの進化に迫る！」という記事が掲載されました。
2023/12/18 一般社団法人日本スポーツ広告協会のサイトに「データサイエンスの魅力や今後の展望」という記事が掲載されました。
2023/09/19 JST さきがけ「文理融合による人と社会の変革基盤技術の共創」領域に「意思決定のための自然言語処理による未来予測」という研究テーマで採択されました。2023年10月から3.5年間、ソーシャルサイエンスと自然言語処理の融合に取り組みます。
2023/09/15 四谷学院の「学部学科がわかる本」にインタビュー「"データサイエンス"は広い世界に飛び出すための鍵」が掲載されました。

2023/08 学部生向けのオープンキャンパスで小町が模擬授業「深層学習による自然言語処理の新展開」を行ないました。下記の YouTube 動画をご覧ください。
2023/08 大学ジャーナルというサイトでソーシャル・データサイエンス学部について解説した記事「一橋大学～ソーシャル・データサイエンス学部が目指すのは、社会科学とデータサイエンス双方を使いこなすゼネラリストの養成」が公開されました。日経BPのムックにも同様の記事が掲載されています。
2023/07 EMIRA というサイトで ChatGPT について解説した記事「なぜ他の対話型AIよりも普及したのか？「自然に対話する」ことに特化したChatGPTの仕組み」が公開されました。EMIRA は東京電力、KADOKAWA、読売新聞の3社が構成する編集委員会が制作しているメディアで、SDGs 的な観点を含めて説明してみました。

ニュース

2024/05/01 自然言語処理の言語教育応用に関する国際ワークショップ BEA で以下の発表をします。後者のテキスト平易化に関する国際コンペティションでは、10言語中ほとんどの言語でトップの成績を収めました。

Masamune Kobayashi (TMU), Masato Mita (CyberAgent/TMU), Mamoru Komachi. Large Language Models Are State-of-the-Art Evaluator for Grammatical Error Correction. Proceedings of the 19th Workshop on Innovative Use of NLP for Building Educational Applications (BEA 2024). June, 2024. (short, poster)
Taisei Enomoto (TMU), Hwichan Kim (TMU), Tosho Hirasawa (TMU), Yoshinari Nagai (TMU), Ayako Sato (TMU), Kyotaro Nakajima (TMU) and Mamoru Komachi. TMU-HIT at MLSP 2024: How Well Can GPT-4 Tackle Multilingual Lexical Simplification? Proceedings of the 19th Workshop on Innovative Use of NLP for Building Educational Applications (BEA 2024): Shared task 2. June, 2024. (poster)

2024/02/21 自然言語処理のメジャー国際会議 LREC-COLING に下記の論文が採択されました。

Naoya Ueda (TMU), Masato Mita (CyberAgent/TMU), Teruaki Oka (TMU), Mamoru Komachi. Token-length Bias in Minimal-pair Paradigm Datasets. The 2024 Joint International Conference on Computational Linguistics, Language Resources and Evaluation (LREC-COLING 2024). May 2024. (long)
Yoshinari Nagai (TMU), Teruaki Oka (TMU), Mamoru Komachi. A Document-Level Text Simplification Dataset for Japanese. The 2024 Joint International Conference on Computational Linguistics, Language Resources and Evaluation (LREC-COLING 2024). May 2024. (long)

O2024/02/07 言語処理学会第29回年次大会にて、下記の発表を予定しています。

○◊Zizheng Zhang (都立大), Masato Mita (サイバーエージェント), Mamoru Komachi (一橋大). A Task of Cloze Explanation Generation for ESL Learning. 言語処理学会第29回年次大会. 2024年3月12日.
○凌志棟, 相田太一, 岡照晃 (都立大), 小町守 (一橋大). 日本語意味変化検出の評価セットの拡張と検出手法の評価. 言語処理学会第29回年次大会. 2024年3月12日.
○小林正宗 (都立大), 三田雅人 (サイバーエージェント), 小町守 (一橋大). 文法誤り訂正の包括的メタ評価: 既存自動評価の限界と大規模言語モデルの可能性. 言語処理学会第29回年次大会. 2024年3月12日.
○佐藤郁子, 平澤寅庄, 金輝燦, 岡照晃 (都立大), 小町守 (一橋大). 語義曖昧性解消に着目した英日マルチモーダル機械翻訳の評価セット構築と分析. 言語処理学会第29回年次大会. 2024年3月13日.
○木山朔, 相田太一 (都立大), 小町守 (一橋大), 小木曽智信 (国語研), 高村大也 (産総研), 松井秀俊 (滋賀大), 持橋大地 (統数研). 意味変化分析に向けた単語埋め込みの時系列パターン分析. 言語処理学会第29回年次大会. 2024年3月13日.
○上田直生也 (都立大), 三田雅人 (サイバーエージェント/都立大), 小町守 (一橋大). Minimal-pair Paradigmデータセットにおけるトークン長バイアスの分析と改善. 言語処理学会第29回年次大会. 2024年3月14日.
○大平颯人 (東北大), 金輝燦 (都立大), 小町守 (一橋大). 多言語ゼロショット学習における推論言語に関する分析. 言語処理学会第29回年次大会. 2024年3月14日.

2023/12 人工知能のトップカンファレンス AAAI に下記の論文が採択されました。

Kenichiro Ando (RIKEN AIP), Mamoru Komachi, Satoshi Sekine (RIKEN AIP). WikiSQE: A Large-Scale Dataset for Sentence Quality Estimation in Wikipedia. 38th AAAI Conference on Artificial Intelligence. February 2024.