一橋大学 SDS
計算言語学研究室
研究室紹介
2023年4月から、一橋大学ソーシャル・データサイエンス研究科に、計算言語学研究室(小町研究室)ができました。言語によるコミュニケーションを可能にする原理や、どのように言語が理解されているのかの探究といった、基礎的・基盤的な研究に挑みます。また、基礎的・基盤的な研究のためのデータセット・ツールキットの構築・開発や評価にも、継続して取り組みます。
2025年4月修士に入学希望(2024年受験希望)の方は出願期間前にお問い合わせください。出願期間後はお問い合わせにお答えすることができないので、ご了承ください。2025年4月に博士に入学希望の方は9月以降に募集要項が公開されますので、出願を検討中の方は募集要項をご覧になってお問い合わせください。
ニュース
2024/09/06 第19回 YANS シンポジウムにて、坂部立さんが奨励賞を、大平颯人さんが Turing 株式会社賞をそれぞれ受賞しました。おめでとうございます!
2024/09/05 自然言語処理の若手の会のシンポジウム、第19回 YANS シンポジウムにて以下の発表をします。
榎本 大晟 (都立大), 金 輝燦 (都立大), 陳 宙斯 (一橋大), 小町 守 (一橋大). Multilingual LLM への指示文は本当に英語であるべきなのか?. YANS2024. 2024年9月5日.(奨励賞受賞)
大平 颯人 (一橋大), 平澤 寅庄 (OSX), 小町 守 (一橋大). 大規模視覚言語モデルの潜在的バイアスを利用した幻覚の抑制方法の提案. YANS2024. 2024年9月5日.(Turing 株式会社賞受賞)
坂部 立 (一橋大), 金 輝燦 (都立大), 小町 守 (一橋大). 人間とLLMが考える"面白い”は一致するのか? YANS2024. 2024年9月6日.(奨励賞受賞)
木山 朔 (都立大), 相田 太一 (都立大), 小町 守 (一橋大), 小木曽 智信 (国語研), 高村 大也 (産総研), 持橋 大地 (統数研). 日本語の単語を対象とした複数時期の意味変化パターン分析. YANS2024. 2024年9月6日.(フューチャー株式会社賞受賞)
中島 秀太 (一橋大), 欅 惇志 (一橋大), 渡部 敏明 (一橋大), 小町 守 (一橋大). 掲示板テキストから得られるセンチメントを利用した日経平均株価ボラティリティ予測. YANS2024. 2024年9月6日.
佐藤 郁子 (都立大), 金 輝燦 (都立大), 陳 宙斯 (一橋大), 三田 雅人 (サイバーエージェント/都立大), 小町 守 (一橋大). テキスト評価におけるLLMアライメント手法の影響分析. YANS2024. 2024年9月6日.
中島 京太郎 (都立大), 金 輝燦 (都立大), 平澤 寅庄 (都立大), 榎本 大晟 (都立大), 小町 守 (一橋大). 言語モデルの透明性ごとに適応な可能なチューニング手法の調査. YANS2024. 2024年9月6日.
2024/09/04 自然言語処理の若手の会のシンポジウム、第19回 YANS シンポジウムのハッカソンにて、大平さんの参加チームが YANS 運営委員特別賞を受賞しました! おめでとうございます☆
山口真(静岡大), 岩川光一(東北大), 大平颯人(一橋大), 齋藤大輔(名工大), 斉志揚(電通大), 稲原宗能(PKSHA). ボケもコードも仕込み中. YANS2024ハッカソン. 2024年9月4日.
2024/08/06 日本の自然言語処理に関する学会の言語処理学会の論文誌に以下の2件の論文が採録・掲載されました。
凌志棟(都立大), 相田太一(都立大), 岡照晃, 小町守. 日本語意味変化検出のための評価データセットの構築と分析. 自然言語処理, Vol.31, No.4. 2024年12月掲載予定.
Zizheng Zhang (TMU), Masato Mita (CyberAgent/TMU), Mamoru Komachi. Cloze Quality Estimation for Language Assessment. Journal of Natural Language Processing, Vol.31, No.2, pp.328-348. June, 2024. (PDF)
2024/07/31 自然言語処理に関する国際学会 ACL の論文誌(トランザクション)に以下の論文が掲載されました。今後、国際会議での発表も予定しています。
Masamune Kobayashi (TMU), Masato Mita (CyberAgent/TMU), Mamoru Komachi. Revisiting Meta-evaluation for Grammatical Error Correction. Transactions of the Association for Computational Linguistics (TACL): 12: 837–855. July, 2024. (PDF)
2024/05/24 技術評論社から「自然言語処理の教科書」と題した本を出版しました。
2024/05/01 自然言語処理の言語教育応用に関する国際ワークショップ BEA で以下の発表をします。後者のテキスト平易化に関する国際コンペティションでは、10言語中ほとんどの言語でトップの成績を収めました。
Masamune Kobayashi (TMU), Masato Mita (CyberAgent/TMU), Mamoru Komachi. Large Language Models Are State-of-the-Art Evaluator for Grammatical Error Correction. Proceedings of the 19th Workshop on Innovative Use of NLP for Building Educational Applications (BEA 2024). June, 2024. (short, poster)
Taisei Enomoto (TMU), Hwichan Kim (TMU), Tosho Hirasawa (TMU), Yoshinari Nagai (TMU), Ayako Sato (TMU), Kyotaro Nakajima (TMU) and Mamoru Komachi. TMU-HIT at MLSP 2024: How Well Can GPT-4 Tackle Multilingual Lexical Simplification? Proceedings of the 19th Workshop on Innovative Use of NLP for Building Educational Applications (BEA 2024): Shared task 2. June, 2024. (poster)
2024/04/22 四大学連合のリレートーク "生成AI" の一橋大学×東京工業大学の回で東工大の笹原先生と対談した記事が「生成AIと人の共創--クリエイティビティとフェイクニュース」として掲載されました。また、人と情報テクノロジーの共生のための人工知能の哲学2.0の構築というフロジェクトで2022年に受けたインタビューも公開されています。
2024/04/02 TLG GROUP のサイトに「多言語ゼロショット学習とは?言語処理とデータサイエンスの進化に迫る!」という記事が掲載されました。
2024/02/21 自然言語処理のメジャー国際会議 LREC-COLING に下記の論文が採択されました。
Naoya Ueda (TMU), Masato Mita (CyberAgent/TMU), Teruaki Oka (TMU), Mamoru Komachi. Token-length Bias in Minimal-pair Paradigm Datasets. The 2024 Joint International Conference on Computational Linguistics, Language Resources and Evaluation (LREC-COLING 2024). May 2024. (long)
Yoshinari Nagai (TMU), Teruaki Oka (TMU), Mamoru Komachi. A Document-Level Text Simplification Dataset for Japanese. The 2024 Joint International Conference on Computational Linguistics, Language Resources and Evaluation (LREC-COLING 2024). May 2024. (long)
2024/02/07 言語処理学会第29回年次大会にて、下記の発表を予定しています。
○◊Zizheng Zhang (都立大), Masato Mita (サイバーエージェント), Mamoru Komachi (一橋大). A Task of Cloze Explanation Generation for ESL Learning. 言語処理学会第29回年次大会. 2024年3月12日.
○凌志棟, 相田太一, 岡照晃 (都立大), 小町守 (一橋大). 日本語意味変化検出の評価セットの拡張と検出手法の評価. 言語処理学会第29回年次大会. 2024年3月12日.
○小林正宗 (都立大), 三田雅人 (サイバーエージェント), 小町守 (一橋大). 文法誤り訂正の包括的メタ評価: 既存自動評価の限界と大規模言語モデルの可能性. 言語処理学会第29回年次大会. 2024年3月12日.
○佐藤郁子, 平澤寅庄, 金輝燦, 岡照晃 (都立大), 小町守 (一橋大). 語義曖昧性解消に着目した英日マルチモーダル機械翻訳の評価セット構築と分析. 言語処理学会第29回年次大会. 2024年3月13日.
○木山朔, 相田太一 (都立大), 小町守 (一橋大), 小木曽智信 (国語研), 高村大也 (産総研), 松井秀俊 (滋賀大), 持橋大地 (統数研). 意味変化分析に向けた単語埋め込みの時系列パターン分析. 言語処理学会第29回年次大会. 2024年3月13日.
○上田直生也 (都立大), 三田雅人 (サイバーエージェント/都立大), 小町守 (一橋大). Minimal-pair Paradigmデータセットにおけるトークン長バイアスの分析と改善. 言語処理学会第29回年次大会. 2024年3月14日.
○大平颯人 (東北大), 金輝燦 (都立大), 小町守 (一橋大). 多言語ゼロショット学習における推論言語に関する分析. 言語処理学会第29回年次大会. 2024年3月14日.
2023/12 人工知能のトップカンファレンス AAAI に下記の論文が採択されました。
Kenichiro Ando (RIKEN AIP), Mamoru Komachi, Satoshi Sekine (RIKEN AIP). WikiSQE: A Large-Scale Dataset for Sentence Quality Estimation in Wikipedia. 38th AAAI Conference on Artificial Intelligence. February 2024.
2023/12/18 一般社団法人日本スポーツ広告協会のサイトに「データサイエンスの魅力や今後の展望」という記事が掲載されました。
2023/09/19 JST さきがけ「文理融合による人と社会の変革基盤技術の共創」領域に「意思決定のための自然言語処理による未来予測」という研究テーマで採択されました。2023年10月から3.5年間、ソーシャルサイエンスと自然言語処理の融合に取り組みます。
2023/09/15 四谷学院の「学部学科がわかる本」にインタビュー「"データサイエンス"は広い世界に飛び出すための鍵」が掲載されました。
2023/08 学部生向けのオープンキャンパスで小町が模擬授業「深層学習による自然言語処理の新展開」を行ないました。下記の YouTube 動画をご覧ください。
2023/08 大学ジャーナルというサイトでソーシャル・データサイエンス学部について解説した記事「一橋大学~ソーシャル・データサイエンス学部が目指すのは、社会科学とデータサイエンス双方を使いこなすゼネラリストの養成」が公開されました。日経BPのムックにも同様の記事が掲載されています。
2023/07 EMIRA というサイトで ChatGPT について解説した記事「なぜ他の対話型AIよりも普及したのか? 「自然に対話する」ことに特化したChatGPTの仕組み」が公開されました。EMIRA は東京電力、KADOKAWA、読売新聞の3社が構成する編集委員会が制作しているメディアで、SDGs 的な観点を含めて説明してみました。