一橋大学

社会計算言語学研究室

研究室紹介

データに基づき、言語が社会に与える影響、そして社会が言語に与える影響を分析する研究をメインテーマに据え、言語によるコミュニケーションを可能にする原理や、どのように言語が理解されているのかの探究といった、基礎的・基盤的な研究に挑みます。また、言語処理に関するデータセット・ツールキットの構築・開発や評価にも継続的に取り組みます。

ニュース

2025/03/18 AIリーダーズ会議2025 Spring に小町がパネリストとして登壇予定です（オンライン・対面、参加費無料）。

2025/03/13 言語処理学会第31回年次大会で下記の発表が博報堂DYホールディングス賞を受賞しました！

坂部立 (一橋大), 金輝燦 (都立大), 小町守 (一橋大). 人間と LLM の "面白さ" の感性は一致するのか？言語処理学会第31回年次大会.

2025/02/26 言語処理学会第31回年次大会で下記の発表を予定しています。

相田太一 (都立大), 小町守 (一橋大), 小木曽智信 (国語研), 高村大也 (産総研), 持橋大地 (統数研/国語研). ガウス過程による埋め込み点集合の時間遷移のモデル化. 言語処理学会第31回年次大会.
中島京太郎, 金輝燦, 平澤寅庄, 榎本大晟 (都立大), 陳宙斯, 小町守 (一橋大). 大規模言語モデルに対するチューニング手法の調査：内部のアクセス性に基づく分類と比較.言語処理学会第31回年次大会.
佐藤祥太 (金沢大), 木山朔 (都立大), 中島秀太, 小町守 (一橋大), 唐堂由其 (金沢大). 単語埋め込みの独立成分分析の軸が解釈できる粒度はどれくらいか？言語処理学会第31回年次大会.
佐藤郁子, 金輝燦 (都立大), 陳宙斯 (一橋大), 三田雅人 (サイバーエージェント/都立大), 小町守 (一橋大). アライメントが大規模言語モデルの数値バイアスに与える影響. 言語処理学会第31回年次大会.
坂部立 (一橋大), 金輝燦 (都立大), 小町守 (一橋大). 人間と LLM の "面白さ" の感性は一致するのか？言語処理学会第31回年次大会.
榎本大晟, 金輝燦 (都立大), 陳宙斯, 小町守 (一橋大). 多言語大規模言語モデルにおける英語指示文と対象言語指示文の公平な比較. 言語処理学会第31回年次大会.
大平颯人 (一橋大), 佐藤郁子 (都立大), 真鍋章, 谷本恒野, 原慎大 (富士電機), 小町守 (一橋大). 論文を対象とした RAG システムにおける質問分類に基づく動的検索. 言語処理学会第31回年次大会.

2025/02/05 第16回産業日本語研究会・シンポジウムにて「大規模言語モデルの知らない世界」というタイトルで小町が招待講演を行います。（オンライン、参加費無料）

2025/01/23 2025 Annual Conference of the Nations of the Americas Chapter of the Association for Computational Linguistics (NAACL 2025) に下記の研究が採択されました！

Taisei Enomoto (TMU), Hwichan Kim (TMU), Zhousi Chen, Mamoru Komachi. A Fair Comparison without Translationese: English vs. Target-language Instructions for Multilingual LLMs. Proceedings of the 2025 Annual Conference of the Nations of the Americas Chapter of the Association for Computational Linguistics (NAACL 2025). April, 2025. (accepted)

2024/12/16 情報処理学会第262回自然言語処理研究会で優秀研究賞を受賞しました！

木山朔 (都立大), 相田太一 (都立大), 小町守, 小木曽智信 (国語研), 高村大也 (産総研), 持橋大地 (統数研). 単語の通時的な類似度行列による意味変化パターンの分析. 情報処理学会第262回自然言語処理研究会. 2024年12月12日.

2024/11/30 The 31st International Conference on Computational Linguistics (COLING 2025) にて以下の発表をする予定です。

Hajime Kiyama (TMU), Taichi Aida (TMU), Mamoru Komachi, Toshinobu Ogiso (NINJAL), Hiroya Takamura (AIST), Daichi Mochihashi (ISM). Analyzing Continuous Semantic Shifts with Diachronic Word Similarity Matrices. The 31st International Conference on Computational Linguistics (COLING 2025). January, 2025. (oral)

2024/11/22 38th Pacific Asia Conference on Language, Information and Computation (PACLIC 38) にて以下の2件の発表をする予定です。

Ayako Sato, Tosho Hirasawa, Hwichan Kim, Zhousi Chen, Teruaki Oka, Masato Mita, Mamoru Komachi. DejaVu: Disambiguation evaluation dataset for English-JApanese machine translation on VisUal information. Proceedings of the 38th Pacific Asia Conference on Language, Information and Computation (PACLIC 38). December, 2024. (oral)
Kyotaro Nakajima, Hwichan Kim, Tosho Hirasawa, Taisei Enomoto, Zhousi Chen, Mamoru Komachi. A Survey for LLM Tuning Methods: Classifying Approaches Based on Model Internal Accessibility. Proceedings of the 38th Pacific Asia Conference on Language, Information and Computation (PACLIC 38). December, 2024. (poster)

2024/11/23 第55回一橋祭にて小町が「ことばがつなぐソーシャル・データサイエンス」という公開講義をする予定です（対面、参加費無料）。

2024/10/11 第18回材料系ワークショップにて小町が「プログラミング言語と大規模言語モデル」という招待講演をする予定です（対面とオンラインのハイブリッド、参加費無料）。

2024/09/22 自然言語処理のメジャー国際会議である EMNLP 2024 及び EMNLP 2024 と連続開催の WMT 2024 にて下記の研究を発表予定です。

Hwichan Kim (TMU), Jun Suzuki (Tohoku University), Tosho Hirasawa (TMU), Mamoru Komachi. Pruning Multilingual Large Language Models for Multilingual Inference. Findings of the 2024 Confernece on Empirical Methods in Natural Language Processing (EMNLP 2024). November, 2024. (accepted)
Ayako Sato (TMU), Kyotaro Nakajima (TMU), Hwichan Kim (TMU), Zhousi Chen and Mamoru Komachi. TMU-HIT's Submission for the WMT24 Quality Estimation Shared Task: Is GPT-4 a Good Evaluator for Machine Translation? Ninth Conference on Machine Translation (WMT24). November, 2024. (poster, accepted)
Masamune Kobayashi (TMU), Masato Mita (CyberAgent/TMU), Mamoru Komachi. Revisiting Meta-evaluation for Grammatical Error Correction. Transactions of the Association for Computational Linguistics (TACL), Vol.12, pp.837-855. July 1, 2024.

2024/09/06 第19回 YANS シンポジウムにて、坂部立さんが奨励賞を、大平颯人さんが Turing 株式会社賞をそれぞれ受賞しました。おめでとうございます！

2024/09/05 自然言語処理の若手の会のシンポジウム、第19回 YANS シンポジウムにて以下の発表をします。

榎本大晟 (都立大), 金輝燦 (都立大), 陳宙斯 (一橋大), 小町守 (一橋大). Multilingual LLM への指示文は本当に英語であるべきなのか？. YANS2024. 2024年9月5日.（奨励賞受賞）
大平颯人 (一橋大), 平澤寅庄 (OSX), 小町守 (一橋大). 大規模視覚言語モデルの潜在的バイアスを利用した幻覚の抑制方法の提案. YANS2024. 2024年9月5日.（Turing 株式会社賞受賞）
坂部立 (一橋大), 金輝燦 (都立大), 小町守 (一橋大). 人間とLLMが考える"面白い”は一致するのか？ YANS2024. 2024年9月6日.（奨励賞受賞）
木山朔 (都立大), 相田太一 (都立大), 小町守 (一橋大), 小木曽智信 (国語研), 高村大也 (産総研), 持橋大地 (統数研). 日本語の単語を対象とした複数時期の意味変化パターン分析. YANS2024. 2024年9月6日.（フューチャー株式会社賞受賞）
中島秀太 (一橋大), 欅惇志 (一橋大), 渡部敏明 (一橋大), 小町守 (一橋大). 掲示板テキストから得られるセンチメントを利用した日経平均株価ボラティリティ予測. YANS2024. 2024年9月6日.
佐藤郁子 (都立大), 金輝燦 (都立大), 陳宙斯 (一橋大), 三田雅人 (サイバーエージェント/都立大), 小町守 (一橋大). テキスト評価におけるLLMアライメント手法の影響分析. YANS2024. 2024年9月6日.
中島京太郎 (都立大), 金輝燦 (都立大), 平澤寅庄 (都立大), 榎本大晟 (都立大), 小町守 (一橋大). 言語モデルの透明性ごとに適応な可能なチューニング手法の調査. YANS2024. 2024年9月6日.

2024/09/04 自然言語処理の若手の会のシンポジウム、第19回 YANS シンポジウムのハッカソンにて、大平さんの参加チームが YANS 運営委員特別賞を受賞しました！おめでとうございます☆

山口真（静岡大）, 岩川光一（東北大）, 大平颯人（一橋大）, 齋藤大輔（名工大）, 斉志揚（電通大）, 稲原宗能（PKSHA）. ボケもコードも仕込み中. YANS2024ハッカソン. 2024年9月4日.

2024/08/06 日本の自然言語処理に関する学会の言語処理学会の論文誌に以下の2件の論文が採録・掲載されました。

凌志棟（都立大）, 相田太一（都立大）, 岡照晃, 小町守. 日本語意味変化検出のための評価データセットの構築と分析. 自然言語処理, Vol.31, No.4. 2024年12月掲載予定.
Zizheng Zhang (TMU), Masato Mita (CyberAgent/TMU), Mamoru Komachi. Cloze Quality Estimation for Language Assessment. Journal of Natural Language Processing, Vol.31, No.2, pp.328-348. June, 2024. (PDF)

2024/07/31 自然言語処理に関する国際学会 ACL の論文誌（トランザクション）に以下の論文が掲載されました。今後、国際会議での発表も予定しています。

Masamune Kobayashi (TMU), Masato Mita (CyberAgent/TMU), Mamoru Komachi. Revisiting Meta-evaluation for Grammatical Error Correction. Transactions of the Association for Computational Linguistics (TACL): 12: 837–855. July, 2024. (PDF)

2024/05/24 技術評論社から「自然言語処理の教科書」と題した本を出版しました。

2024/05/01 自然言語処理の言語教育応用に関する国際ワークショップ BEA で以下の発表をします。後者のテキスト平易化に関する国際コンペティションでは、10言語中ほとんどの言語でトップの成績を収めました。

Masamune Kobayashi (TMU), Masato Mita (CyberAgent/TMU), Mamoru Komachi. Large Language Models Are State-of-the-Art Evaluator for Grammatical Error Correction. Proceedings of the 19th Workshop on Innovative Use of NLP for Building Educational Applications (BEA 2024). June, 2024. (short, poster)
Taisei Enomoto (TMU), Hwichan Kim (TMU), Tosho Hirasawa (TMU), Yoshinari Nagai (TMU), Ayako Sato (TMU), Kyotaro Nakajima (TMU) and Mamoru Komachi. TMU-HIT at MLSP 2024: How Well Can GPT-4 Tackle Multilingual Lexical Simplification? Proceedings of the 19th Workshop on Innovative Use of NLP for Building Educational Applications (BEA 2024): Shared task 2. June, 2024. (poster)

2024/04/22 四大学連合のリレートーク "生成AI" の一橋大学×東京工業大学の回で東工大の笹原先生と対談した記事が「生成AIと人の共創--クリエイティビティとフェイクニュース」として掲載されました。また、人と情報テクノロジーの共生のための人工知能の哲学2.0の構築というフロジェクトで2022年に受けたインタビューも公開されています。

2024/04/02 TLG GROUP のサイトに「多言語ゼロショット学習とは？言語処理とデータサイエンスの進化に迫る！」という記事が掲載されました。