一橋大学 SDS
計算言語学研究室
研究室紹介
2023年4月から、一橋大学ソーシャル・データサイエンス研究科に、計算言語学研究室(小町研究室)ができました。言語によるコミュニケーションを可能にする原理や、どのように言語が理解されているのかの探究といった、基礎的・基盤的な研究に挑みます。また、基礎的・基盤的な研究のためのデータセット・ツールキットの構築・開発や評価にも、継続して取り組みます。
2025年4月に博士に入学希望の方は募集要項が公開されたので、出願を検討中の方は募集要項をご覧になってお問い合わせください。
ニュース
2024/11/30 The 31st International Conference on Computational Linguistics (COLING 2025) にて以下の発表をする予定です。
Hajime Kiyama (TMU), Taichi Aida (TMU), Mamoru Komachi, Toshinobu Ogiso (NINJAL), Hiroya Takamura (AIST), Daichi Mochihashi (ISM). Analyzing Continuous Semantic Shifts with Diachronic Word Similarity Matrices. The 31st International Conference on Computational Linguistics (COLING 2025). January, 2025. (accepted)
2024/11/22 38th Pacific Asia Conference on Language, Information and Computation (PACLIC 38) にて以下の2件の発表をする予定です。
Ayako Sato, Tosho Hirasawa, Hwichan Kim, Zhousi Chen, Teruaki Oka, Masato Mita, Mamoru Komachi. DejaVu: Disambiguation evaluation dataset for English-JApanese machine translation on VisUal information. Proceedings of the 38th Pacific Asia Conference on Language, Information and Computation (PACLIC 38). December, 2024. (oral, accepted)
Kyotaro Nakajima, Hwichan Kim, Tosho Hirasawa, Taisei Enomoto, Zhousi Chen, Mamoru Komachi. A Survey for LLM Tuning Methods: Classifying Approaches Based on Model Internal Accessibility. Proceedings of the 38th Pacific Asia Conference on Language, Information and Computation (PACLIC 38). December, 2024. (poster, accepted)
2024/11/23 第55回一橋祭にて小町が「ことばがつなぐソーシャル・データサイエンス」という公開講義をする予定です(対面、参加費無料)。
2024/10/11 第18回材料系ワークショップにて小町が「プログラミング言語と大規模言語モデル」という招待講演をする予定です(対面とオンラインのハイブリッド、参加費無料)。
2024/09/22 自然言語処理のメジャー国際会議である EMNLP 2024 及び EMNLP 2024 と連続開催の WMT 2024 にて下記の研究 を発表予定です。
Hwichan Kim (TMU), Jun Suzuki (Tohoku University), Tosho Hirasawa (TMU), Mamoru Komachi. Pruning Multilingual Large Language Models for Multilingual Inference. Findings of the 2024 Confernece on Empirical Methods in Natural Language Processing (EMNLP 2024). November, 2024. (accepted)
Ayako Sato (TMU), Kyotaro Nakajima (TMU), Hwichan Kim (TMU), Zhousi Chen and Mamoru Komachi. TMU-HIT's Submission for the WMT24 Quality Estimation Shared Task: Is GPT-4 a Good Evaluator for Machine Translation? Ninth Conference on Machine Translation (WMT24). November, 2024. (poster, accepted)
Masamune Kobayashi (TMU), Masato Mita (CyberAgent/TMU), Mamoru Komachi. Revisiting Meta-evaluation for Grammatical Error Correction. Transactions of the Association for Computational Linguistics (TACL), Vol.12, pp.837-855. July 1, 2024.
2024/09/06 第19回 YANS シンポジウムにて、坂部立さんが奨励賞を、大平颯人さんが Turing 株式会社賞をそれぞれ受賞しました。おめでとうございます!
2024/09/05 自然言語処理の若手の会のシンポジウム、第19回 YANS シンポジウムにて以下の発表をします。
榎本 大晟 (都立大), 金 輝燦 (都立大), 陳 宙斯 (一橋大), 小町 守 (一橋大). Multilingual LLM への指示文は本当に英語であるべきなのか?. YANS2024. 2024年9月5日.(奨励賞受賞)
大平 颯人 (一橋大), 平澤 寅庄 (OSX), 小町 守 (一橋大). 大規模視覚言語モデルの潜在的バイアスを利用した幻覚の抑制方法の提案. YANS2024. 2024年9月5日.(Turing 株式会社賞受賞)
坂部 立 (一橋大), 金 輝燦 (都立大), 小町 守 (一橋大). 人間とLLMが考える"面白い”は一致するのか? YANS2024. 2024年9月6日.(奨励賞受賞)
木山 朔 (都立大), 相田 太一 (都立大), 小町 守 (一橋大), 小木曽 智信 (国語研), 高村 大也 (産総研), 持橋 大地 (統数研). 日本語の単語を対象とした複数時期の意味変化パターン分析. YANS2024. 2024年9月6日.(フューチャー株式会社賞受賞)
中島 秀太 (一橋大), 欅 惇志 (一橋大), 渡部 敏明 (一橋大), 小町 守 (一橋大). 掲示板テキストから得られるセンチメントを利用した日経平均株価ボラティリティ予測. YANS2024. 2024年9月6日.
佐藤 郁子 (都立大), 金 輝燦 (都立大), 陳 宙斯 (一橋大), 三田 雅人 (サイバーエージェント/都立大), 小町 守 (一橋大). テキスト評価におけるLLMアライメント手法の影響分析. YANS2024. 2024年9月6日.
中島 京太郎 (都立大), 金 輝燦 (都立大), 平澤 寅庄 (都立大), 榎本 大晟 (都立大), 小町 守 (一橋大). 言語モデルの透明性ごとに適応な可能なチューニング手法の調査. YANS2024. 2024年9月6日.
2024/09/04 自然言語処理の若手の会のシンポジウム、第19回 YANS シンポジウムのハッカソンにて、大平さんの参加チームが YANS 運営委員特別賞を受賞しました! おめでとうございます☆
山口真(静岡大), 岩川光一(東北大), 大平颯人(一橋大), 齋藤大輔(名工大), 斉志揚(電通大), 稲原宗能(PKSHA). ボケもコードも仕込み中. YANS2024ハッカソン. 2024年9月4日.
2024/08/06 日本の自然言語処理に関する学会の言語処理学会の論文誌に以下の2件の論文が採録・掲載されました。
凌志棟(都立大), 相田太一(都立大), 岡照晃, 小町守. 日本語意味変化検出のための評価データセットの構築と分析. 自然言語処理, Vol.31, No.4. 2024年12月掲載予定.
Zizheng Zhang (TMU), Masato Mita (CyberAgent/TMU), Mamoru Komachi. Cloze Quality Estimation for Language Assessment. Journal of Natural Language Processing, Vol.31, No.2, pp.328-348. June, 2024. (PDF)
2024/07/31 自然言語処理に関する国際学会 ACL の論文誌(トランザクション)に以下の論文が掲載されました。今後、国際会議での発表も予定しています。
Masamune Kobayashi (TMU), Masato Mita (CyberAgent/TMU), Mamoru Komachi. Revisiting Meta-evaluation for Grammatical Error Correction. Transactions of the Association for Computational Linguistics (TACL): 12: 837–855. July, 2024. (PDF)
2024/05/24 技術評論社から「自然言語処理の教科書」と題した本を出版しました。
2024/05/01 自然言語処理の言語教育応用に関する国際ワークショップ BEA で以下の発表をします。後者のテキスト平易化に関する国際コンペティションでは、10言語中ほとんどの言語でトップの成績を収めました。
Masamune Kobayashi (TMU), Masato Mita (CyberAgent/TMU), Mamoru Komachi. Large Language Models Are State-of-the-Art Evaluator for Grammatical Error Correction. Proceedings of the 19th Workshop on Innovative Use of NLP for Building Educational Applications (BEA 2024). June, 2024. (short, poster)
Taisei Enomoto (TMU), Hwichan Kim (TMU), Tosho Hirasawa (TMU), Yoshinari Nagai (TMU), Ayako Sato (TMU), Kyotaro Nakajima (TMU) and Mamoru Komachi. TMU-HIT at MLSP 2024: How Well Can GPT-4 Tackle Multilingual Lexical Simplification? Proceedings of the 19th Workshop on Innovative Use of NLP for Building Educational Applications (BEA 2024): Shared task 2. June, 2024. (poster)
2024/04/22 四大学連合のリレートーク "生成AI" の一橋大学×東京工業大学の回で東工大の笹原先生と対談した記事が「生成AIと人の共創--クリエイティビティとフェイクニュース」として掲載されました。また、人と情報テクノロジーの共生のための人工知能の哲学2.0の構築というフロジェクトで2022年に受けたインタビューも公開されています。
2024/04/02 TLG GROUP のサイトに「多言語ゼロショット学習とは?言語処理とデータサイエンスの進化に迫る!」という記事が掲載されました。