さきがけ
意思決定のための自然言語処理による未来予測
JST さきがけ研究領域「文理融合による人と社会の変革基盤技術の共創」に採択された「意思決定のための自然言語処理による未来予測」の特設ページです。2023年度から2026年度までのプロジェクトです。
概要
本プロジェクトでは下記の研究テーマに取り組んでいます。
近現代の言語変化のモデリング
言語モデルの価値判断やバイアスの分析
言語モデルの社会的受容性の向上
研究業績
論文誌
凌志棟(都立大), 相田太一(都立大), 岡照晃, 小町守. 日本語意味変化検出のための評価データセットの構築と分析. 自然言語処理, Vol.31, No.4, pp. 1487-1522. 2024年12月. (PDF)
国際会議(査読あり)
Taisei Enomoto (TMU), Hwichan Kim (TMU), Zhousi Chen, Mamoru Komachi. A Fair Comparison without Translationese: English vs. Target-language Instructions for Multilingual LLMs. Proceedings of the 2025 Annual Conference of the Nations of the Americas Chapter of the Association for Computational Linguistics (NAACL 2025). April, 2025. (accepted)
Hajime Kiyama (TMU), Taichi Aida (TMU), Mamoru Komachi, Toshinobu Ogiso (NINJAL), Hiroya Takamura (AIST), Daichi Mochihashi (ISM). Analyzing Continuous Semantic Shifts with Diachronic Word Similarity Matrices. The 31st International Conference on Computational Linguistics (COLING 2025). January, 2025. (oral)
Kyotaro Nakajima (TMU), Hwichan Kim (TMU), Tosho Hirasawa (TMU), Taisei Enomoto (TMU), Zhousi Chen, Mamoru Komachi. A Survey for LLM Tuning Methods: Classifying Approaches Based on Model Internal Accessibility. Proceedings of the 38th Pacific Asia Conference on Language, Information and Computation (PACLIC 38). December, 2024. (poster)
Hwichan Kim (TMU), Jun Suzuki (Tohoku University), Tosho Hirasawa (TMU), Mamoru Komachi. Pruning Multilingual Large Language Models for Multilingual Inference. Findings of the 2024 Confernece on Empirical Methods in Natural Language Processing (EMNLP 2024), pp.9921–9942. November, 2024. (PDF)
国際会議(査読なし)
Ayako Sato (TMU), Kyotaro Nakajima (TMU), Hwichan Kim (TMU), Zhousi Chen and Mamoru Komachi. TMU-HIT's Submission for the WMT24 Quality Estimation Shared Task: Is GPT-4 a Good Evaluator for Machine Translation? Ninth Conference on Machine Translation (WMT24), pp. 529-534. November, 2024. (poster, PDF)
Taisei Enomoto (TMU), Hwichan Kim (TMU), Tosho Hirasawa (TMU), Yoshinari Nagai (TMU), Ayako Sato (TMU), Kyotaro Nakajima (TMU) and Mamoru Komachi. TMU-HIT at MLSP 2024: How Well Can GPT-4 Tackle Multilingual Lexical Simplification? Proceedings of the 19th Workshop on Innovative Use of NLP for Building Educational Applications (BEA 2024), pp.590-598. June, 2024. (poster, PDF)
研究会・全国大会
木山朔 (都立大), 相田太一 (都立大), 小町守, 小木曽智信 (国語研), 高村大也 (産総研), 持橋大地 (統数研). 単語の通時的な類似度行列による意味変化パターンの分析. 情報処理学会第262回自然言語処理研究会. 2024年12月12日.(優秀研究賞受賞)
凌志棟, 相田太一, 岡照晃 (都立大), 小町守 (一橋大). 日本語意味変化検出の評価セットの拡張と検出手法の評価. 言語処理学会第30回年次大会. 2024年3月12日. (poster, PDF)
木山朔, 相田太一 (都立大), 小町守 (一橋大), 小木曽智信 (国語研), 高村大也 (産総研), 松井秀俊 (滋賀大), 持橋大地 (統数研). 意味変化分析に向けた単語埋め込みの時系列パターン分析. 言語処理学会第30回年次大会. 2024年3月13日. (oral, PDF)
シンポジウム
榎本 大晟 (都立大), 金 輝燦 (都立大), 陳 宙斯 (一橋大), 小町 守 (一橋大). Multilingual LLM への指示文は本当に英語であるべきなのか?. YANS2024. 2024年9月5日.(奨励賞受賞)
坂部 立 (一橋大), 金 輝燦 (都立大), 小町 守 (一橋大). 人間とLLMが考える"面白い”は一致するのか? YANS2024. 2024年9月6日.(奨励賞受賞)
木山 朔 (都立大), 相田 太一 (都立大), 小町 守 (一橋大), 小木曽 智信 (国語研), 高村 大也 (産総研), 持橋 大地 (統数研). 日本語の単語を対象とした複数時期の意味変化パターン分析. YANS2024. 2024年9月6日.(スポンサー賞=フューチャー株式会社賞受賞)
佐藤 郁子 (都立大), 金 輝燦 (都立大), 陳 宙斯 (一橋大), 三田 雅人 (サイバーエージェント/都立大), 小町 守 (一橋大). テキスト評価におけるLLMアライメント手法の影響分析. YANS2024. 2024年9月6日.
中島 京太郎 (都立大), 金 輝燦 (都立大), 平澤 寅庄 (都立大), 榎本 大晟 (都立大), 小町 守 (一橋大). 言語モデルの透明性ごとに適応な可能なチューニング手法の調査. YANS2024. 2024年9月6日.