研究成果
2024年度
論文誌(査読あり)
凌志棟(都立大), 相田太一(都立大), 岡照晃, 小町守. 日本語意味変化検出のための評価データセットの構築と分析. 自然言語処理, Vol.31, No.4. 2024年12月掲載予定.
Hongfei Wang (TMU), Zhousi Chen, Zizheng Zhang (TMU), Zhidong Ling (TMU), Xiaomeng Pan (TMU), Wenjie Duan (TMU), Masato Mita (CyberAgent/TMU), Mamoru Komachi. Revisiting the Evaluation for Chinese Grammatical Error Correction. Journal of Advanced Computational Intelligence and Intelligent Informatics, Vol.28, No.6, pp.1380-1390. November, 2024. (PDF)
Siti Oryza Khairunnisa (TMU), Zhousi Chen, Mamoru Komachi. Improving Domain-Specific NER in the Indonesian Language through Domain Transfer and Data Augmentation. Journal of Advanced Computational Intelligence and Intelligent Informatics, Vol.28, No.6, pp.1299-1312. November, 2024. (PDF)
Masamune Kobayashi (TMU), Masato Mita (CyberAgent/TMU), Mamoru Komachi. Revisiting Meta-evaluation for Grammatical Error Correction. Transactions of the Association for Computational Linguistics (TACL): 12: 837–855. July, 2024. (PDF)
Zizheng Zhang (TMU), Masato Mita (CyberAgent/TMU), Mamoru Komachi. Cloze Quality Estimation for Language Assessment. Journal of Natural Language Processing, Vol.31, No.2, pp.328-348. June, 2024. (PDF)
国際会議(査読あり、予稿あり)
Hajime Kiyama (TMU), Taichi Aida (TMU), Mamoru Komachi, Toshinobu Ogiso (NINJAL), Hiroya Takamura (AIST), Daichi Mochihashi (ISM). Analyzing Continuous Semantic Shifts with Diachronic Word Similarity Matrices. The 31st International Conference on Computational Linguistics (COLING 2025). January, 2025. (accepted)
Ayako Sato (TMU), Tosho Hirasawa (TMU), Hwichan Kim (TMU), Zhousi Chen, Teruaki Oka, Masato Mita (CyberAgent/TMU), Mamoru Komachi. DejaVu: Disambiguation evaluation dataset for English-JApanese machine translation on VisUal information. Proceedings of the 38th Pacific Asia Conference on Language, Information and Computation (PACLIC 38). December, 2024. (oral, accepted)
Kyotaro Nakajima (TMU), Hwichan Kim (TMU), Tosho Hirasawa (TMU), Taisei Enomoto (TMU), Zhousi Chen, Mamoru Komachi. A Survey for LLM Tuning Methods: Classifying Approaches Based on Model Internal Accessibility. Proceedings of the 38th Pacific Asia Conference on Language, Information and Computation (PACLIC 38). December, 2024. (poster, accepted)
Hwichan Kim (TMU), Jun Suzuki (Tohoku University), Tosho Hirasawa (TMU), Mamoru Komachi. Pruning Multilingual Large Language Models for Multilingual Inference. Findings of the 2024 Confernece on Empirical Methods in Natural Language Processing (EMNLP 2024), pp.9921–9942. November, 2024. (PDF)
Masamune Kobayashi (TMU), Masato Mita (CyberAgent/TMU), Mamoru Komachi. Large Language Models Are State-of-the-Art Evaluator for Grammatical Error Correction. Proceedings of the 19th Workshop on Innovative Use of NLP for Building Educational Applications (BEA 2024), pp.68-77. June, 2024. (poster, PDF)
Naoya Ueda (TMU), Masato Mita (CyberAgent/TMU), Teruaki Oka, Mamoru Komachi. Token-length Bias in Minimal-pair Paradigm Datasets. Proceedings of the 2024 Joint International Conference on Computational Linguistics, Language Resources and Evaluation (LREC-COLING 2024), pp.16224–16236. May, 2024. (poster, PDF)
Yoshinari Nagai (TMU), Teruaki Oka, Mamoru Komachi. A Document-Level Text Simplification Dataset for Japanese. Proceedings of the 2024 Joint International Conference on Computational Linguistics, Language Resources and Evaluation (LREC-COLING 2024), pp.459–476. May, 2024. (poster, PDF)
国際会議(査読なし、予稿あり)
Ayako Sato (TMU), Kyotaro Nakajima (TMU), Hwichan Kim (TMU), Zhousi Chen and Mamoru Komachi. TMU-HIT's Submission for the WMT24 Quality Estimation Shared Task: Is GPT-4 a Good Evaluator for Machine Translation? Ninth Conference on Machine Translation (WMT24), pp. 529-534. November, 2024. (poster, PDF)
Taisei Enomoto (TMU), Hwichan Kim (TMU), Tosho Hirasawa (TMU), Yoshinari Nagai (TMU), Ayako Sato (TMU), Kyotaro Nakajima (TMU) and Mamoru Komachi. TMU-HIT at MLSP 2024: How Well Can GPT-4 Tackle Multilingual Lexical Simplification? Proceedings of the 19th Workshop on Innovative Use of NLP for Building Educational Applications (BEA 2024), pp.590-598. June, 2024. (poster, PDF)
研究会・全国大会(査読なし、予稿あり)
シンポジウム(査読なし、予稿なし)
榎本 大晟 (都立大), 金 輝燦 (都立大), 陳 宙斯 (一橋大), 小町 守 (一橋大). Multilingual LLM への指示文は本当に英語であるべきなのか?. YANS2024. 2024年9月5日.(奨励賞受賞)
大平 颯人 (一橋大), 平澤 寅庄 (OSX), 小町 守 (一橋大). 大規模視覚言語モデルの潜在的バイアスを利用した幻覚の抑制方法の提案. YANS2024. 2024年9月5日.(スポンサー賞=Turing 株式会社賞受賞)
坂部 立 (一橋大), 金 輝燦 (都立大), 小町 守 (一橋大). 人間とLLMが考える"面白い”は一致するのか? YANS2024. 2024年9月6日.(奨励賞受賞)
木山 朔 (都立大), 相田 太一 (都立大), 小町 守 (一橋大), 小木曽 智信 (国語研), 高村 大也 (産総研), 持橋 大地 (統数研). 日本語の単語を対象とした複数時期の意味変化パターン分析. YANS2024. 2024年9月6日.(スポンサー賞=フューチャー株式会社賞受賞)
中島 秀太 (一橋大), 欅 惇志 (一橋大), 渡部 敏明 (一橋大), 小町 守 (一橋大). 掲示板テキストから得られるセンチメントを利用した日経平均株価ボラティリティ予測. YANS2024. 2024年9月6日.
佐藤 郁子 (都立大), 金 輝燦 (都立大), 陳 宙斯 (一橋大), 三田 雅人 (サイバーエージェント/都立大), 小町 守 (一橋大). テキスト評価におけるLLMアライメント手法の影響分析. YANS2024. 2024年9月6日.
中島 京太郎 (都立大), 金 輝燦 (都立大), 平澤 寅庄 (都立大), 榎本 大晟 (都立大), 小町 守 (一橋大). 言語モデルの透明性ごとに適応な可能なチューニング手法の調査. YANS2024. 2024年9月6日.
書籍
小町守. 自然言語処理の教科書. 技術評論社. 2024年5月24日.
雑誌記事・辞典項目等
2023年度
論文誌(査読あり)
Keigo Takahashi (TMU), Teruaki Oka, Mamoru Komachi. A Comparative Study of Relation Classification Approaches for Japanese Discourse Relation Analysis. Journal of Advanced Computational Intelligence and Intelligent Informatics, Vol.28, No.2, pp.239-254. March 20, 2024. (PDF)
Hwichan Kim (TMU), Tosho Hirasawa (TMU), Sangwhan Moon (Tokyo Institute of Technology), Naoaki Okazaki (Tokyo Institute of Technology), Mamoru Komachi (TMU). North Korean Neural Machine Translation through South Korean Resources. ACM Transactions on Asian and Low-Resource Language Information Processing (TALLIP), Vol.22, No.9, 22 pages. September, 2023. (PDF)
Siti Oryza Khairunnisa (TMU), Zhousi Chen (TMU) and Mamoru Komachi (TMU). Dataset Enhancement and Multilingual Transfer for Named Entity Recognition in the Indonesian Language. ACM Transactions on Asian and Low-Resource Language Information Processing (TALLIP), Vol.22, No.6, 21 pages. June, 2023. (PDF)
相田太一(都立大), 小町守(都立大), 小木曽智信(国語研), 高村大也(産総研), 持橋大地(統数研). 異なる時期での意味の違いを捉える単語分散表現の結合学習. 自然言語処理, Vol.30, No.2, pp.275-303. 2023年6月. (PDF)
小山碧海(都立大), 喜友名朝視顕(都立大), 小林賢治(都立大), 新井美桜(都立大), 三田雅人(都立大/CyberAgent), 岡照晃(都立大), 小町守(都立大). 日本語文法誤り訂正のための誤用タグ付き評価コーパスの構築. 自然言語処理, Vol.30, No.2, pp.330-371. 2023年6月. (PDF)
小林千真(都立大), 相田太一(都立大), 岡照晃(都立大), 小町守(都立大). BERT を用いた日本語の意味変化の分析. 自然言語処理, Vol.30, No.2, pp.713-747. 2023年6月. (PDF)
Keigo Takahashi (TMU), Teruaki Oka (TMU), Mamoru Komachi (TMU). Effectiveness of pre-trained language models for the Japanese Winograd Schema Challenge. Journal of Advanced Computational Intelligence and Intelligent Informatics, Vol. 27, No.3, pp.511-521. May 2023. (PDF)
国際会議(査読あり、予稿あり)
Kenichiro Ando (RIKEN), Mamoru Komachi, Satoshi Sekine (RIKEN). WikiSQE: A Large-Scale Dataset for Sentence Quality Estimation in Wikipedia. 38th AAAI Conference on Artificial Intelligence, pp.17656-17663. February 2024. (poster, PDF)
Zizheng Zhang (TMU), Masato Mita (CyberAgent/TMU) and Mamoru Komachi. ClozEx: A Task toward Generation of English Cloze Explanation. Findings of The 2023 Conference on Empirical Methods in Natural Language Processing (EMNLP 2023), pp.5228-5242. December 2023. (poster, PDF)
Tosho Hirasawa (TMU), Emanuele Bugliarello (University of Copenhagen), Desmond Elliott (University of Copenhagen) and Mamoru Komachi. Visual Prediction Improves Zero-Shot Cross-Modal Machine Translation. Proceedings of the Eight Conference on Machine Translation (WMT 2023), pp.522-535. December 2023. (oral, PDF)
Taisei Enomoto (TMU), Tosho Hirasawa (TMU), Hwichan Kim (TMU), Teruaki Oka and Mamoru Komachi. Simultaneous Domain Adaptation of Tokenization and Machine Translation. The 37th Pacific Asia Conference on Language, Information and Computation (PACLIC 37). December 2023. (poster, PDF)
Zhidong Ling (TMU), Taichi aida (TMU), Teruaki Oka and Mamoru Komachi. Construction of Evaluation Dataset for Japanese Lexical Semantic Change Detection. The 37th Pacific Asia Conference on Language, Information and Computation (PACLIC 37). December 2023. (oral, PDF)
Xiaomeng Pan (TMU), Zhousi Chen (TMU) and Mamoru Komachi (TMU). Query Generation using GPT-3 for CLIP-based Word Sense Disambiguation for Image Retrieval. The 12th Joint Conference on Lexical and Computational Semantics (*SEM 2023), pp.417–422. July 2023. (PDF)
Hwichan Kim (TMU) and Mamoru Komachi (TMU). Enhancing Few-shot Cross-lingual Transfer with Target Language Peculiar Examples. Findings of the 61st Annual Meeting of the Association for Computational Linguistics (ACL 2023), pp.747–767. July 2023. (PDF)
Hiroto Tamura (TMU), Tosho Hirasawa (TMU), Hwichan Kim (TMU) and Mamoru Komachi (TMU). Does Masked Language Model Pre-training with Artificial Data Improve Low-resource Neural Machine Translation? Findings of the 17th Conference of the European Chapter of the Association for Computational Linguistics (EACL 2023), pp.2216-2225. May 2023. (PDF)
Zizheng Zhang (TMU), Masato Mita (TMU/CyberAgent) and Mamoru Komachi (TMU). Cloze Quality Estimation for Language Assessment. Findings of the 17th Conference of the European Chapter of the Association for Computational Linguistics (EACL 2023), pp.540-550. May 2023. (PDF)
国際会議(査読あり、予稿なし)
Zhousi Chen (TMU) and Mamoru Komachi (TMU). Discontinuous Combinatory Constituency Parsing. 17th Conference of the European Chapter of the Association for Computational Linguistics (EACL 2023). May 2023. (poster)
国際会議(査読なし、予稿あり)
Naoya Ueda (TMU) and Mamoru Komachi. TMU Feedback Comment Generation System Using Pretrained Sequence-to-Sequence Language Models. Proceedings of the 16th International Natural Language Generation Conference: Generation Challenges, pp. 68-73. September, 2023. (poster, PDF)
研究会・全国大会(査読なし、予稿あり)
Zizheng Zhang (都立大), Masato Mita (サイバーエージェント/都立大), Mamoru Komachi (一橋大). A Task of Cloze Explanation Generation for ESL Learning. 言語処理学会第30回年次大会. 2024年3月12日. (poster, PDF)
凌志棟, 相田太一, 岡照晃 (都立大), 小町守 (一橋大). 日本語意味変化検出の評価セットの拡張と検出手法の評価. 言語処理学会第30回年次大会. 2024年3月12日. (poster, PDF)
小林正宗 (都立大), 三田雅人 (サイバーエージェント), 小町守 (一橋大). 文法誤り訂正の包括的メタ評価: 既存自動評価の限界と大規模言語モデルの可能性. 言語処理学会第30回年次大会. 2024年3月12日. (poster, PDF)(優秀賞受賞)
佐藤郁子, 平澤寅庄, 金輝燦, 岡照晃 (都立大), 小町守 (一橋大). 語義曖昧性解消に着目した英日マルチモーダル機械翻訳の評価セット構築と分析. 言語処理学会第30回年次大会. 2024年3月13日. (poster, PDF)
木山朔, 相田太一 (都立大), 小町守 (一橋大), 小木曽智信 (国語研), 高村大也 (産総研), 松井秀俊 (滋賀大), 持橋大地 (統数研). 意味変化分析に向けた単語埋め込みの時系列パターン分析. 言語処理学会第30回年次大会. 2024年3月13日. (oral, PDF)
上田直生也 (都立大), 三田雅人 (サイバーエージェント/都立大), 小町守 (一橋大). Minimal-pair Paradigmデータセットにおけるトークン長バイアスの分析と改善. 言語処理学会第30回年次大会. 2024年3月14日. (poster, PDF)
大平颯人 (東北大), 金輝燦 (都立大), 小町守 (一橋大). 多言語ゼロショット学習における推論言語に関する分析. 言語処理学会第30回年次大会. 2024年3月14日. (poster, PDF)
段文傑 (都立大), 王鴻飛 (都立大), 岡照晃 (都立大), 古宮嘉那子 (農工大), 小町守 (一橋大). ニューラル機械翻訳を使った中国語古文の翻訳 -- 訓練・評価時の時間的差異の検証. 情報処理学会人文科学とコンピュータシンポジウム(じんもんこん2023). 2023年12月9-10日.
小林正宗 (都立大), 三田雅人 (サイバーエージェント/都立大), 小町守 (一橋大). 文法誤り訂正におけるメタ評価再考. 情報処理学会第258回自然言語処理研究会. 2023年12月2-4日.(優秀研究賞受賞)
中島京太郎 (都立大), 金輝燦 (都立大), 平澤寅庄 (都立大), 岡照晃 (一橋大), 小町守 (一橋大). 語彙内トークンを媒介とした大規模言語モデルへのソフトプロンプトの転移. 情報処理学会第257回自然言語処理研究会. 2023年9月1日.
シンポジウム(査読なし、予稿なし)
中島京太郎 (都立大), 金輝燦 (都立大), 平澤寅庄 (都立大), 岡照晃 (一橋大), 小町守 (一橋大). 語彙内トークンを媒介とした大規模言語モデルへのソフトプロンプトの転移. NLP若手の会 (YANS) 第18回シンポジウム. 2023年8月30-31日.(スポンサー賞=LLM-X賞受賞)
上田直生也 (都立大), 三田雅人 (サイバーエージェント/都立大), 小町守 (一橋大). 文法性評価ベンチマークBLiMPにおけるバイアス除去. NLP若手の会 (YANS) 第18回シンポジウム. 2023年8月30-31日.
金輝燦 (都立大), 小町守 (一橋大), 鈴木潤 (東北大). 言語識別器を用いた敵対的学習による多言語モデルの言語横断性の改善. NLP若手の会 (YANS) 第18回シンポジウム. 2023年8月30-31日.
佐藤郁子 (都立大), 平澤寅庄 (都立大), 金輝燦 (都立大), 岡照晃 (一橋大), 小町守 (一橋大). 視覚情報による曖昧性解消に着目した英日マルチモーダル機械翻訳のデータセット構築. NLP若手の会 (YANS) 第18回シンポジウム. 2023年8月30-31日.
雑誌記事・辞典項目等
小町守. 自然言語処理の教育応用の最新動向. 英語教育2023年7月号. 2023年6月. 大修館書店.
須藤克仁 (NAIST), 小町守, 梶原智之(愛媛大学) , 三田雅人(サイバーエージェント/TMU) . NLP2023 テーマセッション「ことばの評価と品質推定」. 自然言語処理, Vol.30, No.2, pp.844-850. 2023年6月. (PDF)