大型言語モデルを改善するために翻訳すべきプロンプトの要素とは?

世界翻訳ニュース

自然言語処理タスクにおける多言語の大規模言語モデル(LLM)の性能は、プロンプトの特定の構成要素のみを翻訳することで改善できるとする研究結果が発表された。この「選択的事前翻訳(“selective pre-translation”)」という手法では、タスクと言語の特性に基づき、プロンプトの4つの構成要素である指示、文脈、例、出力のうちの一部のみを選択的に事前翻訳する。35言語を対象とした4種の自然言語処理タスクについて、選択的事前翻訳を完全事前翻訳(推論前に非英語のプロンプトを英語に翻訳する)や直接推論(非英語のソース言語でモデルに直接プロンプトを与える)といった既存の手法と比較したテストでは、タスクの種類(質問応答、自然言語推論、固有表現抽出、要約生成)や言語(高リソース言語あるいは低リソース言語)によって、事前翻訳すべきプロンプトの要素が異なることが判明した。