AMTA Launches Working Group to Standardize Translation Quality Estimation Evaluation
米州機械翻訳協会(AMTA)は、品質推定(QE)システムの評価に関する共通フレームワークと方法論の開発を目的としたQEユーザー・ワーキンググループを立ち上げた。同ワーキンググループ自体がQEシステムのテストやベンチマークを直接実施することはないが、代わりに、企業、言語ソリューションインテグレーター、および研究者が、自社のデータやワークフローに基づいてQEシステムを評価する際に適用可能な評価ガイダンスやテストレシピの策定を目指している。自動評価の高度化とQEシステムの企業内ワークフローへの統合が進む中で、標準化された評価手法の不在がますます顕在化しているため、AMTAの取り組みは、成長を続ける言語AIスタックの領域において評価の透明性と比較可能性の向上に寄与する可能性がある。
