日本英語検定協会は、中国のiFlytek社(サインウェーブ社)を含む複数のサービス事業者との共同研究において、人の手を介した通常採点と遜色無い成果が出たため、2019年度から英検と英検CBTに、通常採点に加え、AIによる自動採点を並行的に導入していくと発表した。

iFlytekとの共同研究では、スピーキングの音声認識と採点精度の向上を追求しており、 iFlytekから提供された評価エンジンは中国で実績があり、この自前の評価エンジンに個人情報を除去した英検の回答データを投入して機械学習させ、英検の一部採点業務に本技術の実証実験をおこなった結果、一定の成果が見られたという。

  • 2019年度より、自動採点導入の対象テスト。点線は随時導入予定

具体的には、人手による採点とAIによる採点では、英文の音読タスク形式の問題に対しては級や問題に関係なく約98%の一致率となることが分かったという。音読タスク形式の問題に比べて、採点の難易度の高い質問に答えるタスク形式についても平均して一致率が約95%となったことから、これらの一致率から自動採点によって人間の採点者と遜色ない採点ができると考えられるという。

  • 共同研究での各問題の得点分布(青が人手、オレンジがAIによる採点)