これまでで最も難しいAIテスト「人類最後の試験」リリース、3000の多肢選択問題と短答式の質問で構成

2025.01.24 17:00
Livedoor.com

AI企業のScale AIおよびAI研究組織のCenter for AI Safety(CAIS)が共同で、AIの知識の限界をテストするために設計したベンチマーク「人類最後の試験(Humanity's Last Exam)」を公開しました。既存の主要モデルのうち、正解率10%を超えるモデルは存在しなかったとのことです。Scale AI and CAIS Unveil Results of Humanity’s Last Examhttps://scale.com/blog/humanitys-last-exam-…

検索

人気記事

2025.12.03 11:26
2025.12.03 6:24
2025.12.03 5:20
2025.12.02 7:46
2025.12.03 6:03

コメント一覧

まだコメントはありません。

コメント