最高でも回答精度9％程度だった「人類最後の試験」でOpenAIのDeep researchが26％以上を記録

2025.02.05 10:40

Livedoor.com

AIの性能を定量化する評価試験のうち「これまでで最も難しい」とされる「人類最後の試験(Humanity's Last Exam)」について、OpenAIのAIエージェント「Deep research」が早くも26.6％という高いスコアを記録したことがわかりました。試験の公開から10日もたたずに最高スコアが183％増加したことになります。OpenAI's Deep Research smashes records for the world's hardest AI exam, with ChatGPT o3-mi…

記事全文へ

検索

人気記事

無料でローカルAI環境を簡単に導入できる「Lemonade」、Windows・Linux・macOSにも対応したオープンソースで特にAMDのGPU・NPUで効果的

2026.04.11 0:00

RTX50搭載なのに無騒音で動作可能な18型の大画面AIゲーミングノートPC「GAMING A18 PRO」発表

2026.04.11 1:00

佐治家株式会社【150万ドルから25億ドルへ】わずか4ヶ月で1,666倍の急成長、Finger Traderの月間取引シグナル規模が25億ドルを突破

2026.04.10 21:42

謎の高性能動画生成AI「HappyHorse-1.0」はAlibaba製であることが判明、すでに偽サイトが多数公開されており公式Xが注意喚起

2026.04.10 14:43

HPCシステムズ株式会社HPCシステムズ、AI基盤アセスメントの提供を開始

2026.04.10 15:30

コメント一覧

まだコメントはありません。

コメント