OpenAIが言語モデルの事実性を測定するベンチマーク「SimpleQA」をオープンソースでリリース

2024.10.31 12:25
Livedoor.com

OpenAIが言語モデルの事実性(factuality)を測定するためのベンチマーク「SimpleQA」を発表しました。SimpleQAは科学技術からエンターテインメントまでの幅広いトピックを含んだ検証済みの4000種類以上の質問から構成されています。Introducing SimpleQA | OpenAIhttps://openai.com/index/introducing-simpleqa/GitHub - openai/simple-evalshttps://github.com/openai/simp…

検索

人気記事

2025.08.30 19:05
2025.09.08 13:00
2025.09.05 20:41
2025.09.08 12:46
2025.09.04 13:56

コメント一覧

まだコメントはありません。

コメント