OpenAIが言語モデルの事実性を測定するベンチマーク「SimpleQA」をオープンソースでリリース

2024.10.31 12:25

Livedoor.com

OpenAIが言語モデルの事実性(factuality)を測定するためのベンチマーク「SimpleQA」を発表しました。SimpleQAは科学技術からエンターテインメントまでの幅広いトピックを含んだ検証済みの4000種類以上の質問から構成されています。Introducing SimpleQA | OpenAIhttps://openai.com/index/introducing-simpleqa/GitHub - openai/simple-evalshttps://github.com/openai/simp…

記事全文へ

検索

人気記事

アンソロピック、評価額141兆円でOpenAI超えへ──人類史上最大の資金調達ラウンド（Forbes JAPAN） - Yahoo!ニュース

2026.05.05 11:04

AIに翻訳させると「勝手に判断」されかねない、残念すぎる文章の例…じつは、日本語は論理が明確な文章になりにくい。その、深いわけ

2026.06.30 6:45

そのノイズに、可能性を聴き取れるか──音楽家・蓮沼執太が語るAI時代の「ジャッジの奥行き」

2026.06.30 9:00

今週のはてなブックマーク数ランキング（2026年6月第4週）

2026.06.30 12:13

ソースコード解析ツール「Understand 7.2」日本語版、生成AI連携に正式対応

2026.06.29 16:20

コメント一覧

まだコメントはありません。

コメント