OpenAIが言語モデルの事実性を測定するベンチマーク「SimpleQA」をオープンソースでリリース

2024.10.31 12:25

Livedoor.com

OpenAIが言語モデルの事実性(factuality)を測定するためのベンチマーク「SimpleQA」を発表しました。SimpleQAは科学技術からエンターテインメントまでの幅広いトピックを含んだ検証済みの4000種類以上の質問から構成されています。Introducing SimpleQA | OpenAIhttps://openai.com/index/introducing-simpleqa/GitHub - openai/simple-evalshttps://github.com/openai/simp…

記事全文へ

検索

人気記事

アンソロピック、評価額141兆円でOpenAI超えへ──人類史上最大の資金調達ラウンド（Forbes JAPAN） - Yahoo!ニュース

2026.05.05 11:04

悪用厳禁！？あなたの“要求”が言葉なしで伝わる、科学的に証明された最強のアイコンタクト術

2025.07.20 11:30

住宅地そばの巨大データセンター建設は「新しい公害」か　都市部で相次ぐ摩擦　浮かぶ情報開示と法整備の課題（AERA DIGITAL） - Yahoo!ニュース

2026.06.06 12:43

『ザ・ボーイズ』ジェンセン・アクレスが卒業式で語った拒絶と友情の人生訓

2026.06.06 12:00

立憲「文春を訴えればよいのでは？」⇒ 高市総理「私は日本国を率いているので、生成AIで動画作成する反高市野党の様な暇な時間は無い」

2026.06.05 20:07

コメント一覧

まだコメントはありません。

コメント