OpenAIがAIベンチマーク「SWE-Lancer」を公開、フリーランスエンジニアに100万ドルで依頼するレベルのタスクをこなせるか測定

2025.02.19 11:44
Livedoor.com

OpenAIが2025年2月18日に、AIモデルのコーディング性能を評価するためのオープンソースのベンチマーク「SWE-Lancer」を公開しました。[2502.12115] SWE-Lancer: Can Frontier LLMs Earn $1 Million from Real-World Freelance Software Engineering?https://arxiv.org/abs/2502.12115Introducing the SWE-Lancer benchmark | OpenAIh…

検索

人気記事

2026.05.05 11:04
2025.01.06 13:08
2026.06.05 6:35
2026.06.04 11:57
2026.06.05 11:41

コメント一覧

まだコメントはありません。

コメント