OpenAIがAIベンチマーク「SWE-Lancer」を公開、フリーランスエンジニアに100万ドルで依頼するレベルのタスクをこなせるか測定

2025.02.19 11:44
Livedoor.com

OpenAIが2025年2月18日に、AIモデルのコーディング性能を評価するためのオープンソースのベンチマーク「SWE-Lancer」を公開しました。[2502.12115] SWE-Lancer: Can Frontier LLMs Earn $1 Million from Real-World Freelance Software Engineering?https://arxiv.org/abs/2502.12115Introducing the SWE-Lancer benchmark | OpenAIh…

検索

人気記事

2025.09.05 0:00
2025.09.05 0:08
2025.09.04 14:46
2025.09.02 17:38
2025.09.04 18:28

コメント一覧

まだコメントはありません。

コメント