OpenAIがAIベンチマーク「SWE-Lancer」を公開、フリーランスエンジニアに100万ドルで依頼するレベルのタスクをこなせるか測定
2025.02.19 11:44
Livedoor.com

OpenAIが2025年2月18日に、AIモデルのコーディング性能を評価するためのオープンソースのベンチマーク「SWE-Lancer」を公開しました。[2502.12115] SWE-Lancer: Can Frontier LLMs Earn $1 Million from Real-World Freelance Software Engineering?https://arxiv.org/abs/2502.12115Introducing the SWE-Lancer benchmark | OpenAIh…
検索
人気記事
コメント一覧
まだコメントはありません。