OpenAIがAIベンチマーク「SWE-Lancer」を公開、フリーランスエンジニアに100万ドルで依頼するレベルのタスクをこなせるか測定

2025.02.19 11:44
Livedoor.com

OpenAIが2025年2月18日に、AIモデルのコーディング性能を評価するためのオープンソースのベンチマーク「SWE-Lancer」を公開しました。[2502.12115] SWE-Lancer: Can Frontier LLMs Earn $1 Million from Real-World Freelance Software Engineering?https://arxiv.org/abs/2502.12115Introducing the SWE-Lancer benchmark | OpenAIh…

検索

人気記事

2025.12.15 0:00
2025.12.15 6:00
2025.12.15 6:00
2025.12.14 10:10
2023.12.10 11:46

コメント一覧

まだコメントはありません。

コメント