OpenAIがAIベンチマーク「SWE-Lancer」を公開、フリーランスエンジニアに100万ドルで依頼するレベルのタスクをこなせるか測定

2025.02.19 11:44
Livedoor.com

OpenAIが2025年2月18日に、AIモデルのコーディング性能を評価するためのオープンソースのベンチマーク「SWE-Lancer」を公開しました。[2502.12115] SWE-Lancer: Can Frontier LLMs Earn $1 Million from Real-World Freelance Software Engineering?https://arxiv.org/abs/2502.12115Introducing the SWE-Lancer benchmark | OpenAIh…

検索

人気記事

2023.11.30 9:20
2024.03.26 11:00
2024.03.21 13:55
2023.12.21 19:17
2025.04.03 23:37

コメント一覧

まだコメントはありません。

コメント