エージェントコーディングの性能はハードウェア設定によって数%ポイント変動するとAnthropicが報告、高性能モデル同士のベンチマークスコア差は高性能なハードウェアの恩恵の可能性

2026.02.06 16:00
Livedoor.com

Claudeの開発元であるAnthropicが、「インフラストラクチャーの構成により、エージェントコーディングのベンチマークが数パーセントポイント変動する」と報告しています。この差は人気のAIモデルのベンチマークリーダーボード上の差に影響しているそうです。Quantifying infrastructure noise in agentic coding evals \ Anthropichttps://www.anthropic.com/engineering/infrastructure-noiseSWE-b…

検索

人気記事

2026.02.14 22:40
2026.02.14 21:27
2025.01.07 13:38
2025.03.29 13:40
2025.06.11 17:55

コメント一覧

まだコメントはありません。

コメント