エージェントコーディングの性能はハードウェア設定によって数%ポイント変動するとAnthropicが報告、高性能モデル同士のベンチマークスコア差は高性能なハードウェアの恩恵の可能性

2026.02.06 16:00
Livedoor.com

Claudeの開発元であるAnthropicが、「インフラストラクチャーの構成により、エージェントコーディングのベンチマークが数パーセントポイント変動する」と報告しています。この差は人気のAIモデルのベンチマークリーダーボード上の差に影響しているそうです。Quantifying infrastructure noise in agentic coding evals \ Anthropichttps://www.anthropic.com/engineering/infrastructure-noiseSWE-b…

検索

人気記事

2026.05.05 11:04
2026.06.28 23:26
2026.06.28 23:35
2026.06.28 23:00
2026.06.29 0:04

コメント一覧

まだコメントはありません。

コメント