エージェントコーディングの性能はハードウェア設定によって数%ポイント変動するとAnthropicが報告、高性能モデル同士のベンチマークスコア差は高性能なハードウェアの恩恵の可能性

2026.02.06 16:00
Livedoor.com

Claudeの開発元であるAnthropicが、「インフラストラクチャーの構成により、エージェントコーディングのベンチマークが数パーセントポイント変動する」と報告しています。この差は人気のAIモデルのベンチマークリーダーボード上の差に影響しているそうです。Quantifying infrastructure noise in agentic coding evals \ Anthropichttps://www.anthropic.com/engineering/infrastructure-noiseSWE-b…

検索

人気記事

2026.05.07 1:35
2026.05.07 0:23
2026.05.07 2:48
2026.05.06 22:39
2026.05.06 21:43

コメント一覧

まだコメントはありません。

コメント