「Balatro」をどのAIが最も上手くプレイできるのかが分かるベンチマーク「BalatroBench」
2026.02.13 15:00
Livedoor.com
ポーカー×ローグライクゲームの「Balatro」をAIにプレイさせ、どれが一番優れたスコアを獲得するのかでモデルの性能を測るベンチマーク「BalatroBench」が公開されています。GitHub - coder/balatrobench: Benchmark LLMs' strategic performance in Balatro ????https://github.com/coder/balatrobenchBalatroはターン制で進むため、モデルごとに異なる処理速度に左右されることなく一貫した性能評…
コメント一覧
まだコメントはありません。