AIが「多数決」で正解を決定? 答え合わせなしで正答率を向上させる自律学習手法TTRLとは | レバテックラボ(レバテックLAB)
2025.10.30 10:26
Levtech.jp
清華大学と上海AI研究所がAIの強化学習手法「TTRL(Test-Time Reinforcement Learning、テスト時強化学習)」を開発し、その内容を公開している。TTRLでは、正解が用意されていない問題を与えても、AI自ら「正解」を仮定し、正答率を改善できることが示唆された。これがシンギュラリティが始まる兆しとなるのだろうか。