Google社、大規模言語モデル(LLM)自己修正アルゴリズムSCoReを発表
2024.11.28 13:31
InfoQ.com
先日、Google DeepMind社の研究者が、強化学習を用いた自己修正(Self-Correction via Reinforcement Learning, 以下 SCoRe)に関する論文を発表した。このSCoReとは、数学やコーディングの問題を解く際の大規模言語モデルによる自己修正能力の向上を図る技術である。SCoReで微調整されたモデルは、ベースラインモデルと比較で、いくつかのベンチマークの性能が向上した。 By Anthony Alford Translated by Takashi Kawase
検索
人気記事
コメント一覧
まだコメントはありません。