Google社、大規模言語モデル(LLM)自己修正アルゴリズムSCoReを発表

2024.11.28 13:31

InfoQ.com

先日、Google DeepMind社の研究者が、強化学習を用いた自己修正（Self-Correction via Reinforcement Learning, 以下 SCoRe）に関する論文を発表した。このSCoReとは、数学やコーディングの問題を解く際の大規模言語モデルによる自己修正能力の向上を図る技術である。SCoReで微調整されたモデルは、ベースラインモデルと比較で、いくつかのベンチマークの性能が向上した。 By Anthony Alford Translated by Takashi Kawase

記事全文へ

検索

人気記事

アンソロピック、評価額141兆円でOpenAI超えへ──人類史上最大の資金調達ラウンド（Forbes JAPAN） - Yahoo!ニュース

2026.05.05 11:04

【非エンジニアのためのClaude/Claude Codeシリーズ】AIの設定でひとつだけいじる価値があったもの ── effortは「賢さ」ではなく「仕事量」のつまみだった

2026.07.25 22:32

Anthropic、「Claude Opus 5」を提供開始　最上位級の性能を半額相当のコストで実現

2026.07.26 0:00

Hermes Agent と Slack で設計し、Linear のチケットから Draft PR まで作成するワークフローの素振りをした

2026.07.25 17:52

2026年の若者トレンドは“映え”から“共感”へ　ChatGPTも「相談相手」として定着

2026.07.25 8:00

コメント一覧

まだコメントはありません。

コメント