DeepSeek-R1 の technical report を読んでみた

2025.01.24 21:28

Github.io

TL;DR 数学やコーディングなど高度な reasoning タスクで OpenAI o1 に匹敵する性能を発揮した DeepSeek-R1 の technical report を読んだ先行研究の手法 GRPO や他段階の学習を組み合わせて reasoning の能力が飛躍的に向上することが示されたモデルや学習の詳細が書かれていない部分もあるが、学習済みモデルや蒸留...

記事全文へ

検索

人気記事

無料でローカルAI環境を簡単に導入できる「Lemonade」、Windows・Linux・macOSにも対応したオープンソースで特にAMDのGPU・NPUで効果的

2026.04.11 0:00

RTX50搭載なのに無騒音で動作可能な18型の大画面AIゲーミングノートPC「GAMING A18 PRO」発表

2026.04.11 1:00

謎の高性能動画生成AI「HappyHorse-1.0」はAlibaba製であることが判明、すでに偽サイトが多数公開されており公式Xが注意喚起

2026.04.10 14:43

佐治家株式会社【150万ドルから25億ドルへ】わずか4ヶ月で1,666倍の急成長、Finger Traderの月間取引シグナル規模が25億ドルを突破

2026.04.10 21:42

HPCシステムズ株式会社HPCシステムズ、AI基盤アセスメントの提供を開始

2026.04.10 15:30

コメント一覧

まだコメントはありません。

コメント