誰でもわかる強化学習

2023.11.24 22:03
Speakerdeck.com

本資料は,東京大学松尾研究室で開催された強化学習セミナーの講義資料をもとに,講演目的でより初学者向けに内容を調整したものです.特に強化学習で最も基本的かつ最重要手法であるQ学習や,それの深層強化学習版のDQN(Deep Q-Network)を中心に解説しています.
昨今,ChatGPT等の大規模言語モデル(LLM)の開発に強化学習が使用(RLHF等)され,さらに強化学習をLLMに本格的に組み込んだAI( GoogleのGemini,OpenAIのQ*等)の出現が予想されることから, 強化学習の知識の普及のため公…

検索

人気記事

2024.04.20 18:11
2024.05.10 18:04
2024.11.26 1:33
2024.11.25 23:59
2024.02.18 19:20

コメント一覧

まだコメントはありません。

コメント