Q* の勝手な予想メモ|深津 貴之 (fladdict)
2023.11.24 19:57
Note.com
OpenAIのQ*というモデルアプローチに関してメモ。この分野は素人なので、あくまで勝手な予想です。 Qラーニングとは? Q学習(Q-learning)は、強化学習の一種で、エージェントが最適な行動を学習する方法です。このアプローチでは、エージェントは環境との相互作用を通じて、各状態でどの行動を選択することが最も報酬をもたらすかを学習します。 A*は? A*(エースター)アルゴリズムは、最短経路問題を解決するための効率的なグラフ探索アルゴリズムです。このアルゴリズムは、グラフの一部を探索し、目的地に最も近…
検索
人気記事
コメント一覧
まだコメントはありません。