保護中: 深層強化学習の研究動向:メタラーニングと転移学習、内発的動機づけとカリキュラムラーニング

このコンテンツはパスワードで保護されています。閲覧するには以下にパスワードを入力してください。

コメント

  1. […] エージェント側の観点(探索行動の改善): エージェントが学習効果が高いサンプルを取得できるようにする手法となる。“Rainbowの概要とアルゴリズム及び実装例について“で述べたRainbowのNoisy Nets(どの程度探索を行うか学習させる手法)や、”深層強化学習の研究動向:メタラーニングと転移学習、内発的動機づけとカ…“で述べたエージェントが未知の状態へ積極的に遷移するように動機づける内発的報酬/内発的動機づけ(Intrinsic Reward/Intrinsic Motivation)という手法がある。 […]

タイトルとURLをコピーしました