保護中: 関数近似を用いた強化学習(2)- 価値関数の関数近似(オンライン学習の場合)

このコンテンツはパスワードで保護されています。閲覧するには以下にパスワードを入力してください。

コメント

  1. […] 関数近似を用いた強化学習(2)- 価値関数の関数近似(オンライン学習の場合) […]

  2. […] 前回にひき続き、状態数が膨大であったり、状態空間が連続の場合に適用できる関数近似のアプローチの中で、今回は方策関数の関数近似について述べる。 […]

  3. […] 次回も引き続き関数近似のアプローチとして、価値関数近似をオンライン学習に適用した場合について述べる。 […]

  4. […] 関数近似を用いた強化学習(2)- 価値関数の関数近似(オンライン学習の場合) […]

モバイルバージョンを終了
タイトルとURLをコピーしました