保護中: 関数近似を用いた強化学習(1) – 価値関数の関数近似(バッチ学習の場合)

このコンテンツはパスワードで保護されています。閲覧するには以下にパスワードを入力してください。

コメント

  1. […] 関数近似を用いた強化学習(1)– 価値関数の関数近似(バッチ学習の場合) […]

  2. […] 前回にひき続き、状態数が膨大であったり、状態空間が連続の場合に適用できる関数近似のアプローチの中で、今回は価値関数近似をオンライン学習に適用した場合について述べる。 […]

モバイルバージョンを終了
タイトルとURLをコピーしました