保護中: 関数近似を用いた強化学習(3)- 方策関数の関数近似

このコンテンツはパスワードで保護されています。閲覧するには以下にパスワードを入力してください。

コメント

  1. […] 関数近似を用いた強化学習(3)- 方策関数の関数近似(バッチ学習の場合) […]

  2. […] 前回までに、エージェントはマルコフ性のある状態を観測できると仮定していた。しかし、実問題によってはマルコフ性の仮定は現実的ではなく、状態を状態を部分的にしか観測できず […]

タイトルとURLをコピーしました