保護中: 部分観測マルコフ決定過程(2)POMDPのプランニング オンライン学習 Twitter Facebook はてブ Pocket LINE コピー 2024.04.26 2022.02.02 このコンテンツはパスワードで保護されています。閲覧するには以下にパスワードを入力してください。 パスワード:
コメント
[…] 部分観測マルコフ決定過程(2)POMDPのプランニング […]
[…] 前回までは期待リターン(価値関数)の最大化問題もしくは期待コストの最小化問題として定式化した強化学習について述べていた。今回は強化学習の新展開としてリターン分布に基づく […]
[…] 次回はPOMDPへのプランニング法の適用について述べる。 […]