オンライン学習 保護中: 強化学習の新展開(2)-深層学習を用いたアプローチ デジタルトランスフォーメーション(DX)、人工知能(AI)、機械学習(ML)タスクに活用される深層強化学習を改善する7つの手法(初代のDQN,二重Q学習(二重DQN法),優先度付け経験再生,衝突Qネットワーク,分布強化学習(カテゴリDQN法)ノイズネットワーク,nステップ切断リターン)とアルファゼロについて 2022.02.07 オンライン学習強化学習微分積分:Calculus最適化:Optimization機械学習:Machine Learning深層学習:Deep Learning確率・統計:Probability and Statistics
オンライン学習 保護中: 強化学習の新展開(1)-リスク指標を用いた強化学習 デジタルトランスフォーメーション(DX)、人工知能(AI)、機械学習(ML)タスクのためのリスク考慮型強化学習法でのさまざまなアプローチ(正規過程TD学習、RDPS法)と実装(モンテカルロ法、解析的手法) 2022.02.03 オンライン学習強化学習微分積分:Calculus最適化:Optimization機械学習:Machine Learning深層学習:Deep Learning確率・統計:Probability and Statistics
オンライン学習 保護中: 部分観測マルコフ決定過程(2)POMDPのプランニング デジタルトランスフォーメーション(DX)、人工知能(AI)、機械学習(ML)タスクのための強化学習、部分観測マルコフ決定過程のプランニング方法による最適方策の獲得 2022.02.02 オンライン学習強化学習微分積分:Calculus最適化:Optimization機械学習:Machine Learning深層学習:Deep Learning確率・統計:Probability and Statistics
オンライン学習 保護中: 部分観測マルコフ決定過程(1)POMDPと信念MDPについて デジタルトランスフォーメーション(DX)、人工知能(AI)、機械学習(ML)タスクに活用される部分観測マルコフ決定過程(POMDP)を用いたよりフレキシブルな強化学習、信念MDP 2022.02.01 オンライン学習強化学習微分積分:Calculus最適化:Optimization機械学習:Machine Learning確率・統計:Probability and Statistics
オンライン学習 保護中: 関数近似を用いた強化学習(3)- 方策関数の関数近似 このコンテンツはパスワードで保護されています。閲覧するには以下にパスワードを入力してください。 パスワード: 2022.01.31 オンライン学習強化学習微分積分:Calculus最適化:Optimization機械学習:Machine Learning深層学習:Deep Learning確率・統計:Probability and Statistics
オンライン学習 保護中: 関数近似を用いた強化学習(2)- 価値関数の関数近似(オンライン学習の場合) デジタルトランスフォーメーション(DX)、人工知能(AI)、機械学習(ML)タスクに活用される膨大な状態数での強化学習に対応する関数近似オンライン手法の理論(勾配TD学習法、最小二乗法に基づく最小二乗TD学習(LSTD)法、GTD2法)とLASSOによる正則化 2022.01.28 オンライン学習強化学習微分積分:Calculus最適化:Optimization機械学習:Machine Learning深層学習:Deep Learning確率・統計:Probability and Statistics
強化学習 保護中: 関数近似を用いた強化学習(1) – 価値関数の関数近似(バッチ学習の場合) デジタルトランスフォーメーション(DX)、人工知能(AI)、機械学習(ML)タスクのための強化学習での膨大な状態数に対応するための価値関数のバッチ学習のケースでの関数近似 2022.01.26 強化学習微分積分:Calculus最適化:Optimization機械学習:Machine Learning確率・統計:Probability and Statistics
推論技術:inference Technology 保護中: 時系列・空間データのモデリング(1)(動的線形モデル) 動的線形モデルを中心とした時間・空間モデルのベイズモデル化とMCMCによる評価 2022.01.25 推論技術:inference Technology機械学習:Machine Learning確率・統計:Probability and Statistics
IOT技術:IOT Technology 保護中: モデルベース型の強化学習(スパースサンプリング、UCT、モンテカルロ探索木) デジタルトランスフォーメーション(DX)、人工知能(AI)、機械学習(ML)タスクに活用されるモデルベース型の強化学習(スパースサンプリング、UCT、モンテカルロ探索木) 2022.01.24 IOT技術:IOT TechnologyStream Data Processingオンライン学習強化学習微分積分:Calculus最適化:Optimization機械学習:Machine Learning確率・統計:Probability and Statistics
グラフ理論 構造学習 構造学習について 概要 データが持つ構造を学習することは、そのデータが何であるかという解釈を行う上で重要なものとなる。構造学習の中で最もシンプルなもは、階層的なクラスタリングであり、決定木による学習の基本的な機械学習アル... 2022.01.22 グラフ理論幾何学:Geometry微分積分:Calculus最適化:Optimization機械学習:Machine Learning確率・統計:Probability and Statistics関係データ学習