アルゴリズム:Algorithms 保護中: モデルフリー強化学習のpythonによる実装(1) epsilon-Greedy法 デジタルトランスフォーメーション(DX)、人工知能(AI)、機械学習(ML)タスクに活用するためのモデルフリー強化学習の一つであるepsilon-Greedy法のpythonによる実装、多腕バンディット アルゴリズム:Algorithmsマルチエージェントシステム幾何学:Geometry強化学習最適化:Optimization機械学習:Machine Learning確率・統計:Probability and Statistics線形代数:Linear Algebra集合論:Set theory
python 保護中: モデルベースアプローチによる強化学習の概要とpythonでの実装 デジタルトランスフォーメーション(DX)、人工知能(AI)、機械学習(ML)タスクに活用されるモデルベースアプローチによる強化学習の概要とpythonでの実装(Bellman Equation、Value Iteration、Policy Iteration、動的計画法) pythonアルゴリズム:Algorithmsオンライン学習強化学習微分積分:Calculus最適化:Optimization機械学習:Machine Learning確率・統計:Probability and Statistics線形代数:Linear Algebra
アルゴリズム:Algorithms 保護中: 強化学習の概要とシンプルなMDPモデルの実装 デジタルトランスフォーメーション(DX)、人工知能(AI)、機械学習(ML)タスクに活用される強化学習の概要とシンプルなMDPモデルのpythonでの実装 アルゴリズム:Algorithms強化学習微分積分:Calculus最適化:Optimization機械学習:Machine Learning深層学習:Deep Learning確率・統計:Probability and Statistics線形代数:Linear Algebra
アルゴリズム:Algorithms 保護中: バンディッド問題の概要と歴史と強化学習/オンライン学習との関係 デジタルトランスフォーメーション(DX)、人工知能(AI)、機械学習(ML)タスクに活用されるバンディッド問題の概要と歴史と強化学習/オンライン学習との関係(適応割り当て、逐次割り当て、確率的バンディット、敵対的バンディット、最適腕識別、Q学習、探索と知識利用のトレードオフ、リグレット) アルゴリズム:Algorithmsバンディッド問題強化学習機械学習:Machine Learning深層学習:Deep Learning
オンライン学習 保護中: 部分観測マルコフ決定過程(1)POMDPと信念MDPについて デジタルトランスフォーメーション(DX)、人工知能(AI)、機械学習(ML)タスクに活用される部分観測マルコフ決定過程(POMDP)を用いたよりフレキシブルな強化学習、信念MDP オンライン学習強化学習微分積分:Calculus最適化:Optimization機械学習:Machine Learning確率・統計:Probability and Statistics
オンライン学習 保護中: 関数近似を用いた強化学習(2)- 価値関数の関数近似(オンライン学習の場合) デジタルトランスフォーメーション(DX)、人工知能(AI)、機械学習(ML)タスクに活用される膨大な状態数での強化学習に対応する関数近似オンライン手法の理論(勾配TD学習法、最小二乗法に基づく最小二乗TD学習(LSTD)法、GTD2法)とLASSOによる正則化 オンライン学習強化学習微分積分:Calculus最適化:Optimization機械学習:Machine Learning深層学習:Deep Learning確率・統計:Probability and Statistics
強化学習 保護中: 関数近似を用いた強化学習(1) – 価値関数の関数近似(バッチ学習の場合) デジタルトランスフォーメーション(DX)、人工知能(AI)、機械学習(ML)タスクのための強化学習での膨大な状態数に対応するための価値関数のバッチ学習のケースでの関数近似 強化学習微分積分:Calculus最適化:Optimization機械学習:Machine Learning確率・統計:Probability and Statistics
IOT技術:IOT Technology 保護中: モデルベース型の強化学習(スパースサンプリング、UCT、モンテカルロ探索木) デジタルトランスフォーメーション(DX)、人工知能(AI)、機械学習(ML)タスクに活用されるモデルベース型の強化学習(スパースサンプリング、UCT、モンテカルロ探索木) IOT技術:IOT TechnologyStream Data Processingオンライン学習強化学習微分積分:Calculus最適化:Optimization機械学習:Machine Learning確率・統計:Probability and Statistics
オンライン学習 保護中: モデルフリー型の強化学習(1)- 価値反復法(モンテカルロ法、TD法、TD(λ)法) デジタルトランスフォーメーション(DX)、人工知能(AI)、機械学習に活用されるモデルフリー型強化学習への価値反復法(モンテカルロ法、TD法、TD(λ)法)適用 オンライン学習強化学習推論技術:inference Technology機械学習:Machine Learning