強化学習

python

保護中: 強化学習に対するニューラルネットワークの適用(1)概要

デジタルトランスフォーメーション(DX)、人工知能(AI)、機械学習(ML)タスクに活用される強化学習に対するニューラルネットワークの適用の概要(Agent、Epsilon-Greedy法、Trainer、Observer、Logger、確率的勾配降下法、Stochastic Gradient Descent、SGD、Adaptive Moment Estimation、Adam、Optimizer、誤差逆伝搬法、Backpropagation、勾配、活性化関数、バッチ法、価値関数、戦略)
python

保護中: モデルフリー強化学習のpythonによる実装(3)経験を価値評価、戦略どちらの更新に利用するか:ValueベースvsPolicyベース

デジタルトランスフォーメーション(DX)、人工知能(AI)、機械学習(ML)タスクに活用されるモデルフリー強化学習のpythonによる実装ValueベースとPolicyベース(経験を価値評価、戦略どちらの更新に利用するか、Deep Q-Network、深層強化学習、Off-policy Actor Critic、Q-Learning、SARSA、Actor Critic法、Multi-step Learning、TD法、Monte Carlo法、TD(λ)法、Epsilon-Greedy法)
アルゴリズム:Algorithms

保護中: 確率的バンディッド問題の方策 -理論的限界とε-貪欲法

デジタルトランスフォーメーション(DX)、人工知能(AI)、機械学習(ML)タスクに活用される確率的バンディッド問題の方策 としての理論的限界とε-貪欲法、UCB法、一貫性をもつ方策のリグレット下界、KLダイバージェンス
アルゴリズム:Algorithms

保護中: モデルフリー強化学習のpythonによる実装(2) モンテカルロ法とTD法

デジタルトランスフォーメーション(DX)、人工知能(AI)、機械学習(ML)タスクに活用されるモンテカルロ法とTD法等のモデルフリー強化学習のpythonによる実装(Q-Learning、Valueベースの手法、Monte Carlo法、ニューラルネット、Epsilon-Greedy法、TD(λ)法、Muli-step Learning、Rainbow、A3C/A2C、DDPG、APE-X DQN)
バンディッド問題

保護中: 確率的バンディッド問題の基礎

デジタルトランスフォーメーション(DX)、人工知能(AI)、機械学習(ML)タスクに活用される確率的バンディッド問題の基礎(大偏差原理とベルヌーイ分布での例、チェルノフ・へフディングの不等式、サノフの定理、へフディングの不等式、カルバックライブラー・ダイバージェンス、確率質量関数、裾確率、中心極限定理による確率近似)
アルゴリズム:Algorithms

保護中: モデルフリー強化学習のpythonによる実装(1) epsilon-Greedy法

デジタルトランスフォーメーション(DX)、人工知能(AI)、機械学習(ML)タスクに活用するためのモデルフリー強化学習の一つであるepsilon-Greedy法のpythonによる実装、多腕バンディット
python

保護中: モデルベースアプローチによる強化学習の概要とpythonでの実装

デジタルトランスフォーメーション(DX)、人工知能(AI)、機械学習(ML)タスクに活用されるモデルベースアプローチによる強化学習の概要とpythonでの実装(Bellman Equation、Value Iteration、Policy Iteration、動的計画法)
アルゴリズム:Algorithms

保護中: 強化学習の概要とシンプルなMDPモデルの実装

デジタルトランスフォーメーション(DX)、人工知能(AI)、機械学習(ML)タスクに活用される強化学習の概要とシンプルなMDPモデルのpythonでの実装
アルゴリズム:Algorithms

保護中: バンディッド問題の概要と歴史と強化学習/オンライン学習との関係

デジタルトランスフォーメーション(DX)、人工知能(AI)、機械学習(ML)タスクに活用されるバンディッド問題の概要と歴史と強化学習/オンライン学習との関係(適応割り当て、逐次割り当て、確率的バンディット、敵対的バンディット、最適腕識別、Q学習、探索と知識利用のトレードオフ、リグレット)
バンディッド問題

バンディット問題の理論とアルゴリズム

デジタルトランスフォーメーション(DX)、人工知能(AI)、機械学習(ML)タスクに活用される最適な戦略を選ぶためのバンディット問題の理論とアルゴリズムについて
モバイルバージョンを終了
タイトルとURLをコピーしました