強化学習 | ページ 3 | Deus Ex Machina

保護中: 探索と活用のトレードオフ解消-リグレットと確率的最適方策、ヒューリスティクス

デジタルトランスフォーメーション(DX)、人工知能(AI)、機械学習(ML)タスクに活用されるリグレットと確率的最適方策、ヒューリスティクスを用いた強化学習(探索と活動のトレードオフ解消

2022.01.19

オンライン学習強化学習微分積分:Calculus最適化:Optimization機械学習:Machine Learning確率・統計:Probability and Statistics

デジタルトランスフォーメーション(DX)、人工知能(AI)、機械学習(ML)タスクに活用される強化学習としてのプランニング問題への動的計画法の実装(価値反復法と方策反復法)

2022.01.18

オンライン学習強化学習微分積分:Calculus最適化:Optimization機械学習:Machine Learning確率・統計:Probability and Statistics

デジタルトランスフォーメーション(DX)、人工知能(AI)、機械学習(ML)タスクに活用される環境が既知の逐次的意思決定問題のプランニング問題による強化学習(動径計画法と線形計画問題)

2022.01.17

強化学習微分積分:Calculus最適化:Optimization機械学習:Machine Learning確率・統計:Probability and Statistics

デジタルトランスフォーメーション(DX)、人工知能(AI)、機械学習(ML)タスクで活用される現在の状況を観測し取るべき行動を決定する強化学習の参考図書

2022.01.10

機械学習:Machine Learning深層学習:Deep Learning

デジタルトランスフォーメーション(DX)、人工知能(AI)、機械学習(ML)タスクに活用される逐次的な機械学習技術であるオンライン学習とそれらに意思決定問題を組み合わせたオンライン予測について

2022.01.05

オンライン学習強化学習微分積分:Calculus最適化:Optimization機械学習:Machine Learning確率・統計:Probability and Statistics

デジタルトランスフォーメーション(DX)、人工知能(AI)タスクのための深層学習の機械学習、勾配降下法、正則化、誤差逆伝播、自己符号化器、畳み込みニューラルネット、再帰型ニューラルネット、ボルツマンマシン、強化学習等の概要

2021.11.15

微分積分:Calculus最適化:Optimization機械学習:Machine Learning深層学習:Deep Learning確率・統計:Probability and Statistics線形代数:Linear Algebra

強化学習、オンライン予測、高速自動株取引のアルゴリズムなどに用いられる数学的意思決定手法について説明します。つの意思決定戦略を説明した後、主観的確率、ベイズ理論、多重概念理論、供給上昇理論を紹介します。

2021.06.05

数学:Mathematics確率・統計:Probability and Statistics

逐次的な意思決定ルールを学習する強化学習の概要

2021.05.20

アルゴリズム:Algorithms最適化:Optimization機械学習:Machine Learning深層学習:Deep Learning

確率的生成モデルであるベイズ推定での機械学習の概要

2021.05.14

アルゴリズム:Algorithms機械学習:Machine Learning確率・統計:Probability and Statistics