強化学習

オンライン学習

保護中: 探索と活用のトレードオフ解消-リグレットと確率的最適方策、ヒューリスティクス

デジタルトランスフォーメーション(DX)、人工知能(AI)、機械学習(ML)タスクに活用されるリグレットと確率的最適方策、ヒューリスティクスを用いた強化学習(探索と活動のトレードオフ解消
オンライン学習

保護中: プランニング問題(2)動的計画法の実装(価値反復法と方策反復法)

デジタルトランスフォーメーション(DX)、人工知能(AI)、機械学習(ML)タスクに活用される強化学習としてのプランニング問題への動的計画法の実装(価値反復法と方策反復法)
強化学習

保護中: プランニング問題(1)-動的計画法を用いたアプローチと理論的裏付け

デジタルトランスフォーメーション(DX)、人工知能(AI)、機械学習(ML)タスクに活用される環境が既知の逐次的意思決定問題のプランニング問題による強化学習(動径計画法と線形計画問題)
機械学習:Machine Learning

機械学習プロフェッショナルシリーズ「強化学習」読書メモ

デジタルトランスフォーメーション(DX)、人工知能(AI)、機械学習(ML)タスクで活用される現在の状況を観測し取るべき行動を決定する強化学習の参考図書
オンライン学習

オンライン学習とオンライン予測について

デジタルトランスフォーメーション(DX)、人工知能(AI)、機械学習(ML)タスクに活用される逐次的な機械学習技術であるオンライン学習とそれらに意思決定問題を組み合わせたオンライン予測について
微分積分:Calculus

これならわかる深層学習入門 (機械学習スタートアップシリーズ)読書メモ

デジタルトランスフォーメーション(DX)、人工知能(AI)タスクのための深層学習の機械学習、勾配降下法、正則化、誤差逆伝播、自己符号化器、畳み込みニューラルネット、再帰型ニューラルネット、ボルツマンマシン、強化学習等の概要
数学:Mathematics

意思決定の理論と数学的決断の技術

強化学習、オンライン予測、高速自動株取引のアルゴリズムなどに用いられる数学的意思決定手法について説明します。つの意思決定戦略を説明した後、主観的確率、ベイズ理論、多重概念理論、供給上昇理論を紹介します。
アルゴリズム:Algorithms

保護中: 強化学習とは

逐次的な意思決定ルールを学習する強化学習の概要
アルゴリズム:Algorithms

保護中: ベイズ推論による機械学習入門 – イントロダクション

確率的生成モデルであるベイズ推定での機械学習の概要
タイトルとURLをコピーしました