人工知能

保護中: 関数近似を用いた強化学習(1) – 価値関数の関数近似(バッチ学習の場合)

デジタルトランスフォーメーション(DX)、人工知能(AI)、機械学習(ML)タスクのための強化学習での膨大な状態数に対応するための価値関数のバッチ学習のケースでの関数近似

2022.01.26

強化学習微分積分:Calculus最適化:Optimization機械学習:Machine Learning確率・統計:Probability and Statistics

保護中: モデルベース型の強化学習(スパースサンプリング、UCT、モンテカルロ探索木)

デジタルトランスフォーメーション(DX)、人工知能(AI)、機械学習(ML)タスクに活用されるモデルベース型の強化学習(スパースサンプリング、UCT、モンテカルロ探索木)

2022.01.24

IOT技術:IOT TechnologyStream Data Processingオンライン学習強化学習微分積分:Calculus最適化:Optimization機械学習:Machine Learning確率・統計:Probability and Statistics

保護中: モデルフリー型の強化学習(2)- 方策反復法(Q学習法、SARSA、アクタークリック法)

デジタルトランスフォーメーション(DX)、人工知能(AI)、機械学習タスクに活用されるモデルフリー型強化学習への価値反復法(Q学習法、SARSA法、アクター・クリティック法)

2022.01.21

IOT技術:IOT TechnologyStream Data Processingオンライン学習強化学習微分積分:Calculus最適化:Optimization機械学習:Machine Learning確率・統計:Probability and Statistics

保護中: モデルフリー型の強化学習(1)- 価値反復法(モンテカルロ法、TD法、TD(λ)法)

デジタルトランスフォーメーション(DX)、人工知能(AI)、機械学習に活用されるモデルフリー型強化学習への価値反復法(モンテカルロ法、TD法、TD(λ)法)適用

2022.01.20

オンライン学習強化学習推論技術:inference Technology機械学習:Machine Learning

保護中: 探索と活用のトレードオフ解消-リグレットと確率的最適方策、ヒューリスティクス

デジタルトランスフォーメーション(DX)、人工知能(AI)、機械学習(ML)タスクに活用されるリグレットと確率的最適方策、ヒューリスティクスを用いた強化学習(探索と活動のトレードオフ解消

2022.01.19

オンライン学習強化学習微分積分:Calculus最適化:Optimization機械学習:Machine Learning確率・統計:Probability and Statistics

保護中: プランニング問題(2)動的計画法の実装(価値反復法と方策反復法)

デジタルトランスフォーメーション(DX)、人工知能(AI)、機械学習(ML)タスクに活用される強化学習としてのプランニング問題への動的計画法の実装(価値反復法と方策反復法)

2022.01.18

オンライン学習強化学習微分積分:Calculus最適化:Optimization機械学習:Machine Learning確率・統計:Probability and Statistics

保護中: プランニング問題(1)-動的計画法を用いたアプローチと理論的裏付け

デジタルトランスフォーメーション(DX)、人工知能(AI)、機械学習(ML)タスクに活用される環境が既知の逐次的意思決定問題のプランニング問題による強化学習(動径計画法と線形計画問題)

2022.01.17

強化学習微分積分:Calculus最適化:Optimization機械学習:Machine Learning確率・統計:Probability and Statistics

機械学習プロフェッショナルシリーズ-統計的因果探索読書メモ

デジタルトランスフォーメーション(DX)、機械学習(ML)、人工知能(AI)タスクに活用される膨大なデータから原因と結果の関係を見いだす統計的因果探索

2022.01.16

Uncategorized

機械学習プロフェッショナルシリーズスパース性に基づく機械学習読書メモ

デジタルトランスフォーメーション(DX)、人工知能(AI)、機械学習(ML)タスクに活用される機械学習における正則化等に活用されるスパースモデリングの概要

2022.01.15

最適化:Optimization機械学習:Machine Learning深層学習:Deep Learning

保護中: オンライン学習の性能の評価(パーセプトロン、リグレット解析、FTL、RFTL)

デジタルトランスフォーメーション(DX)、人工知能(AI)、機械学習(ML)タスクに活用されるオンライン学習を評価するためのパーセプトロンとリグレット解析(FTL,RFTL)

2022.01.14

オンライン学習強化学習微分積分:Calculus最適化:Optimization機械学習:Machine Learning確率・統計:Probability and Statistics

保護中: 関数近似を用いた強化学習(1) – 価値関数の関数近似(バッチ学習の場合)

保護中: モデルベース型の強化学習(スパースサンプリング、UCT、モンテカルロ探索木)

保護中: モデルフリー型の強化学習(2)- 方策反復法(Q学習法、SARSA、アクタークリック法)

保護中: モデルフリー型の強化学習(1)- 価値反復法(モンテカルロ法、TD法、TD(λ)法)

保護中: 探索と活用のトレードオフ解消-リグレットと確率的最適方策、ヒューリスティクス

保護中: プランニング問題(2)動的計画法の実装(価値反復法と方策反復法)

保護中: プランニング問題(1)-動的計画法を用いたアプローチと理論的裏付け

機械学習プロフェッショナルシリーズ-統計的因果探索 読書メモ

機械学習プロフェッショナルシリーズ スパース性に基づく機械学習 読書メモ

保護中: オンライン学習の性能の評価(パーセプトロン、リグレット解析、FTL、RFTL)

機械学習プロフェッショナルシリーズ-統計的因果探索読書メモ

機械学習プロフェッショナルシリーズスパース性に基づく機械学習読書メモ