オンライン学習 保護中: 関数近似を用いた強化学習(2)- 価値関数の関数近似(オンライン学習の場合) デジタルトランスフォーメーション(DX)、人工知能(AI)、機械学習(ML)タスクに活用される膨大な状態数での強化学習に対応する関数近似オンライン手法の理論(勾配TD学習法、最小二乗法に基づく最小二乗TD学習(LSTD)法、GTD2法)とLASSOによる正則化 2022.01.28 オンライン学習強化学習微分積分:Calculus最適化:Optimization機械学習:Machine Learning深層学習:Deep Learning確率・統計:Probability and Statistics
強化学習 保護中: 関数近似を用いた強化学習(1) – 価値関数の関数近似(バッチ学習の場合) デジタルトランスフォーメーション(DX)、人工知能(AI)、機械学習(ML)タスクのための強化学習での膨大な状態数に対応するための価値関数のバッチ学習のケースでの関数近似 2022.01.26 強化学習微分積分:Calculus最適化:Optimization機械学習:Machine Learning確率・統計:Probability and Statistics
推論技術:inference Technology 保護中: 時系列・空間データのモデリング(1)(動的線形モデル) 動的線形モデルを中心とした時間・空間モデルのベイズモデル化とMCMCによる評価 2022.01.25 推論技術:inference Technology機械学習:Machine Learning確率・統計:Probability and Statistics
IOT技術:IOT Technology 保護中: モデルベース型の強化学習(スパースサンプリング、UCT、モンテカルロ探索木) デジタルトランスフォーメーション(DX)、人工知能(AI)、機械学習(ML)タスクに活用されるモデルベース型の強化学習(スパースサンプリング、UCT、モンテカルロ探索木) 2022.01.24 IOT技術:IOT TechnologyStream Data Processingオンライン学習強化学習微分積分:Calculus最適化:Optimization機械学習:Machine Learning確率・統計:Probability and Statistics
アルゴリズム:Algorithms 機械学習プロフェッショナルシリーズ ベイズ深層学習 読書メモ 機械学習プロフェッショナルシリーズ ベイズ深層学習 読書メモ 機械学習プロフェッショナルシリーズ 「ベイズ深層学習 」より読書メモを記述する 前書き ベイズ深層学習の目指すところ 深層学習の課題 大... 2022.01.23 アルゴリズム:Algorithms機械学習:Machine Learning深層学習:Deep Learning
グラフ理論 構造学習 構造学習について データが持つ構造を学習することは、そのデータが何であるかという解釈を行う上で重要なものとなる。構造学習の中で最もシンプルなもは、階層的なクラスタリングであり、決定木による学習の基本的な機械学習アルゴリズム... 2022.01.22 グラフ理論幾何学:Geometry微分積分:Calculus最適化:Optimization機械学習:Machine Learning確率・統計:Probability and Statistics関係データ学習
微分積分:Calculus 機械学習プロフェッショナルシリーズ「機械学習のための連続最適化」読書メモ サマリー 機械学習における連続最適化とは、ニューラルネットワークの重みやバイアスの最適化、回帰分析のパラメータ推定、SVMのパラメータ推定等の変数が実数値をとる最適化問題を解く手法となる。連続最適化の代表的な手法には、勾配降... 2022.01.22 微分積分:Calculus最適化:Optimization機械学習:Machine Learning確率・統計:Probability and Statistics線形代数:Linear Algebra
IOT技術:IOT Technology 保護中: モデルフリー型の強化学習(2)- 方策反復法(Q学習法、SARSA、アクタークリック法) デジタルトランスフォーメーション(DX)、人工知能(AI)、機械学習タスクに活用されるモデルフリー型強化学習への価値反復法(Q学習法、SARSA法、アクター・クリティック法) 2022.01.21 IOT技術:IOT TechnologyStream Data Processingオンライン学習強化学習微分積分:Calculus最適化:Optimization機械学習:Machine Learning確率・統計:Probability and Statistics
python 機械学習スタートアップシリーズ「Pythonで学ぶ強化学習」 サマリー 強化学習は、機械学習の一分野であり、学習を行う主体であり、環境とやり取りをし、行動を選択するエージェント(Agent)と呼ばれる主体が、未知の環境や複雑な問題を持った環境(Enviroment)という状況の... 2022.01.20 python強化学習機械学習:Machine Learning
オンライン学習 保護中: モデルフリー型の強化学習(1)- 価値反復法(モンテカルロ法、TD法、TD(λ)法) デジタルトランスフォーメーション(DX)、人工知能(AI)、機械学習に活用されるモデルフリー型強化学習への価値反復法(モンテカルロ法、TD法、TD(λ)法)適用 2022.01.20 オンライン学習強化学習推論技術:inference Technology機械学習:Machine Learning