最適化:Optimization

オンライン学習

保護中: 関数近似を用いた強化学習(2)- 価値関数の関数近似(オンライン学習の場合)

デジタルトランスフォーメーション(DX)、人工知能(AI)、機械学習(ML)タスクに活用される膨大な状態数での強化学習に対応する関数近似オンライン手法の理論(勾配TD学習法、最小二乗法に基づく最小二乗TD学習(LSTD)法、GTD2法)とLASSOによる正則化
強化学習

保護中: 関数近似を用いた強化学習(1) – 価値関数の関数近似(バッチ学習の場合)

デジタルトランスフォーメーション(DX)、人工知能(AI)、機械学習(ML)タスクのための強化学習での膨大な状態数に対応するための価値関数のバッチ学習のケースでの関数近似
IOT技術:IOT Technology

保護中: モデルベース型の強化学習(スパースサンプリング、UCT、モンテカルロ探索木)

デジタルトランスフォーメーション(DX)、人工知能(AI)、機械学習(ML)タスクに活用されるモデルベース型の強化学習(スパースサンプリング、UCT、モンテカルロ探索木)
グラフ理論

構造学習

構造学習について データが持つ構造を学習することは、そのデータが何であるかという解釈を行う上で重要なものとなる。構造学習の中で最もシンプルなもは、階層的なクラスタリングであり、決定木による学習の基本的な機械学習アルゴリズム...
微分積分:Calculus

機械学習プロフェッショナルシリーズ「機械学習のための連続最適化」読書メモ

サマリー 機械学習における連続最適化とは、ニューラルネットワークの重みやバイアスの最適化、回帰分析のパラメータ推定、SVMのパラメータ推定等の変数が実数値をとる最適化問題を解く手法となる。連続最適化の代表的な手法には、勾配降...
IOT技術:IOT Technology

保護中: モデルフリー型の強化学習(2)- 方策反復法(Q学習法、SARSA、アクタークリック法)

デジタルトランスフォーメーション(DX)、人工知能(AI)、機械学習タスクに活用されるモデルフリー型強化学習への価値反復法(Q学習法、SARSA法、アクター・クリティック法)
オンライン学習

保護中: 探索と活用のトレードオフ解消-リグレットと確率的最適方策、ヒューリスティクス

デジタルトランスフォーメーション(DX)、人工知能(AI)、機械学習(ML)タスクに活用されるリグレットと確率的最適方策、ヒューリスティクスを用いた強化学習(探索と活動のトレードオフ解消
IOT技術:IOT Technology

時系列データ解析

時系列データの学習の概要 時系列データとは、株価や気温、トラフィック量などの時間の経過に応じて値が変化するデータのことを呼ぶ。この時系列データに対して機械学習を適用することで、大量のデータを学習し、未知のデ...
オンライン学習

保護中: プランニング問題(2)動的計画法の実装(価値反復法と方策反復法)

デジタルトランスフォーメーション(DX)、人工知能(AI)、機械学習(ML)タスクに活用される強化学習としてのプランニング問題への動的計画法の実装(価値反復法と方策反復法)
強化学習

保護中: プランニング問題(1)-動的計画法を用いたアプローチと理論的裏付け

デジタルトランスフォーメーション(DX)、人工知能(AI)、機械学習(ML)タスクに活用される環境が既知の逐次的意思決定問題のプランニング問題による強化学習(動径計画法と線形計画問題)
タイトルとURLをコピーしました