深層学習:Deep Learning

アルゴリズム:Algorithms

保護中: ノンパラメトリックベイズとクラスタリング(1)ディリクレ分布と無限混合ガウスモデル

デジタルトランスフォーメーション(DX)、人工知能(AI)、機械学習(ML)に活用される確率的生成モデルでのノンパラメトリックベイズアプローチとしてのディリクレ分布を無限次元に拡張した混合ガウスモデルによる解析
機械学習:Machine Learning

機械学習プロフェッショナルシリーズ 「バンディット問題の理論とアルゴリズム」 読書メモ

機械学習プロフェッショナルシリーズ 「バンディット問題の理論とアルゴリズム」 読書メモ バンディット問題とは、確率的な報酬を持つ複数の選択肢の中から、最適な選択肢を選び出す問題のを指し、名称は、カジノのスロットマシン(一...
Stream Data Processing

保護中: シミュレーション、データ同化、そしてエミュレーション

デジタルトランスフォーメーション(DX)、人工知能(AI)、機械学習タスクでのシミュレーションを用いた外挿(演繹)推定と機械学習を用いた内挿(帰納)推定の融合(シミュレーションの同化とDNN等を用いたエミュレーション)
オンライン学習

保護中: 強化学習の新展開(2)-深層学習を用いたアプローチ

デジタルトランスフォーメーション(DX)、人工知能(AI)、機械学習(ML)タスクに活用される深層強化学習を改善する7つの手法(初代のDQN,二重Q学習(二重DQN法),優先度付け経験再生,衝突Qネットワーク,分布強化学習(カテゴリDQN法)ノイズネットワーク,nステップ切断リターン)とアルファゼロについて
オンライン学習

保護中: 強化学習の新展開(1)-リスク指標を用いた強化学習

デジタルトランスフォーメーション(DX)、人工知能(AI)、機械学習(ML)タスクのためのリスク考慮型強化学習法でのさまざまなアプローチ(正規過程TD学習、RDPS法)と実装(モンテカルロ法、解析的手法)
オンライン学習

保護中: 部分観測マルコフ決定過程(2)POMDPのプランニング

デジタルトランスフォーメーション(DX)、人工知能(AI)、機械学習(ML)タスクのための強化学習、部分観測マルコフ決定過程のプランニング方法による最適方策の獲得
オンライン学習

保護中: 関数近似を用いた強化学習(3)- 方策関数の関数近似

このコンテンツはパスワードで保護されています。閲覧するには以下にパスワードを入力してください。 パスワード:
オンライン学習

保護中: 関数近似を用いた強化学習(2)- 価値関数の関数近似(オンライン学習の場合)

デジタルトランスフォーメーション(DX)、人工知能(AI)、機械学習(ML)タスクに活用される膨大な状態数での強化学習に対応する関数近似オンライン手法の理論(勾配TD学習法、最小二乗法に基づく最小二乗TD学習(LSTD)法、GTD2法)とLASSOによる正則化
アルゴリズム:Algorithms

機械学習プロフェッショナルシリーズ ベイズ深層学習 読書メモ

機械学習プロフェッショナルシリーズ ベイズ深層学習 読書メモ 機械学習プロフェッショナルシリーズ 「ベイズ深層学習 」より読書メモを記述する 前書き ベイズ深層学習の目指すところ 深層学習の課題 大...
最適化:Optimization

機械学習プロフェッショナルシリーズ スパース性に基づく機械学習 読書メモ

デジタルトランスフォーメーション(DX)、人工知能(AI)、機械学習(ML)タスクに活用される機械学習における正則化等に活用されるスパースモデリングの概要
タイトルとURLをコピーしました