機械学習:Machine Learning

オンライン学習

保護中: オンライン凸最適化(3)exp凹性とONS

デジタルトランスフォーメーション(DX)、人工知能(AI)、機械学習(ML)タスクのためのオンライン予測の為の凸最適化(exp凹性とONSのケース)
オンライン学習

保護中: オンライン凸最適化(2)正則化によるFTL戦略の補完

デジタルトランスフォーメーション(DX)、人工知能(AI)、機械学習(ML)タスクのためのオンライン予測における正則化技術(L2ノルム)の導入によるFTL戦略の補完
オンライン学習

保護中: オンライン凸最適化(1)FTL戦略とBTL補題

デジタルトランスフォーメーション(DX)、人工知能(AI)、機械学習(ML)タスクのためのオンライン予測でのオンライン凸最適化とFTL戦略とBTL補題
オンライン学習

保護中: 強化学習の新展開(2)-深層学習を用いたアプローチ

デジタルトランスフォーメーション(DX)、人工知能(AI)、機械学習(ML)タスクに活用される深層強化学習を改善する7つの手法(初代のDQN,二重Q学習(二重DQN法),優先度付け経験再生,衝突Qネットワーク,分布強化学習(カテゴリDQN法)ノイズネットワーク,nステップ切断リターン)とアルファゼロについて
life tips

禅の思想と歴史、大乗仏教、道の思想、キリスト教

禅の思想と歴史、大乗仏教、道の思想、キリスト教 禅(ぜん)は、仏教の一派である禅宗(ぜんしゅう)に由来する、主に中国・日本を中心に発展した仏教の一形態であり、また独自の修行法や哲学を持つ思想・実践の体系を指す。禅は、仏...
オンライン学習

保護中: 強化学習の新展開(1)-リスク指標を用いた強化学習

デジタルトランスフォーメーション(DX)、人工知能(AI)、機械学習(ML)タスクのためのリスク考慮型強化学習法でのさまざまなアプローチ(正規過程TD学習、RDPS法)と実装(モンテカルロ法、解析的手法)
オンライン学習

保護中: 部分観測マルコフ決定過程(2)POMDPのプランニング

デジタルトランスフォーメーション(DX)、人工知能(AI)、機械学習(ML)タスクのための強化学習、部分観測マルコフ決定過程のプランニング方法による最適方策の獲得
オンライン学習

保護中: 部分観測マルコフ決定過程(1)POMDPと信念MDPについて

デジタルトランスフォーメーション(DX)、人工知能(AI)、機械学習(ML)タスクに活用される部分観測マルコフ決定過程(POMDP)を用いたよりフレキシブルな強化学習、信念MDP
オンライン学習

保護中: 関数近似を用いた強化学習(3)- 方策関数の関数近似

このコンテンツはパスワードで保護されています。閲覧するには以下にパスワードを入力してください。 パスワード:
オンライン学習

保護中: 関数近似を用いた強化学習(2)- 価値関数の関数近似(オンライン学習の場合)

デジタルトランスフォーメーション(DX)、人工知能(AI)、機械学習(ML)タスクに活用される膨大な状態数での強化学習に対応する関数近似オンライン手法の理論(勾配TD学習法、最小二乗法に基づく最小二乗TD学習(LSTD)法、GTD2法)とLASSOによる正則化
タイトルとURLをコピーしました