深層学習:Deep Learning

python

逆強化学習の概要とアルゴリズム及び実装例について

逆強化学習の概要について 逆強化学習(Inverse Reinforcement Learning, IRL)は、強化学習の一種で、エキスパートの行動データからエキスパートの意思決定の背後にある報酬関数を学習するタ...
python

Stacked RNNについて

Stacked RNNについて Stacked RNN(スタックされた再帰型ニューラルネットワーク)は、"RNNの概要とアルゴリズム及び実装例について"でも述べている再帰型ニューラルネットワーク(RNN)の一種で...
IOT技術:IOT Technology

音声認識や画像認識、自然言語処理や生体情報分析による感情の抽出

イントロダクション 感情認識の為のモデルは"感情認識と仏教哲学とAIについて"で述べているように様々なモデルかぜ提案されている。また、音声認識、画像認識、自然言語処理、生体情報分析等のAI技術による感情の抽出も数多く...
python

TD3 (Twin Delayed Deep Deterministic Policy Gradient)の概要とアルゴリズム及び実装例

TD3 (Twin Delayed Deep Deterministic Policy Gradient)の概要 TD3(Twin Delayed Deep Deterministic Policy Gradien...
python

Deep RNNについて

Deep RNNについて Deep RNN(Deep Recurrent Neural Network)は、再帰型ニューラルネットワーク(RNN)の一種で、複数のRNN層を積み重ねたモデルとなる。Deep RNN...
python

Double Q-Learningの概要とアルゴリズム及び実装例について

Double Q-Learningの概要 Double Q-Learning(ダブルQ-ラーニング)は、"Q-学習の概要とアルゴリズム及び実装例について"で述べているQ-Learningの一種であり、強化学習のアル...
python

グラフニューラルネットワーク用いた反実仮想学習の概要と関連アルゴリズム及び実装例

グラフニューラルネットワーク用いた反実仮想学習の概要 グラフニューラルネットワーク(GNN)を用いた反実仮想学習(counterfactual learning)は、グラフ構造を持つデータに対して「もし〜だった...
python

Bidirectional RNN(BRNN)について

Bidirectional RNN(BRNN)について Bidirectional Recurrent Neural Network(BRNN)は、再帰型ニューラルネットワーク(RNN)の一種で、過去と未来の情報...
python

Trust Region Policy Optimization (TRPO)の概要とアルゴリズム及び実装例について

Trust Region Policy Optimization (TRPO)の概要 Trust Region Policy Optimization(TRPO)は、強化学習のアルゴリズムで、"ポリシー勾配法の概要...
python

GRUの概要とアルゴリズム及び実装例について

GRUの概要 GRU(Gated Recurrent Unit)は、"RNNの概要とアルゴリズム及び実装例について"で述べているリカレントニューラルネットワーク(RNN)の一種であり、系列データを処理するための深...
タイトルとURLをコピーしました