深層学習:Deep Learning

python

TD3 (Twin Delayed Deep Deterministic Policy Gradient)の概要とアルゴリズム及び実装例

TD3 (Twin Delayed Deep Deterministic Policy Gradient)の概要 TD3(Twin Delayed Deep Deterministic Policy Gradien...
python

Deep RNNについて

Deep RNNについて Deep RNN(Deep Recurrent Neural Network)は、再帰型ニューラルネットワーク(RNN)の一種で、複数のRNN層を積み重ねたモデルとなる。Deep RNN...
python

Double Q-Learningの概要とアルゴリズム及び実装例について

Double Q-Learningの概要 Double Q-Learning(ダブルQ-ラーニング)は、"Q-学習の概要とアルゴリズム及び実装例について"で述べているQ-Learningの一種であり、強化学習のアル...
python

グラフニューラルネットワーク用いた反実仮想学習の概要と関連アルゴリズム及び実装例

グラフニューラルネットワーク用いた反実仮想学習の概要 グラフニューラルネットワーク(GNN)を用いた反実仮想学習(counterfactual learning)は、グラフ構造を持つデータに対して「もし〜だった...
python

Bidirectional RNN(BRNN)について

Bidirectional RNN(BRNN)について Bidirectional Recurrent Neural Network(BRNN)は、再帰型ニューラルネットワーク(RNN)の一種で、過去と未来の情報...
python

Trust Region Policy Optimization (TRPO)の概要とアルゴリズム及び実装例について

Trust Region Policy Optimization (TRPO)の概要 Trust Region Policy Optimization(TRPO)は、強化学習のアルゴリズムで、"ポリシー勾配法の概要...
python

GRUの概要とアルゴリズム及び実装例について

GRUの概要 GRU(Gated Recurrent Unit)は、"RNNの概要とアルゴリズム及び実装例について"で述べているリカレントニューラルネットワーク(RNN)の一種であり、系列データを処理するための深...
python

ドリフト検出ベースの逆強化学習(Drift-based Inverse Reinforcement Learning)の概要とアルゴリズム及び実装例について

ドリフト検出ベースの逆強化学習(Drift-based Inverse Reinforcement Learning)の概要 ドリフト検出ベースの逆強化学習(Drift-based Inverse Reinforc...
python

ベイジアンニューラルネットワークの概要とアルゴリズム及び実装例について

ベイジアンニューラルネットワークについて ベイジアンニューラルネットワーク(BNN)は、確率論的な要素をニューラルネットワークに統合するアーキテクチャであり、通常のニューラルネットワークが確定論的であるのに対し、BNN...
python

プロポーザルネットワークの概要とアルゴリズム及び実装例

プロポーザルネットワークの概要 プロポーザルネットワークは、主にコンピュータビジョンや画像処理の分野で使用されるニューラルネットワークの一種で、特に物体検出や領域提案(object proposal)のタスクで利用さ...
タイトルとURLをコピーしました