機械学習:Machine Learning

python

フィッシャー情報行列の概要と関連アルゴリズム及び実装例について

フィッシャー情報行列の概要 フィッシャー情報行列(Fisher information matrix)は、統計学と情報理論の分野で使用される概念であり、確率分布に関する情報を提供する行列となる。この行列は、統計モデルのパ...
python

Double Q-Learningの概要とアルゴリズム及び実装例について

Double Q-Learningの概要 Double Q-Learning(ダブルQ-ラーニング)は、"Q-学習の概要とアルゴリズム及び実装例について"で述べているQ-Learningの一種であり、強化学習のアル...
python

グラフニューラルネットワーク用いた反実仮想学習の概要と関連アルゴリズム及び実装例

グラフニューラルネットワーク用いた反実仮想学習の概要 グラフニューラルネットワーク(GNN)を用いた反実仮想学習(counterfactual learning)は、グラフ構造を持つデータに対して「もし〜だった...
python

Bidirectional RNN(BRNN)について

Bidirectional RNN(BRNN)について Bidirectional Recurrent Neural Network(BRNN)は、再帰型ニューラルネットワーク(RNN)の一種で、過去と未来の情報...
アルゴリズム:Algorithms

フロベニウスノルムの概要とアルゴリズム及び実装例

フロベニウスノルムの概要 フロベニウスノルムは、行列のノルムの一種であり、行列の要素の2乗和の平方根として定義されるものとなる。これは、行列 \( A \) のフロベニウスノルム \( ||A||_F \...
python

Kronecker-factored Approximate Curvature(K-FAC)行列の概要と関連するアルゴリズム及び実装例について

Kronecker-factored Approximate Curvature(K-FAC)行列の概要 Kronecker-factored Approximate Curvature(K-FAC)は、機械学習の最適化...
python

Trust Region Policy Optimization (TRPO)の概要とアルゴリズム及び実装例について

Trust Region Policy Optimization (TRPO)の概要 Trust Region Policy Optimization(TRPO)は、強化学習のアルゴリズムで、"ポリシー勾配法の概要...
アルゴリズム:Algorithms

有向非巡回グラフの適用事例と実装例およびブロックチェーン技術について

イントロダクション 有向非巡回グラフ(Directed Acyclic Graph, DAG)は、様々なタスクの自動管理、あるいはコンパイラ等の処理など様々な場面で登場するグラフデータアルゴリズムとなる。今回は、...
python

トレースノルムの概要と関連アルゴリズム及び実装例について

トレースノルムの概要 トレースノルム(または核ノルム)は、行列のノルムの一種であり、行列の特異値の和として定義されるものとなる。これは特に、行列の低ランク近似や行列の最小化問題において重要な役割を果たして...
python

GRUの概要とアルゴリズム及び実装例について

GRUの概要 GRU(Gated Recurrent Unit)は、"RNNの概要とアルゴリズム及び実装例について"で述べているリカレントニューラルネットワーク(RNN)の一種であり、系列データを処理するための深...
タイトルとURLをコピーしました