python C51 (Categorical DQN)の概要とアルゴリズム及び実装例について
C51 (Categorical DQN)の概要
C51、またはCategorical DQN、は深層強化学習のアルゴリズムであり、価値関数を連続的な確率分布としてモデル化する手法となる。C51は、通常のDQN(D...
python
python
python
python
python
python
python
python
python
python