改善

アルゴリズム:Algorithms

保護中: 強化学習のPolicy Gradient手法の改善であるTRPO/PPOとDPG/DDPG

デジタルトランスフォーメーション(DX)、人工知能(AI)、機械学習(ML)タスクに活用される強化学習のPolicy Gradient手法の改善であるTRPO/PPOとDPG/DDPG(Pendulum、Actor Critic、SequentialMemory、Adam、keras-rl、TD誤差、Deep Deterministic Policy Gradient、Deterministic Policy Gradient、Advanced Actor Critic、A2C、A3C、Proximal Policy Optimization、Trust Region Policy Optimization、Python)
オンライン学習

保護中: ランダムネスに基づくオンライン予測

デジタルトランスフォーメーション(DX)、人工知能(AI)、機械学習(ML)タスクのためのオンライン予測性能改善のためのランダム性に基づくFPL(Follow the Perturbed Leader)戦略とガンベル分布
python

保護中: pythonとKerasによるテキストとシーケンスのためのDNN(3)リカレントニューラルネットワークの高度な使い方(GRU)

デジタルトランスフォーメーション(DX)、人工知能(AI)タスクに活用されるpyhton/kerasによるシーケンスデータのGRUによる分析とリカレントドロップアウト、リカレント層のスタッキングによる改善
タイトルとURLをコピーしました