保護中: モデルフリー強化学習のpythonによる実装(3)経験を価値評価、戦略どちらの更新に利用するか:ValueベースvsPolicyベース

python

2024.06.28 2022.12.02

AIシステム設計・意思決定構造の設計を専門としています。
Ontology・DSL・Behavior Treeによる判断の外部化、マルチエージェント構築に取り組んでいます。

Specialized in AI system design and decision-making architecture.
Focused on externalizing decision logic using Ontology, DSL, and Behavior Trees, and building multi-agent systems.

深層強化学習の弱点の克服局所最適な行動/過学習への対応(1)模倣学習 | Deus Ex Machina より:

2023年5月29日 4:38 AM

[…] あるので、そのエキスパートを”モデルフリー強化学習のpythonによる実装(3)経験を価値評価、戦略どちらの更新に利用するか:ValueベースvsPolicyベース“で述べたQ-Learningのエージェン […]

返信
様々な強化学習技術の理論とアルゴリズムとpythonによる実装 | Deus Ex Machina より:

2023年7月12日 11:22 AM

[…] モデルフリー強化学習のpythonによる実装(3)経験を価値評価、戦略どちらの更新に利用するか:ValueベースvsPolicyベース […]

返信