保護中: 関数近似を用いた強化学習(1) – 価値関数の関数近似(バッチ学習の場合)

強化学習

2025.01.07 2022.01.26

AIシステム設計・意思決定構造の設計を専門としています。
Ontology・DSL・Behavior Treeによる判断の外部化、マルチエージェント構築に取り組んでいます。

Specialized in AI system design and decision-making architecture.
Focused on externalizing decision logic using Ontology, DSL, and Behavior Trees, and building multi-agent systems.

オンライン学習とオンライン予測あるいは強化学習について | Deus Ex Machina より:

2022年1月26日 4:53 AM

[…] 関数近似を用いた強化学習(1)– 価値関数の関数近似(バッチ学習の場合) […]

返信
膨大な状態数での強化学習に対応する関数近似オンライン手法の理論 | Deus Ex Machina より:

2022年1月28日 5:13 AM

[…] 前回にひき続き、状態数が膨大であったり、状態空間が連続の場合に適用できる関数近似のアプローチの中で、今回は価値関数近似をオンライン学習に適用した場合について述べる。 […]

返信