保護中: プランニング問題(1)-動的計画法を用いたアプローチと理論的裏付け

強化学習

2024.04.26 2022.01.17

AIシステム設計・意思決定構造の設計を専門としています。
Ontology・DSL・Behavior Treeによる判断の外部化、マルチエージェント構築に取り組んでいます。

Specialized in AI system design and decision-making architecture.
Focused on externalizing decision logic using Ontology, DSL, and Behavior Trees, and building multi-agent systems.

オンライン学習とオンライン予測あるいは強化学習について | Deus Ex Machina より:

2022年1月17日 4:55 AM

[…] プランニング問題(1)-動的計画法を用いたアプローチと理論的裏付け […]

返信
プランニング問題への動的計画法の実装(価値反復法と方策反復法) | Deus Ex Machina より:

2022年1月18日 4:17 AM

[…] ある環境内におけるエージェントが、現在の状態を観測し、取るべき行動を決定する問題を扱う機械学習である強化学習の参考図書である機械学習プロフェッショナルシリーズ「強化学習」より。前回は環境が既知の場合の逐次的意思決定問題であるプランニング問題の理論的概要について述べた。今回はプランニング問題の実際のアルゴリズムについて述べる。 […]

返信
様々な強化学習技術の理論とアルゴリズムとpythonによる実装 | Deus Ex Machina より:

2023年5月30日 5:06 AM

[…] プランニング問題(1)-動的計画法を用いたアプローチと理論的裏付け […]

返信