AIシステム設計・意思決定構造の設計を専門としています。
Ontology・DSL・Behavior Treeによる判断の外部化、マルチエージェント構築に取り組んでいます。
Specialized in AI system design and decision-making architecture.
Focused on externalizing decision logic using Ontology, DSL, and Behavior Trees, and building multi-agent systems.

コメント
[…] モデルベース型の強化学習 – スパースサンプリング、UCT、モンテカルロ探索木 […]
[…] 次回は、環境モデルを陽に推定し、推定した環境モデルを用いて方策を求めるモデルベース型の強化学習について述べる。 […]
[…] 前回は環境モデルを陽に推定し、推定した環境モデルを用いて方策を求めるモデルベース型の強化学習について述べた。今回は、状態数が膨大であったり、状態空間が連続の場合、これまでの状態ごとに値を持つようなテーブル形式の関数ではテーブルの要素が大きくなりすぎて学習が困難となる。ここでは、価値関数や方策関数を関数近似器を用いて近似して学習することについて述べる。 […]
[…] モデルベース型の強化学習 – スパースサンプリング、UCT、モンテカルロ探索木 […]