AIシステム設計・意思決定構造の設計を専門としています。
Ontology・DSL・Behavior Treeによる判断の外部化、マルチエージェント構築に取り組んでいます。
Specialized in AI system design and decision-making architecture.
Focused on externalizing decision logic using Ontology, DSL, and Behavior Trees, and building multi-agent systems.

コメント
[…] 強化学習の新展開(1)-リスク指標を用いた強化学習 […]
[…] 次回は強化学習の新展開としてリターン分布に基づく分布強化学習について述べる。 […]
[…] 前回までで強化学習の新展開としてリターン分布に基づく分布強化学習について述べた。今回は深層モデルを利用する強化学習は深層強化学習(deep reinforcement learning)と呼ばれる。近年テ […]