保護中: 強化学習の新展開(1)-リスク指標を用いた強化学習

オンライン学習

2024.07.05 2022.02.03

AIシステム設計・意思決定構造の設計を専門としています。
Ontology・DSL・Behavior Treeによる判断の外部化、マルチエージェント構築に取り組んでいます。

Specialized in AI system design and decision-making architecture.
Focused on externalizing decision logic using Ontology, DSL, and Behavior Trees, and building multi-agent systems.

オンライン学習とオンライン予測あるいは強化学習について | Deus Ex Machina より:

2022年2月3日 4:23 AM

[…] 強化学習の新展開(1)-リスク指標を用いた強化学習 […]

返信
部分観測マルコフ決定過程のプランニング方法による最適方策の獲得 | Deus Ex Machina より:

2022年2月3日 4:30 AM

[…] 次回は強化学習の新展開としてリターン分布に基づく分布強化学習について述べる。 […]

返信
深層強化学習を改善する7つの手法とアルファゼロについて | Deus Ex Machina より:

2022年6月20日 1:34 PM

[…] 前回までで強化学習の新展開としてリターン分布に基づく分布強化学習について述べた。今回は深層モデルを利用する強化学習は深層強化学習(deep reinforcement learning)と呼ばれる。近年テ […]

返信