保護中: ベイズ推論による機械学習入門 – イントロダクション アルゴリズム:Algorithms Twitter Facebook はてブ Pocket LINE コピー 2024.03.23 2021.05.14 このコンテンツはパスワードで保護されています。閲覧するには以下にパスワードを入力してください。 パスワード:
コメント
[…] 前回「ベイズ推論による機械学習入門(1)概要」で述べたように、通常の機械学習はデータそのものの推論を行うのに対して、強化学習では「報酬」という概念を組み合わせた時の期待値の計算を行う「意思決定推論」であることが最大の特徴となっている。意思決定は状態と呼ばれる現在の状況を表すものにもとづき行われ、その結果として報酬や新たしい状態を観察し、再び意思決定を行うということを繰り返すアルゴリズムとなる。 […]
[…] またこの戦略を機械学習という観点で見ると、強化学習やオンライン予測の枠組みの中で考えることができる。実際に、以前述べたように強化学習は、データそのものの水準である「期待値基準」(可能性を列挙し、それらの確率を考え、さの確率を使って平均値を計算して決めるた値)に対して、「報酬」という言う概念を組み合わせた時の値を計算する「意思決定論」をベースにした期待値を考えるものであり、それらの報酬を考える際にゲーム理論(二人が行うゲームを考えた時、相手が何をしてくるか確実なことは分からないのだから、それを確定することをやめて、自分がある行動を選んだ際に最低でもどれくらいの利益が保証されるか(保証水準)をベースに戦略を考える)をベースにした「サベージ基準」を報酬の計算に用いるものとなる。 […]
[…] ベイズ推論による機械学習入門(1) 概要 […]
[…] ここでリッジ回帰のもう一つの視点として階層ベイズモデルとの関係を考える。階層ベイズモデルでは、パラメータ{βj}と説明変数の値{x(j)}を仮定した時にyが生成される確率分布として以下のような正規分布を仮定する。 […]
[…] ベイズ推論による機械学習入門(1) 概要 […]