最適腕識別

保護中: プレイヤーの行動の候補が膨大あるいは連続的な場合の最適腕バンディットとベイズ最適(1)

デジタルトランスフォーメーション(DX)、人工知能(AI)、機械学習(ML)タスクに活用されるプレイヤーの行動の候補が膨大あるいは連続的な場合の最適腕バンディットとベイズ最適(線形カール、線形バンディット、共分散関数、マターンカーネル、ガウスカーネル、正定値カーネル関数、ブロック行列、逆行列公式、事前同時確率密度、ガウス過程、リプシッツ連続、ユークリッドノルム、単純リグレット、ブラックボックス最適化、最適腕識別、リグレット、交差確認、leave-one-out交差確認、連続腕バンディット)

2023.04.21

アルゴリズム:Algorithmsグラフ理論スパースモデリングバンディッド問題ベイズ推定幾何学:Geometry微分積分:Calculus最適化:Optimization機械学習:Machine Learning確率・統計:Probability and Statistics線形代数:Linear Algebra

保護中: バンディット問題における最適腕識別とA/Bテスト(2)

デジタルトランスフォーメーション(DX)、人工知能(AI)、機械学習(ML)タスクに活用されるバンディット問題における最適腕識別とA/Bテスト(逐次削除方策、誤認識率、固定信頼度、固定予算、LUCB方策、UCB方策、最適腕、スコアに基づく方法、LCB、アルゴリズム、累積報酬最大化、最適腕識別の方策、ε-最適腕識別)

2023.03.09

アルゴリズム:Algorithmsグラフ理論スパースモデリングバンディッド問題幾何学:Geometry微分積分:Calculus最適化:Optimization機械学習:Machine Learning確率・統計:Probability and Statistics線形代数:Linear Algebra

保護中: バンディット問題における最適腕識別とA/Bテスト(1)

デジタルトランスフォーメーション(DX)、人工知能(AI)、機械学習(ML)タスクに活用されるバンディット問題における最適腕識別とA/Bテスト(ヘフディングの不等式、最適腕識別、標本複雑度、sample complexity、リグレット最小化、累積リグレット最小化、累積報酬最大化、ε-最適腕識別、単純リグレット最小化、ε-最適腕識別、ε-best arm identification、KL-UCB方策、KLダイバージェンス、正規分布のA/Bテスト、固定信頼度、fixed confidence)

2023.02.24

アルゴリズム:Algorithmsグラフ理論バンディッド問題幾何学:Geometry微分積分:Calculus最適化:Optimization機械学習:Machine Learning確率・統計:Probability and Statistics線形代数:Linear Algebra集合論:Set theory

保護中: バンディッド問題の概要と歴史と強化学習/オンライン学習との関係

デジタルトランスフォーメーション(DX)、人工知能(AI)、機械学習(ML)タスクに活用されるバンディッド問題の概要と歴史と強化学習/オンライン学習との関係(適応割り当て、逐次割り当て、確率的バンディット、敵対的バンディット、最適腕識別、Q学習、探索と知識利用のトレードオフ、リグレット)

2022.09.16

アルゴリズム:Algorithmsバンディッド問題強化学習機械学習:Machine Learning深層学習:Deep Learning