幾何学:Geometry

アルゴリズム:Algorithms

保護中: 深層強化学習の弱点の克服 局所最適な行動/過学習への対応(1)模倣学習

このコンテンツはパスワードで保護されています。閲覧するには以下にパスワードを入力してください。 パスワード:
python

保護中: 深層強化学習の弱点の克服 再現性の低さへの対応:進化戦略

このコンテンツはパスワードで保護されています。閲覧するには以下にパスワードを入力してください。 パスワード:
python

バンディット問題の概要と適用事例及び実装例

  概要 バンディット問題(Bandit problem)は、強化学習の一種であり、意思決定を行うエージェントが未知の環境において、どの行動を選択するかを学習する問題となる。この問題は、複数の行動の中から最適な行動を選...
アルゴリズム:Algorithms

保護中: バンディット手法の応用(3)推薦システム

このコンテンツはパスワードで保護されています。閲覧するには以下にパスワードを入力してください。 パスワード:
アルゴリズム:Algorithms

保護中: バンディット手法の応用(2)インターネット広告

このコンテンツはパスワードで保護されています。閲覧するには以下にパスワードを入力してください。 パスワード:
アルゴリズム:Algorithms

保護中: バンディット手法の応用(1)モンテカルロ木探索

このコンテンツはパスワードで保護されています。閲覧するには以下にパスワードを入力してください。 パスワード:
アルゴリズム:Algorithms

保護中: バンディット問題の拡張としての部分観測問題について

このコンテンツはパスワードで保護されています。閲覧するには以下にパスワードを入力してください。 パスワード:
アルゴリズム:Algorithms

保護中: バンディッド問題の拡張としての時間変化のあるバンディット問題と比較バンディット

デジタルトランスフォーメーション(DX)、人工知能(AI)、機械学習(ML)タスクに活用されるバンディッド問題の拡張としての時間変化のあるバンディット問題と比較バンディット(RMED方策、コンドルセ勝者、経験ダイバージェンス、大偏差原理、ボルダ勝者、コープラン勝者、トンプソン抽出、弱リグレット、全順序の仮定、睡眠型バンディット、滅亡型バンディット、非休止型バンディット、割引UCB方策、UCB方策、敵対的バンディット、Exp3方策、LinUCB、文脈付きバンディット)
python

マルチタスク学習の概要と適用事例と実装例

マルチタスク学習の概要 マルチタスク学習(Multi-Task Learning)は、複数の関連するタスクを同時に学習する機械学習の手法となる。通常、個々のタスクは異なるデータセットや目的関数を持っているが...
アルゴリズム:Algorithms

保護中: アトミックノルムによるスパース機械学習の数学的性質と最適化

デジタルトランスフォーメーション(DX)、人工知能(AI)、機械学習(ML)タスクに活用されるアトミックノルムによるスパース機械学習の数学的性質と最適化(L∞ノルム、双対問題、ロバスト主成分分析、前景画像抽出、低ランク行列、スパース行列、ラグランジュ乗数、補助変数、拡張ラグランジュ関数、指示関数、スペクトルノルム、ロバスト主成分分析、フランク・ウォルフェ法、双対における交互乗数法、L1ノルム制約付き二乗回帰問題、正則化パラメータ、経験誤差、曲率パラメータ、アトミックノルム、prox作用素、凸包、ノルムの等価性、双対ノルム)
タイトルとURLをコピーしました