幾何学:Geometry

アルゴリズム:Algorithms

保護中: 強化学習のPolicy Gradient手法の改善であるTRPO/PPOとDPG/DDPG

デジタルトランスフォーメーション(DX)、人工知能(AI)、機械学習(ML)タスクに活用される強化学習のPolicy Gradient手法の改善であるTRPO/PPOとDPG/DDPG(Pendulum、Actor Critic、SequentialMemory、Adam、keras-rl、TD誤差、Deep Deterministic Policy Gradient、Deterministic Policy Gradient、Advanced Actor Critic、A2C、A3C、Proximal Policy Optimization、Trust Region Policy Optimization、Python)
Clojure

保護中: Clojureでのk-meansを使ったテキスト文書間の類似性の尺度を使った推薦システム

デジタルトランスフォーメーション(DX)、人工知能(AI)、機械学習(ML)タスクに活用されるClojureでのk-meansを使ったテキスト文書間の類似性の尺度を使った推薦システム(Slope One推薦、トップ・レーティング計算、加重評価、ペアアイテムの平均差、Weighted Slope One、ユーザーベース推薦、協調フィルタリング、アイテムベース推薦、映画推薦データ)
アルゴリズム:Algorithms

保護中: スパース学習モデルのための L1ノルム正則化のための最適化手法

デジタルトランスフォーメーション(DX)、人工知能(AI)、機械学習(ML)タスクに活用するためのスパース学習モデルのための L1ノルム正則化のための最適化手法(近接勾配法、forward-backward splitting、iterative-shrinkage threshholding(IST)、加速付き近接勾配法、アルゴリズム、prox作用素、正則化項、微分可能、二乗誤差関数、ロジスティック損失関数、繰り返し重み付き縮小法、凸共役、へシアン行列、最大固有値、2階微分可能、ソフト閾値関数、L1ノルム、L2ノルム、リッジ正則化項、η-トリック)
アルゴリズム:Algorithms

保護中: バンディット問題における最適腕識別とA/Bテスト(2)

デジタルトランスフォーメーション(DX)、人工知能(AI)、機械学習(ML)タスクに活用されるバンディット問題における最適腕識別とA/Bテスト(逐次削除方策、誤認識率、固定信頼度、固定予算、LUCB方策、UCB方策、最適腕、スコアに基づく方法、LCB、アルゴリズム、累積報酬最大化、最適腕識別の方策、ε-最適腕識別)
アルゴリズム:Algorithms

保護中: 統計数学理論によるブースティング

デジタルトランスフォーメーション(DX)、人工知能(AI)、機械学習(ML)タスクに活用される統計数学理論によるブースティング(一般化線型モデル、修正ニュートン法、対数尤度、重み付き最小2乗法、ブースティング、座標降下法、反復重み付け最小2乗法、iteratively reweighted least square method、IRLS method、重み付き経験判別誤差、パラメータ更新則、へシアン行列、補正ニュートン法、modified Newton method、ニュートン法、Newton method、リンク関数、ロジスティック損失、logistic loss、ブースティング・アルゴリズム、ロジットブースト、指数損失、凸マージン損失、アダブースト、弱仮説、経験マージン損失、非線形最適化)
アルゴリズム:Algorithms

保護中: ベイズ推論による機械学習の例:ポアソン混合モデルの崩壊型ギブスサンプリングによる推論

デジタルトランスフォーメーション(DX)、人工知能(AI)、機械学習(ML)タスクに活用されるベイズ推論による機械学習の例としてのポアソン混合モデルの崩壊型ギブスサンプリングによる推論(変分推論、ギブスサンプリング、人工データでの評価、アルゴリズム、事前分布、ガンマ分布、ベイズの定理、ディリクレ分布、カテゴリ分布、グラフィカルモデル)
アルゴリズム:Algorithms

保護中: 強化学習に対するニューラルネットワークの適用 戦略に深層学習を適用する:Advanced Actor Critic(A2C)

デジタルトランスフォーメーション(DX)、人工知能(AI)、機械学習(ML)タスクに活用される強化学習に対するニューラルネットワークの適用 戦略に深層学習を適用するAdvanced Actor Critic(A2C)の実装(Policy Gradient手法、Q-learning、Gumbel Max Trix、A3C(Asynchronous Advantage Actor Critic))
アルゴリズム:Algorithms

保護中: バンディット問題における最適腕識別とA/Bテスト(1)

デジタルトランスフォーメーション(DX)、人工知能(AI)、機械学習(ML)タスクに活用されるバンディット問題における最適腕識別とA/Bテスト(ヘフディングの不等式、最適腕識別、標本複雑度、sample complexity、リグレット最小化、累積リグレット最小化、累積報酬最大化、ε-最適腕識別、単純リグレット最小化、ε-最適腕識別、ε-best arm identification、KL-UCB方策、KLダイバージェンス、正規分布のA/Bテスト、固定信頼度、fixed confidence)
アルゴリズム:Algorithms

保護中: 統計数学理論によるν-サポートベクトルマシンの概要

デジタルトランスフォーメーション(DX)、人工知能(AI)、機械学習(ML)タスクに活用される統計数学理論によるν-サポートベクトルマシンの概要(カーネル関数、有界性、経験マージン判別誤差、バイアス項なしモデル、再生核ヒルベルト空間、予測判別誤差、一様バウンド、統計的一致性、C-サポートベクトルマシン、対応関係、統計モデルの自由度、双対問題、勾配降下、最小距離問題、判別境界、幾何学的解釈、2値判別、経験マージン判別誤差、経験判別誤差、正則化パラメータ、ミニマックス定理、グラム行列、ラグランジュ関数)
アルゴリズム:Algorithms

保護中: バッチ型確率的最適化の分散処理としての確率的座標降下法

デジタルトランスフォーメーション(DX)、人工知能(AI)、機械学習(ML)タスクに活用されるバッチ型確率的最適化の分散処理としての確率的座標降下法(COCOA、収束レート、SDCA、γf-平滑、部分問題の近似解、確率的座標降下法、並列確率的座標降下法、並列計算処理、Communication-Efficient Coordinate Ascent、双対座標降下法)
タイトルとURLをコピーしました