スパースモデリング

Protected: Bayesian inference by variational and collapsed Gibbs sampling of Gaussian mixture models

Bayesian inference with variational and collapsed Gibbs sampling of Gaussian mixture models utilized in digital transformation, artificial intelligence, and machine learning tasks inference algorithms, analytic integral approximation, complex models, Gauss-Wishart distribution, clustering, multi-dimensional Student's t-distribution, categorical distribution, Poisson mixture models, Dirichlet distribution, approximate posterior distribution, latent variables

2023.04.03

アルゴリズム:Algorithmsグラフ理論スパースモデリングベイズ推定幾何学:Geometry微分積分:Calculus最適化:Optimization機械学習:Machine Learning確率・統計:Probability and Statistics線形代数:Linear Algebra

Protected: Value Assessment and Policy and Weaknesses in Deep Reinforcement Learning

Value assessment and strategies and weaknesses in deep reinforcement learning used for digital transformation, artificial intelligence, and machine learning tasks poor sample efficiency, difficulty in validating methods as well, impact of implementation practices on performance, library initial values, poor reproducibility, over-training, local optimum, dexterity, TRPO, PPO, continuous value control, image control, policy-based, value-based

2023.03.30

アルゴリズム:Algorithmsグラフ理論スパースモデリング幾何学:Geometry強化学習微分積分:Calculus最適化:Optimization機械学習:Machine Learning深層学習:Deep Learning確率・統計:Probability and Statistics線形代数:Linear Algebra

Protected: Linear Bandit, Contextual Bandit, Linear Bandit Problem with LinUCB Policies

Linear Bandit, Contextual Bandit, LineUCB policy for linear bandit problems (Riglet, algorithm, least squares quantification, LinUCB score, reward expectation, point estimate, knowledge) utilized in digital transformation, artificial intelligence, machine learning tasks utilization-oriented measures, search-oriented measures, Woodbury's formula, LinUCB measures, LinUCB policy, contextual bandit, website optimization, maximum sales expectation, bandit optimal budget allocation)

2023.03.24

アルゴリズム:Algorithmsグラフ理論スパースモデリングバンディッド問題幾何学:Geometry強化学習微分積分:Calculus最適化:Optimization機械学習:Machine Learning確率・統計:Probability and Statistics線形代数:Linear Algebra

Protected: Evaluation of Rademacher Complexity and Prediction Discrimination Error in Multi-Valued Discrimination Using Statistical Mathematics Theory

Rademacher Complexity and Prediction Discriminant Error in Multivalued Discrimination by Statistical Mathematics Theory Used in Digital Transformation, Artificial Intelligence and Machine Learning Tasks Convex quadratic programming problems, mathematical programming, discriminant machines, prediction discriminant error, Bayesian error, multilevel support vector machines, representation theorem,. Rademacher complexity, multilevel marginals, regularization terms, empirical loss, reproducing nuclear Hilbert spaces, norm constraints, Lipschitz continuity, predictive Φp-multilevel marginals loss, empirical Φ-multilevel marginals loss, uniform bounds, discriminant functions, discriminant

2023.03.23

アルゴリズム:Algorithmsグラフ理論スパースモデリング幾何学:Geometry微分積分:Calculus最適化:Optimization機械学習:Machine Learning確率・統計:Probability and Statistics線形代数:Linear Algebra

Protected: Two-Pair Extended Lagrangian and Two-Pair Alternating Direction Multiplier Methods as Optimization Methods for L1-Norm Regularization

Optimization methods for L1 norm regularization in sparse learning utilized in digital transformation, artificial intelligence, and machine learning tasks FISTA, SpaRSA, OWLQN, DL methods, L1 norm, tuning, algorithms, DADMM, IRS, and Lagrange multiplier, proximity point method, alternating direction multiplier method, gradient ascent method, extended Lagrange method, Gauss-Seidel method, simultaneous linear equations, constrained norm minimization problem, Cholesky decomposition, alternating direction multiplier method, dual extended Lagrangian method, relative dual gap, soft threshold function, Hessian matrix

2023.03.22

アルゴリズム:Algorithmsグラフ理論スパースモデリングスパースモデリング幾何学:Geometry微分積分:Calculus最適化:Optimization機械学習:Machine Learning確率・統計:Probability and Statistics線形代数:Linear Algebra集合論:Set theory

Protected: Confidence Region Methods in Sequential Optimization in Machine Learning

Confidence region methods (dogleg method, norm constraint, model function optimization, approximate solution of subproblems, modified Newton method, search direction, globally optimal solution, Newton method, steepest descent method, confidence region radius, confidence region, descent direction, step width) in continuous optimization in machine learning used for digital transformation, artificial intelligence, machine learning tasks.

2023.03.20

アルゴリズム:Algorithmsグラフ理論スパースモデリング幾何学:Geometry微分積分:Calculus最適化:Optimization機械学習:Machine Learning確率・統計:Probability and Statistics線形代数:Linear Algebra

Recommendation Technology

Recommendation Technology Overview Recommendation technology using machine learning can analyze a user's pa...

2023.03.19

アルゴリズム:Algorithmsグラフ理論スパースモデリング幾何学:Geometry微分積分:Calculus推薦技術最適化:Optimization機械学習:Machine Learning確率・統計:Probability and Statistics線形代数:Linear Algebra

Protected: TRPO/PPO and DPG/DDPG, an improvement of the Policy Gradient method of reinforcement learning

TRPO/PPO and DPG/DDPG (Pendulum, Actor Critic, SequentialMemory, SequentialMemory, and SequentialMemory), which are improvements of Policy Gradient methods of reinforcement learning used for digital transformation, artificial intelligence, and machine learning tasks. Adam, keras-rl, TD error, Deep Deterministic Policy Gradient, Deterministic Policy Gradient, Advanced Actor Critic, A2C, A3C, Proximal Policy Optimization, Trust Region Policy Optimization, Python)

2023.03.16

アルゴリズム:Algorithmsグラフ理論スパースモデリング幾何学:Geometry強化学習微分積分:Calculus最適化:Optimization機械学習:Machine Learning深層学習:Deep Learning確率・統計:Probability and Statistics線形代数:Linear Algebra

Protected: Optimization methods for L1-norm regularization for sparse learning models

Optimization methods for L1-norm regularization for sparse learning models for use in digital transformation, artificial intelligence, and machine learning tasks (proximity gradient method, forward-backward splitting, iterative- shrinkage threshholding (IST), accelerated proximity gradient method, algorithm, prox operator, regularization term, differentiable, squared error function, logistic loss function, iterative weighted shrinkage method, convex conjugate, Hessian matrix, maximum eigenvalue, second order differentiable, soft threshold function, L1 norm, L2 norm, ridge regularization term, η-trick)

2023.03.10

アルゴリズム:Algorithmsグラフ理論スパースモデリングスパースモデリング幾何学:Geometry微分積分:Calculus最適化:Optimization機械学習:Machine Learning確率・統計:Probability and Statistics線形代数:Linear Algebra

Protected: Optimal arm identification and AB testing in the bandit problem_2

Optimal arm identification and AB testing in bandit problems utilized in digital transformation, artificial intelligence, and machine learning tasks sequential deletion policy, false positive rate, fixed confidence, fixed budget, LUCB policy, UCB policy, optimal arm, score-based method, LCB, algorithm, cumulative reward maximization, optimal arm identification policy, ε-optimal arm identification

2023.03.09

アルゴリズム:Algorithmsグラフ理論スパースモデリングバンディッド問題幾何学:Geometry微分積分:Calculus最適化:Optimization機械学習:Machine Learning確率・統計:Probability and Statistics線形代数:Linear Algebra