python

python

Thompson Samplingアルゴリズムの概要と実装例

Thompson Samplingアルゴリズムについて "UCB(Upper Confidence Bound)アルゴリズムの概要と実装例"で述べたUCBアルゴリズムは頻度論の考え方に基づき、各アームから得られた報...
python

ResNet (Residual Network)について

ResNet (Residual Network)について ResNetは、2015年にKaiming Heらによって提案された"CNNの概要とアルゴリズム及び実装例について"でも述べている深層畳み込みニューラルネッ...
python

アンサンブル学習の概要とアルゴリズム及び実装例について

アンサンブル学習について アンサンブル学習(Ensemble Learning)は、機械学習の一種で、複数の機械学習モデルを組み合わせて、より強力な予測モデルを構築する手法となる。単一のモデルよりも複数のモデルを組み合わ...
python

マルコフ決定過程(MDP)の概要とアルゴリズム及び実装例について

マルコフ決定過程(MDP)の概要 マルコフ決定過程(MDP、Markov Decision Process)は、強化学習における数学的なフレームワークであり、エージェントが状態と行動に関連付けられた報酬を受け取る環...
python

DenseNetについて

DenseNetについて DenseNet(Densely Connected Convolutional Network)は、2017年にGao Huang、Zhuang Liu、Kilian Q. Weinber...
python

LSTMの概要とアルゴリズム及び実装例について

LSTM(Long Short-Term Memory)について LSTM(Long Short-Term Memory)は、再帰型ニューラルネットワーク(RNN)の一種であり、主に時系列データや自然言語処理(N...
python

モデル予測制御(Model Predictive Control, MPC)の概要とアルゴリズム及び実装例について

モデル予測制御(Model Predictive Control, MPC)の概要 モデル予測制御(Model Predictive Control, MPC)は、制御理論の一手法であり、制御対象のモデルを使用して将来の...
python

ε-グリーディ法(ε-greedy)の概要とアルゴリズム及び実装例について

ε-グリーディ法(ε-greedy)の概要 ε-グリーディ法(ε-greedy)は、強化学習などの探索と活用(exploitationとexploration)のトレードオフを取り扱うためのシンプルで効果的な戦略で...
python

Exponential Smoothingの概要とアルゴリズム及び実装例について

Exponential Smoothingについて 指数平滑法(Exponential Smoothing)は、時系列データの予測やデータの平滑化に使用される統計的手法の一つであり、特に、過去の観測値を基に未...
python

Q-学習の概要とアルゴリズム及び実装例について

Q-学習について Q-学習(Q-Learning)は、強化学習の一種で、エージェントが未知の環境を探索しながら最適な行動を学習するためのアルゴリズムとなる。Q-学習は、エージェントが行動価値関数(Q関数)を学習し、...
タイトルとURLをコピーしました