強化学習 | ページ 5 | Deus Ex Machina

ReAct(Reasoning and Acting)の概要とその実装例について

ReAct(Reasoning and Acting)の概要 ReActは"プロンプトエンジニアリングの概要とその利用について"で述べているプロンプトエンジニアリングの手法の一つであり、"LangChainにおけるA...

2024.03.24

アルゴリズム:Algorithmsマルチエージェントシステム強化学習機械学習:Machine Learning深層学習:Deep Learning自然言語処理:Natural Language Processing

イントロダクション大規模言語モデルのファインチューニングとは、事前に大規模なデータセットで訓練されたモデルに対して、追加の学習を行うもので、汎用性の高いモデルを特定のタスクやドメインに適用することを可能にし、精度や...

2024.03.21

Large-Scaleデータアルゴリズム:Algorithms強化学習機械学習:Machine Learning深層学習:Deep Learning自然言語処理:Natural Language Processing

A3C (Asynchronous Advantage Actor-Critic)の概要 A3C（Asynchronous Advantage Actor-Critic）は、深層強化学習のアルゴリズムの一種で、非同...

2024.03.08

pythonアルゴリズム:Algorithms強化学習機械学習:Machine Learning深層学習:Deep Learning

Proximal Policy Optimization (PPO)の概要 Proximal Policy Optimization（PPO）は、強化学習のアルゴリズムの一種であり、ポリシー最適化法の一つであり、"...

2024.03.01

pythonアルゴリズム:Algorithms強化学習機械学習:Machine Learning深層学習:Deep Learning

Soft Actor-Critic (SAC) の概要 Soft Actor-Critic（SAC）は、強化学習（Reinforcement Learning）のアルゴリズムの一種で、主に連続行動空間を持つ問題に対...

2024.02.23

pythonアルゴリズム:Algorithms強化学習機械学習:Machine Learning深層学習:Deep Learning

Deep Q-Network (DQN)の概要 Deep Q-Network（DQN）は、ディープラーニングとQ-Learningを組み合わせた手法で、Q関数をニューラルネットワークで近似することによって、高次元の...

2024.02.16

pythonアルゴリズム:Algorithms強化学習機械学習:Machine Learning深層学習:Deep Learning

イントロダクション AlphaGo（アルファ碁）は、Google DeepMindによって開発されたコンピュータ囲碁プログラムで、2015年10月に、人間のプロ囲碁棋士を互先（ハンディキャップなし）で破った初のコン...

2024.02.10

アルゴリズム:Algorithmsオンライン学習ゲームコンピューターシミュレーション強化学習機械学習:Machine Learning深層学習:Deep Learning

Dueling DQNの概要 Dueling DQN（Dueling Deep Q-Network）は、強化学習においてQ学習をベースとしたアルゴリズムであり、価値ベースの強化学習アルゴリズムの一種となる。Duel...

2024.02.09

pythonアルゴリズム:Algorithms強化学習機械学習:Machine Learning深層学習:Deep Learning

Prioritized Experience Replayの概要 Prioritized Experience Replay（PER）は、"Deep Q-Network (DQN)の概要とアルゴリズムおよび実装例に...

2024.02.02

アルゴリズム:Algorithms強化学習機械学習:Machine Learning深層学習:Deep Learning

C51 (Categorical DQN)の概要 C51、またはCategorical DQN、は深層強化学習のアルゴリズムであり、価値関数を連続的な確率分布としてモデル化する手法となる。C51は、通常のDQN（D...

2024.01.12

pythonアルゴリズム:Algorithms強化学習機械学習:Machine Learning深層学習:Deep Learning