深層学習:Deep Learning

python

GPTの概要とアルゴリズム及び実装例について

GPTの概要 GPT(Generative Pre-trained Transformer)は、オープンAIが開発した自然言語処理のための事前学習モデルであり、Transformerアーキテクチャを基にして、大規模な...
python

Proximal Policy Optimization (PPO)の概要とアルゴリズム及び実装例について

Proximal Policy Optimization (PPO)の概要 Proximal Policy Optimization(PPO)は、強化学習のアルゴリズムの一種であり、ポリシー最適化法の一つであり、"...
アルゴリズム:Algorithms

EfficientDetの概要とアルゴリズム及び実装例について

EfficientDetについて EfficientDetは、物体検出タスクにおいて高い性能を持つコンピュータビジョンモデルの一つとなる。EfficientDetは、モデルの効率性と精度のバランスを取るために設計され...
python

Soft Actor-Critic (SAC) の概要とアルゴリズム及び実装例

Soft Actor-Critic (SAC) の概要 Soft Actor-Critic(SAC)は、強化学習(Reinforcement Learning)のアルゴリズムの一種で、主に連続行動空間を持つ問題に対...
アルゴリズム:Algorithms

Mask R-CNNの概要とアルゴリズム及び実装例について

Mask R-CNNについて Mask R-CNN(Mask Region-based Convolutional Neural Network)は、物体検出と物体セグメンテーション(インスタンスセグメンテーション)...
python

サブワードレベルのトークン化について

サブワードレベルのトークン化について サブワードレベルのトークン化は、テキストデータを単語よりも小さなサブワード(部分単語)に分割する自然言語処理(NLP)のアプローチとなる。これは、文の意味を理解しやすくし、語...
python

Deep Q-Network (DQN)の概要とアルゴリズムおよび実装例について

Deep Q-Network (DQN)の概要 Deep Q-Network(DQN)は、ディープラーニングとQ-Learningを組み合わせた手法で、Q関数をニューラルネットワークで近似することによって、高次元の...
アルゴリズム:Algorithms

ボードゲームとAI “アルファ碁はなぜ人間に勝てたのか” 読書メモ

イントロダクション AlphaGo(アルファ碁)は、Google DeepMindによって開発されたコンピュータ囲碁プログラムで、2015年10月に、人間のプロ囲碁棋士を互先(ハンディキャップなし)で破った初のコン...
python

Dueling DQNの概要とアルゴリズム及び実装例について

Dueling DQNの概要 Dueling DQN(Dueling Deep Q-Network)は、強化学習においてQ学習をベースとしたアルゴリズムであり、価値ベースの強化学習アルゴリズムの一種となる。Duel...
アルゴリズム:Algorithms

Prioritized Experience Replayの概要とアルゴリズム及び実装例について

Prioritized Experience Replayの概要 Prioritized Experience Replay(PER)は、"Deep Q-Network (DQN)の概要とアルゴリズムおよび実装例に...
タイトルとURLをコピーしました