2024-03

Large-Scaleデータ

大規模言語モデルのファインチューニングとRLHF(Reinforcement Learning from Human Feedback)

イントロダクション 大規模言語モデルのファインチューニングとは、事前に大規模なデータセットで訓練されたモデルに対して、追加の学習を行うもので、汎用性の高いモデルを特定のタスクやドメインに適用することを可能にし、精度や...
アルゴリズム:Algorithms

グラフニューラルネットワーク

グラフニューラルネットワークの特徴と適用事例 "グラフデータ処理アルゴリズムと機械学習/人工知能タスクへの応用"でも述べているグラフデータとは、頂点(ノード)とそれらを結ぶ辺(エッジ)からなるデータ構造を指す。これ...
python

SentencePieceの概要とアルゴリズム及び実装例について

SentencePieceについて SentencePieceは、テキストデータのトークン化(分割)を行うためのオープンソースのライブラリおよびツールキットとなる。SentencePieceは、特に異なる言語や文...
python

Alternating Least Squares for Tensor Factorization (ALS-TF)の概要とアルゴリズム及び実装例について

Alternating Least Squares for Tensor Factorization (ALS-TF)の概要 Alternating Least Squares for Tensor Factorizat...
python

DPRとHugging Face Transformerを用いたRAGの概要と実装

DPRの概要 DPR(Dense Passage Retrieval)は、自然言語処理(NLP)の分野で使用される検索技術の一つで、DPRは、特に大規模な情報源から情報を取得し、その情報源に対する質問に最適な回答を見...
python

LoRAによるLLMのファインチューニングの概要と実装例について

LoRAによるLLMのファインチューニングの概要 LoRA(Low-Rank Adaptation)は、"大規模言語モデルのファインチューニングとRLHF(Reinforcement Learning from Hu...
python

マルチアームドバンディット問題の概要と適用アルゴリズム及び実装例について

マルチアームドバンディット問題の概要 マルチアームドバンディット問題(Multi-Armed Bandit Problem)は、意思決定の問題の一種で、複数の選択肢(アーム)の中から最も報酬の高い選択肢を見つける問...
アルゴリズム:Algorithms

IsoRankの概要とアルゴリズム及び実装例について

IsoRankについて IsoRank(Isomorphism Ranking)は、異なるネットワーク間での対応付け(アライメント)を行うためのアルゴリズムの一つであり、ネットワーク同型性(グラフ同型性)を利用...
python

Diffusion Models(拡散モデル)の概要とアルゴリズム及び実装例について

Diffusion Models(拡散モデル)の概要 Diffusion Models(拡散モデル)は、画像生成やデータ修復などのタスクにおいて優れた性能を示す生成モデルの一種となる。これらのモデルは、元のデータを一...
python

Seq2Seq(Sequence-to-Sequence)モデルの概要とアルゴリズム及び実装例について

Seq2Seq(Sequence-to-Sequence)モデルの概要 Seq2Seq(Sequence-to-Sequence)モデルは、系列データを入力として取り、系列データを出力するための深層学習モデルであ...
タイトルとURLをコピーしました