アルゴリズム:Algorithms

ReAct(Reasoning and Acting)の概要とその実装例について

ReAct(Reasoning and Acting)の概要 ReActは"プロンプトエンジニアリングの概要とその利用について"で述べているプロンプトエンジニアリングの手法の一つであり、"LangChainにおけるA...
python

Stable DiffusionとLoRAの活用

Stable Diffusionの概要 Stable Diffusionは、機械学習と生成モデルの分野で使われる手法の1つであり、画像や音声などの生成モデルとして知られる"Diffusion Models(拡散モデル...
数学:Mathematics

ボルツマン分布とソフトマックスアルゴリズム及びバンディット問題

ボルツマン分布について ボルツマン分布(Boltzmann distribution)は、統計力学や物理学において重要な確率分布の一つであり、この分布は、系の状態がどのようにエネルギーに分布するかを記述するものとな...
Large-Scaleデータ

大規模言語モデルのファインチューニングとRLHF(Reinforcement Learning from Human Feedback)

イントロダクション 大規模言語モデルのファインチューニングとは、事前に大規模なデータセットで訓練されたモデルに対して、追加の学習を行うもので、汎用性の高いモデルを特定のタスクやドメインに適用することを可能にし、精度や...
アルゴリズム:Algorithms

グラフニューラルネットワーク

グラフニューラルネットワークの特徴と適用事例 "グラフデータ処理アルゴリズムと機械学習/人工知能タスクへの応用"でも述べているグラフデータとは、頂点(ノード)とそれらを結ぶ辺(エッジ)からなるデータ構造を指す。これ...
python

SentencePieceの概要とアルゴリズム及び実装例について

SentencePieceについて SentencePieceは、テキストデータのトークン化(分割)を行うためのオープンソースのライブラリおよびツールキットとなる。SentencePieceは、特に異なる言語や文...
python

Alternating Least Squares for Tensor Factorization (ALS-TF)の概要とアルゴリズム及び実装例について

Alternating Least Squares for Tensor Factorization (ALS-TF)の概要 Alternating Least Squares for Tensor Factorizat...
python

DPRとHugging Face Transformerを用いたRAGの概要と実装

DPRの概要 DPR(Dense Passage Retrieval)は、自然言語処理(NLP)の分野で使用される検索技術の一つで、DPRは、特に大規模な情報源から情報を取得し、その情報源に対する質問に最適な回答を見...
python

LoRAによるLLMのファインチューニングの概要と実装例について

LoRAによるLLMのファインチューニングの概要 LoRA(Low-Rank Adaptation)は、"大規模言語モデルのファインチューニングとRLHF(Reinforcement Learning from Hu...
python

マルチアームドバンディット問題の概要と適用アルゴリズム及び実装例について

マルチアームドバンディット問題の概要 マルチアームドバンディット問題(Multi-Armed Bandit Problem)は、意思決定の問題の一種で、複数の選択肢(アーム)の中から最も報酬の高い選択肢を見つける問...
タイトルとURLをコピーしました