保護中: ユニグラムモデル

アルゴリズム:Algorithms

2024.03.19 2021.04.30

AIシステム設計・意思決定構造の設計を専門としています。
Ontology・DSL・Behavior Treeによる判断の外部化、マルチエージェント構築に取り組んでいます。

Specialized in AI system design and decision-making architecture.
Focused on externalizing decision logic using Ontology, DSL, and Behavior Trees, and building multi-agent systems.

トピックモデル(2)ユニグラムモデルの最尤推定とMAP推定 – Deus Ex Machina より:

2021年5月1日 4:54 AM

[…] 前回機械学習プロフェッショナルシリーズ「トピックモデル」よりトピックモデルの概要とユニグラムモデルのモデル式までを述べた。今回はそれらを使った最適化について述べる。 […]

返信
関係データ学習(4)行列分解概要 | Deus Ex Machina より:

2021年5月30日 4:45 AM

[…] 上記のアプローチは「非負行列分解(non-negative matrix decomposition)」と呼ばれる。このアプローチはトピック抽出のアプローチの一つでもある。 […]

返信
人工知能、機械学習に活用される確率的生成モデルについて | Deus Ex Machina より:

2021年8月10日 6:23 AM

[…] トピックモデル(1) ユニグラムモデルの概要 […]

返信
自然言語のモデル化、ユニグラムモデルとベイズ確率的なモデルの適用 | Deus Ex Machina より:

2021年8月25日 4:51 AM

[…] ここでユニグラムモデルでは語順を考慮しないので「今日はいい天気です」と「です今日はいい天気」が同じ確率になる。これは日本語らしさという観点では不自然に感じるが、モデルの特徴である「目的に反しない範囲で問題を単純化する」という観点で考えると、例えば「文の話題に応じてカテゴリに分類する」という問題では、仮に「ホームラン」という単語があればその文は「スポーツ」や「野球」などのカテゴリに属する確率が高いと考えられ、その文が「ホームランを打った○○選手は・・」とか「ホームランは値千金の一打だった」のようなことまで分かる必要はなく、ユニグラムでも十分に目的を果たせると考えられる。これが問題が「適当な文を生成する」といったものであれば、単語の順番は無視できず、ユニグラムモデルを使うことは不適当であるということになる。 […]

返信
文章の背後にある潜在的意味を捉えるトピックモデル | Deus Ex Machina より:

2021年8月26日 6:19 AM

[…] 文章の中の単語の分布を、「トピック」と呼ばれる潜在的な構造(モデル)から推定するものはトピックモデルと呼ばれる。トピックモデルは文章の中で、それぞれのジャンルは、個々の確率分布を持ち、例えば経済欄に書かれてある”提携”とか”日経平均”とかの単語の出方は、家庭欄に書かれてある”ご飯”や”ニット”などの単語とは異なっているとの仮説のもとで作られたモデルとなる。 […]

返信
DX,AI,MLのベースとなる自然言語処理の概要 | Deus Ex Machina より:

2021年8月27日 2:22 PM

[…] トピックモデル(1) ユニグラムモデルの概要 […]

返信
画像認識の局所特徴をベクトルに統合するコーディングとプーリング | Deus Ex Machina より:

2021年9月14日 4:25 AM

[…] まずヒストグラム密度推定について。ヒストグラム密度推定を用いた特徴として、Bag of Visual Words(BoVW)が広く利用されている。BoVWは文書特徴を計算するモデルであるBag of Words(BoW)のアナロジーから生まれた特徴で、BoVWを用いることで、テキスト分類のテクニックをそのまま画像分類に適用することが可能となったものとなる。 […]

返信
文章からトピックを抽出する確率生成モデルであるトピックモデル | Deus Ex Machina より:

2021年12月17日 6:26 AM

[…] トピックモデル(1) ユニグラムモデルの概要 […]

返信
文のトピックを抽出する確率生成モデルを使ったトピックモデル | Deus Ex Machina より:

2024年7月30日 4:42 AM

[…] このトピックモデルのベースとなるモデルは”ユニグラムモデル“や”混合ユニグラムモデル“であり、これが拡張されて”Latent Dirichlet Allocation (LDA)“や”Probabilistic Latent Semantic Analysis (PLSA)”、また無次元への拡張として、”中華料理店過程(Chinese Restarant Process:CRP)“や”棒折過程(Stick Breaking Process:SBP)“、”階層ディリクレ過程(Hierarchical Direchlet Process:HDP)“等になる。 […]

返信