Rによる階層クラスタリング

2023.03.12 2021.02.14

機械学習技術自然言語技術人工知能技術デジタルトランスフォーメーション技術関係データ学習アルゴリズムとデータ構造数学プログラミング技術 R言語一般的な機械学習構造学習本ブログのナビ

Rによる階層クラスタリング

前回までで、Rのインストールからデータの導入、そして実用的な機械学習の応用として使われる頻度の高いクラスタリングについて、データの準備までを述べた。今回はその続きとして、階層クラスタリングでの学習と評価について述べる。

階層クラスタの関数hclustは以下になる。

hclust(d, method = "使用メソッド")

dは距離で、methodは使用する距離測定メソッドとなる。methodとしてはsingle(最短距離法)、complete(最長距離法)、average(群平均法)、centroid(重心法)、median(メディアン法)、mcquitty(McQuitty法、ward.D2(ウォード法)となる。関数hclustの実行は以下となる。

> distance <- dist(data)
> hc <- hclust(distance, "ward.D2")
> plot(hc)

distance変数に関数distで求めた距離を入れ、変数hcに関数hclustで求めたウォード法での値を入れる。そして最後にplot関数で結果を表示する。結果としてデンドグラム(樹形図)が出力される。

データの分割にはcutree関数を用いる。cutree関数は以下になる。

cutree(tree, k = NULL, h = NULL)

treeは分割したいデータ(今回はhc)、kはクラスター数、hは樹形図を分割する高さとなる。3つのクラスタに分ける場合は以下となる。

> result <- cutree(hc,k=3)
> result
[1] 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1
 [36] 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2
 [71] 2 2 2 2 2 2 2 3 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 3 2 3 3 3
[106] 3 2 3 3 3 3 3 3 2 2 3 3 3 3 2 3 2 3 2 3 3 2 2 3 3 3 3 3 2 2 3 3 3 2 3
[141] 3 3 2 3 3 3 2 3 3 2

データが1,2,3の3つに分けられていることが確認される。次にirisデータの５列目 Species のデータを変数 answer に代入し、品種とクラスタリング結果のクロス表を作成し、分類精度を確認する。

> answer <- iris[,5]
> table <- table(answer, result)
> table
            result
answer        1  2  3
  setosa     50  0  0
  versicolor  0 49  1
  virginica   0 15 35

クロス表から、150サンプル中 (50+49+35=)134サンプルを正確に分類できたことがわかる。

次回は非階層クラスタリングであるk-meansについて述べる。

Rによる機械学習(4) – Deus Ex Machina より:

2021年2月14日 4:58 PM

[…] 前回はクラスタリングの例として、階層クラスタリングについて紹介した。今回は非階層クラスタリングであるk-meansについて紹介する。 […]

返信
Rによる機械学習(2) – Deus Ex Machina より:

2021年2月14日 5:00 PM

[…] ピンバック: Rによる機械学習(3) – Deus Ex Machina […]

返信
機械学習の汎用的なツールとしてのR言語の概要 | Deus Ex Machina より:

2021年9月5日 1:52 PM

[…] Rでの階層クラスタリング […]

返信
構造学習について | Deus Ex Machina より:

2022年5月25日 10:11 AM

[…] Rのhclustを用いた階層クラスタリング […]

返信
構造学習の概要と各種適用事例および実装例 | Deus Ex Machina より:

2023年9月27日 4:41 AM

[…] んされる。階層的クラスタリングでは、デンドログラムと呼ばれる木構造を生成する。具体的な実装に関しては”Rによる階層クラスタリング“に述べている。そちらも参照のこと。 […]

返信
教育とAIについて | Deus Ex Machina より:

2024年6月18日 4:19 AM

[…] […]

返信