Rによる機械学習の参考図書

デジタルトランスフォーメーション技術 人工知能技術 機械学習  数学 アルゴリズムとデータ構造 プログラミング  R言語と機械学習 本ブログのナビ 

Rによる機械学習の参考図書

前回は、機械学習の概略について述べた。今回は「ツールボックスとしての機械学習」の具体例について述べたいと思う。それらのアプローチの選択肢の一つはR言語とそのライブラリーの利用となる。

R言語とは統計解析向けのプログラミング言語及び開発実行環境で、ニュージーランドのオークランド大学により1993年に作られた比較的歴史のあるツールである。特徴としては、ベクトルや行列等の扱いが簡易でしかも高速に処理できることから、数学的処理アルゴリズムの構築が容易でしかも処理が早いこと。また計算することが主目的の為、比較的シンプルなプログラミングが可能であることなどがある。それらの特徴により世界中の研究機関で利用され、数多くのライブラリ(パッケージ)が作成/公開されており、2021/02/01現在では、17029パッケージが登録されているようである。このライブラリ数はpythonのそれの半分以下となるが、統計解析向けに特化された言語であることを考えると十分な量があると言っても良いのではないかと思う。

参考書も多々出版されている。和書ではブレット・ランツ氏の本を翻訳した「Rによる機械学習」、Jared P. Lander 氏の本を翻訳した「みんなのR データ分析と統計解析の新しい教科書」等。洋書では、O’Reilly社の「R In a nutshell  second edition」、Packet社の「Statistical Analysis with R  Beginner’s Guide」や「Big Data Analytics with R and Hadoop」springer社の「An Introduction to Statistical Learning:with Applications in R」等々ある。

「Rによる機械学習」は目次として

第1章 機械学習入門、
第2章 データの管理と把握、
第3章 遅延学習 - 最近傍法を使った分類、
第4章 確率学習 - 単純ベイズを使った分類、
第5章 分割統治 - 決定木と分類ルールを使った分類、
第6章 数値データの予測 - 回帰法、
第7章 ブラックボックス方式 - ニューラルネットワークとサポートベクターマシン、
第8章 パターンの検出 - 相関規則を使った買い物かご分析、
第9章 データのグループの検出 - k平均法によるクラスタリング、
第10章 モデル性能の評価、
第11章 モデル性能の改善、
第12章 機械学習の専門的なテーマ

となっている。目次の内容からも分かる通り、具体的なタスクに対する例題を中心に記述されており、まず使ってみる教科書としては最適なものとなる。

「みんなのR データ分析と統計解析の新しい教科書」では、

1章 Rを手に入れる、
2章 Rの環境、
3章 Rパッケージ、
4章 Rの基本、
5章 高度なデータ構造、
6章 Rへのデータの取り込み、
7章 統計グラフ、
8章 Rの関数を書く、
9章 コントロール文、
10章 ループ Rの方法ではない反復方法、
11章 グルーピング操作、
12 章 データ整形、
13章 文字列操作、
14章 確率分布、
15章 基本統計、
16章 線形モデル、
17章 一般化線形モデル、
18章 モデル評価、
19章 正則化と縮小(シュリンケージ)、
20章 非線形モデル、
21章 時系列と自己相関、
22章 クラスタリング、
23章 knitrパッケージによる再現性 レポートとスライドショー、
24章 Rパッケージの構築

と盛り沢山な内容となっている。「Rによる機械学習」と比べると、Rの辞書的な要素が強く、ある程度使えるようになった後で読むと良い参考図書となのではないだろうか。

今回はRの概略を紹介した。次回は実際のコードについて紹介したいと思う。

コメント

  1. […] 機械学習では先々なアルゴリズム(手法)が存在し、データの種類に合わせてそれらを選択する必要があることを述べた。次回以降にて具体的な適用について述べていければと思う。 […]

  2. […] Rを用いて2つの系列に自己回帰関数arを以下のように当てはめる。 […]

  3. […] ここで上記のような推移律の関係(A→B、B→CならばA→C)考慮した(前述の例ではB→Cを除いて、A→Cを計算する)自己相関係数を偏自己相関係数と呼ぶ。偏自己相関係数はRでの実装では以下のようにtypeをaprtialとすることで計算することができる。 […]

  4. […] glmnetは、重回帰、ロジスティック重回帰、ポアソン重回帰など、一般化線形モデル(GLM)に関するスパース推定を実装している。通常の重回帰に関してはscikit-learnを用いることでpythonを用いても実行することができる。R言語ではgroup lassoやgraphical lassoのためのパッケージも用意されている。 […]

  5. […] Rによる機械学習の参考図書 […]

タイトルとURLをコピーしました