いろいろな概念がわかってないので、とりあえずメモ
応用例
- スパムメールの検出 教師あり学習
- クレジットカード詐欺の検出
教師あり学習 - 検索エンジン
- 診断
- 異常検知
- 金融市場の予測
- DNA配列の分類
- 物体認識
- ゲームプレイ
強化学習 - 感情分析(意見マイニング)
- レコメンドシステム
協調フィルタリング(アイテムベース、ユーザーベース)
アソシエーション分析 - 顔認識
- 音声認識や文字認識などのパターン認識
- 被写体認識
- 画像検索
- 線画自動着色
データマイニングとの関係
- 機械学習
- 目的は、訓練データから学んだ「既知」の特徴に基づく予測
- 評価は、既知の知識を再生成できるかどうか
- データマイニング
- 目的は、それまで「未知」だったデータの特徴を発見すること
- 評価は、それまで「未知」だった知識を発見することが重視
アルゴリズムの分類
要求される結果で分類
- 教師あり学習
入力とそれに対応すべき出力(≒ラベル)をモデル化。- 分類(classification)
- 回帰(regression)
- 教師なし学習
入力のみからモデル化。- クラスタリング(clustering)
- 次元削減(dimensionality reduction)
- 強化学習
教師あり学習に似ているが、教師による明確な「答え」は提示されず、「行動の選択肢」と「報酬」が提示される。試行錯誤を通じて長期における報酬の最大化を学習する。- Q学習
- Sarsa
- モンテカルロ法
- 半教師あり学習
- トランスダクション(トランスダクティブ推論)
- マルチタスク学習
技法
- 決定木学習
- 相関ルール学習 大規模データベースにおける変数間の興味深い関係を発見するための技法。
- ニューラルネットワーク (NN)
現代的NNは統計的データモデリングツールである。入力と出力の間の複雑な関係をモデル化するのに使われる。 - 遺伝的プログラミング (GP)
- 帰納論理プログラミング (ILP)
- サポートベクターマシン (SVM)
教師あり学習技法。訓練例のラベルは二値分類(=2つに分類)で、新たな例がどちらに分類されるかを予測する。 - クラスタリング
教師なし学習技法。統計的データ解析でよく使われる。 - ベイジアンネットワーク
- 強化学習
教師あり学習とは異なる。「エージェント」が「環境」の中でどのような「行動」をとるべきかを、何らかの長期的「報酬」を最大化するよう決定する。 - 現学習
Scikit learnの分類アルゴリズムの分類
Choosing the right estimator — scikit-learn 0.19.1 documentation
次の識別器に分類できる
- k近傍法
- サポートベクターマシン(線形)
- サポートベクターマシン(ガウシアンカーネル)
- 決定木
- ランダムフォレスト
- Adaブースト
- ナイーブベイズ
- 線形判別分析
- 二次判別分析
参考:【目次】Python scikit-learnの機械学習アルゴリズムチートシートを全実装・解説
Azure 機械学習アルゴリズム チート シート
Machine learning algorithm cheat sheet | Microsoft Docs
代表的な機械学習手法一覧
ニューラルネットワーク
- 順伝播型ニューラルネットワーク
(フィードフォワードニューラルネットワーク、略称: FFNN) - RBFネットワーク
- 自己組織化マップ(SOM)
2層のニューラルネットワークに相当。 - 畳み込みニューラルネットワーク(CNN)
- 再帰型ニューラルネットワーク(リカレントニューラルネットRNN、フィードバックニューラルネット)
- 確率的ニューラルネット
- スパイキングニューラルネットワーク
- 複素ニューラルネットワーク
ディープラーニング
深層学習とも約される。(狭義には4層以上の)多層のニューラルネットワーク(ディープニューラルネットワーク、英: deep neural network)による機械学習手法
種類
ニューラルネットワークを多層積み重ねたモデルを機械学習させればディープラーニングであるが、有名なモデルとして以下の物がある
- 畳み込みニューラルネットワーク(Convolutional Neural Networks: CNN)
- 再帰型ニューラルネットワーク
- 積層自己符号化器
- ディープビリーフネットワーク
- ディープボルツマンマシン
人口知能、機械学習、ディープラーニングのリンク
人工知能・機械学習・ディープラーニング関係の雑多なまとめ - karaage. [からあげ]