機械学習の中途半端なメモ

スポンサーリンク

いろいろな概念がわかってないので、とりあえずメモ

応用例

  • スパムメールの検出 教師あり学習
  • クレジットカード詐欺の検出
    教師あり学習
  • 検索エンジン
  • 診断
  • 異常検知
  • 金融市場の予測
  • DNA配列の分類
  • 物体認識
  • ゲームプレイ
    強化学習
  • 感情分析(意見マイニング)
  • レコメンドシステム
    協調フィルタリング(アイテムベース、ユーザーベース)
    アソシエーション分析
  • 顔認識
  • 音声認識や文字認識などのパターン認識
  • 被写体認識
  • 画像検索
  • 線画自動着色

データマイニングとの関係

  • 機械学習
    • 目的は、訓練データから学んだ「既知」の特徴に基づく予測
    • 評価は、既知の知識を再生成できるかどうか
  • データマイニング
    • 目的は、それまで「未知」だったデータの特徴を発見すること
    • 評価は、それまで「未知」だった知識を発見することが重視

アルゴリズムの分類

要求される結果で分類

  • 教師あり学習
    入力とそれに対応すべき出力(≒ラベル)をモデル化。
    • 分類(classification)
    • 回帰(regression)
  • 教師なし学習
    入力のみからモデル化。
  • 強化学習
    教師あり学習に似ているが、教師による明確な「答え」は提示されず、「行動の選択肢」と「報酬」が提示される。試行錯誤を通じて長期における報酬の最大化を学習する。
  • 半教師あり学習
  • トランスダクション(トランスダクティブ推論)
  • マルチタスク学習

技法

  • 決定木学習
  • 相関ルール学習 大規模データベースにおける変数間の興味深い関係を発見するための技法。
  • ニューラルネットワーク (NN)
    現代的NNは統計的データモデリングツールである。入力と出力の間の複雑な関係をモデル化するのに使われる。
  • 遺伝的プログラミング (GP)
  • 帰納論理プログラミング (ILP)
  • サポートベクターマシン (SVM)
    教師あり学習技法。訓練例のラベルは二値分類(=2つに分類)で、新たな例がどちらに分類されるかを予測する。
  • クラスタリング
    教師なし学習技法。統計的データ解析でよく使われる。
  • ベイジアンネットワーク
  • 強化学習
    教師あり学習とは異なる。「エージェント」が「環境」の中でどのような「行動」をとるべきかを、何らかの長期的「報酬」を最大化するよう決定する。
  • 現学習

Scikit learnの分類アルゴリズムの分類

Choosing the right estimator — scikit-learn 0.19.1 documentation

次の識別器に分類できる

参考:【目次】Python scikit-learnの機械学習アルゴリズムチートシートを全実装・解説

Azure 機械学習アルゴリズム チート シート

Machine learning algorithm cheat sheet | Microsoft Docs

代表的な機械学習手法一覧

代表的な機械学習手法一覧 - Qiita

ニューラルネットワーク

ディープラーニング

深層学習とも約される。(狭義には4層以上の)多層のニューラルネットワーク(ディープニューラルネットワーク、英: deep neural network)による機械学習手法

種類

ニューラルネットワークを多層積み重ねたモデルを機械学習させればディープラーニングであるが、有名なモデルとして以下の物がある

人口知能、機械学習ディープラーニングのリンク

人工知能・機械学習・ディープラーニング関係の雑多なまとめ - karaage. [からあげ]

参考

機械学習 - Wikipedia