Link

1.はじめに

機械学習とは?

機械学習の定義

機械学習(Machine Learning)とは,データに潜む規則や構造を抽出することによって,未知の現象に対する予測やそれに基づく判断を行うための計算技術の総称.

関連分野としては,パターン認識(Pattern recognition)やデータマイニング(Data mining)があります,これらは目的や歴史的経緯が異なりますが,使われている手法はほぼ同じです.

機械学習の代表的なタスク

  1. 回帰(Regression)
  2. 分類(Classification)
  3. クラスタリング(Clustering)
  4. 次元削減(Dimensionality reduction)

sklearn.datasetssklearn.datasets以下には,7つの簡易データセットが用意されており,データの読み込みが1行で行えます. ​

  1. load_boston() - Boston House-prices Dataset (回帰). - ボストン市の住宅価格予測
  2. load_iris() - Iris Dataset (分類). - アヤメの花の品種分類
  3. load_diabetes() - Diabetes Dataset (回帰). - 糖尿病患者の進行予測
  4. load_digits() - Digits Dataset (分類). - 手書き数字の画像分類
  5. load_linnerud() - Linnerud Dataset (回帰). - 生理学的特徴と運動能力の関係性
  6. load_wine() - Wine Dataset (分類). - ワインの品種分類
  7. load_breast_cancer() - Breast Cancer Wisconsin Dataset (分類). - 乳がんの判定