1.はじめに
機械学習とは?
機械学習の定義
機械学習(Machine Learning)とは,データに潜む規則や構造を抽出することによって,未知の現象に対する予測やそれに基づく判断を行うための計算技術の総称.
関連分野としては,パターン認識(Pattern recognition)やデータマイニング(Data mining)があります,これらは目的や歴史的経緯が異なりますが,使われている手法はほぼ同じです.
機械学習の代表的なタスク
- 回帰(Regression)
- 分類(Classification)
- クラスタリング(Clustering)
- 次元削減(Dimensionality reduction)
sklearn.datasets sklearn.datasets
以下には,7つの簡易データセットが用意されており,データの読み込みが1行で行えます.
load_boston()
- Boston House-prices Dataset (回帰). - ボストン市の住宅価格予測load_iris()
- Iris Dataset (分類). - アヤメの花の品種分類load_diabetes()
- Diabetes Dataset (回帰). - 糖尿病患者の進行予測load_digits()
- Digits Dataset (分類). - 手書き数字の画像分類load_linnerud()
- Linnerud Dataset (回帰). - 生理学的特徴と運動能力の関係性load_wine()
- Wine Dataset (分類). - ワインの品種分類load_breast_cancer()
- Breast Cancer Wisconsin Dataset (分類). - 乳がんの判定