機械学習
機械学習とは、コンピューターに多くのデータを反復的に学習させ、パターンを見つけ出すことです。コンピューターは学習した結果を用い、見つけ出したパターンに従って将来的なデータ予測もできます。人間の脳では処理しきれない大量のデータを、コンピューターに学習させることで、迅速なパターン発見に役立ちます。データが少ない場合、「コンピューターにわざわざさせる必要はない」と思われがちですが、機械学習を使うことでより複雑なデータを処理することができるため、非常に有用です。
ここでいう学習とは、「分ける」という処理のことを指します。「分ける」というのはつまり、「イエスかノーか答える」ということです。基本的に、人が物事を認識したり、判断したりするときはこの「イエスかノーか答える」というところに帰着します。
例として、今iphoneを買うかどうか迷っている人を挙げてみます。この場合、買う(Yes)または買わない(No)とという問題になります。
他にも、この記事を公開してもいいのか、このプロジェクトを引き受けるべきか、もっと日常的なことで言えば、出かけるかどうか、電車かバスかなどなど、生活で判断することはすべてイエスかノーか答えることに帰着します。このイエスかノーか答えるということに対して精度を高めていくことが、学習するということです。
機械学習では、大量のデータをコンピュータを用いて処理しながら「分け方」を学習し習得します。1度習得してしまえばこの「分け方」を用いて新しい(未知の)データも分けることができます。つまり、犬の見分け方を一度習得すれば、与えられたものが犬かどうかを判断することができるということです。
機械学習に関する詳細はこちらでも解説しています。
機械学習をどこよりもわかりやすく解説!教師ありなし学習・強化学習だけでなく5つのアルゴリズムも完全理解>>
機械学習の種類
教師あり学習
「教師あり学習」は、あらかじめ問題(データ)とその答え(分け方)を学習させ、ある問題が与えられた時に正しく答えられる(分けられる)ようにする方法です。
教師あり学習の場合、通常人間が教師役を担います。例えば画像認識を例にあげると、ある画像に対してこれは「犬」、これは「傘」、といったようにデータに対する答えを人間が与えます。
教師あり学習の代表的なアルゴリズム
SVM
教師なし学習
「教師なし学習」では、問題(データ)のみを与え、その答えは与えずに学習させる方法です。
教師なし学習は、データを与えられたときにそのデータに潜む傾向や構造を抽出するために用いられます。
例として、アソシエーション分析というものは教師なし学習の一つです。そのアソシエーション分析で有名な話が、紙おむつとビールです。
米国の大手スーパーマーケットでPOSデータを分析した結果、紙おむつとビールが一緒に買われていることが分かった。検証の結果、父親が子供の紙おむつを買いに来たついでに、缶ビールも購入していることが分かった。そこで、この2つを並べて陳列したところ、売り上げが上昇した・・
このように普通では発見できないような相関を見つけ出すことができるのが特徴です。
教師なし学習の代表的なアルゴリズム
参考)松尾豊(2015)『人工知能は人間を超えるか ディープラーニングの先にあるもの』KADOKAWA