機械学習

機械学習

機械学習とは、コンピューターに多くのデータを反復的に学習させ、パターンを見つけ出すことです。コンピューターは学習した結果を用い、見つけ出したパターンに従って将来的なデータ予測もできます。人間の脳では処理しきれない大量のデータを、コンピューターに学習させることで、迅速なパターン発見に役立ちます。データが少ない場合、「コンピューターにわざわざさせる必要はない」と思われがちですが、機械学習を使うことでより複雑なデータを処理することができるため、非常に有用です。

ここでいう学習とは、「分ける」という処理のことを指します。「分ける」というのはつまり、「イエスかノーか答える」ということです。基本的に、人が物事を認識したり、判断したりするときはこの「イエスかノーか答える」というところに帰着します。

例として、今iphoneを買うかどうか迷っている人を挙げてみます。この場合、買う(Yes)または買わない(No)とという問題になります。

他にも、この記事を公開してもいいのか、このプロジェクトを引き受けるべきか、もっと日常的なことで言えば、出かけるかどうか、電車かバスかなどなど、生活で判断することはすべてイエスかノーか答えることに帰着します。このイエスかノーか答えるということに対して精度を高めていくことが、学習するということです。

機械学習では、大量のデータをコンピュータを用いて処理しながら「分け方」を学習し習得します。1度習得してしまえばこの「分け方」を用いて新しい(未知の)データも分けることができます。つまり、犬の見分け方を一度習得すれば、与えられたものが犬かどうかを判断することができるということです。

機械学習の種類

教師あり学習

教師あり学習」は、あらかじめ問題(データ)とその答え(分け方)を学習させ、ある問題が与えられた時に正しく答えられる(分けられる)ようにする方法です。

教師あり学習の場合、通常人間が教師役を担います。例えば画像認識を例にあげると、ある画像に対してこれは「犬」、これは「傘」、といったようにデータに対する答えを人間が与えます。

例:天気予報、株価、画像認識音声認識

教師あり学習の代表的なアルゴリズム

ロジスティック回帰

k近傍法

決定木

SVM

ニューラルネットワーク

ナイーブベイズ

ランダムフォレスト

 

教師なし学習

教師なし学習」では、問題(データ)のみを与え、その答えは与えずに学習させる方法です。

教師なし学習は、データを与えられたときにそのデータに潜む傾向や構造を抽出するために用いられます。

例として、アソシエーション分析というものは教師なし学習の一つです。そのアソシエーション分析で有名な話が、紙おむつとビールです。

米国の大手スーパーマーケットでPOSデータを分析した結果、紙おむつとビールが一緒に買われていることが分かった。検証の結果、父親が子供の紙おむつを買いに来たついでに、缶ビールも購入していることが分かった。そこで、この2つを並べて陳列したところ、売り上げが上昇した・・

<引用>http://bdm.change-jp.com/?p=1341

このように普通では発見できないような相関を見つけ出すことができるのが特徴です。

教師なし学習の代表的なアルゴリズム

k-mean法

無料メールマガジン登録

週1回、注目のAIニュースやイベント情報を
編集部がピックアップしてお届けしています。

こちらの規約にご同意のうえチェックしてください。

規約に同意する