HOME/ /強化学習
2017.07.13

強化学習

強化学習

「強化学習」は明確な正解がないときに、どの行動が「最適」か選択するように学習させる手法です。

ここでは囲碁AIの「Alpha Go」を例に説明をします。

囲碁は手のパターンが膨大過ぎて、既存の最新のコンピュータでも、手を読み切ることは不可能です。よって、強化学習により、勝ちまでの手を読み切る代わりに、どの手を打てば勝ちに近づくかを学習させています。試合を繰り返し行い学習させると、最適な行動のみを選択するようになります。こうして「Alpha Go」は強くなっていったのです。

無料メールマガジン登録

週1回、注目のAIニュースやイベント情報を
編集部がピックアップしてお届けしています。

こちらの規約にご同意のうえチェックしてください。

規約に同意する

あなたにおすすめの記事

DXを進めるにあたって大切なERP、AI活用で広がる可能性

適合率と再現率:映画『メン・イン・ブラック』を使った説明

先週のAI関連人気ツイートTOP20!【2021/07/26更新】

中国、敵艦に魚雷を発射するAI搭載のロボットドローンを発表

機械学習業界で働き始めて3年目の初心者への(技術的)アドバイス

先週のAI関連人気ツイートTOP20!【2021/07/19更新】

データサイエンスの修士号を取るべきではない理由

デジタルを“使う”人材育成の加速へ 日本企業が持つべき「DXマインド」とは|JDLA特別顧問 西山 圭太氏 講演レポート

Kaggleで世界ナンバーワンになるために必要なこと

あなたにおすすめの記事

DXを進めるにあたって大切なERP、AI活用で広がる可能性

適合率と再現率:映画『メン・イン・ブラック』を使った説明

先週のAI関連人気ツイートTOP20!【2021/07/26更新】

中国、敵艦に魚雷を発射するAI搭載のロボットドローンを発表

機械学習業界で働き始めて3年目の初心者への(技術的)アドバイス

先週のAI関連人気ツイートTOP20!【2021/07/19更新】

データサイエンスの修士号を取るべきではない理由

デジタルを“使う”人材育成の加速へ 日本企業が持つべき「DXマインド」とは|JDLA特別顧問 西山 圭太氏 講演レポート

Kaggleで世界ナンバーワンになるために必要なこと