HOME/ /強化学習
2017.07.13

強化学習

« Back to Glossary Index

強化学習

「強化学習」は明確な正解がないときに、どの行動が「最適」か選択するように学習させる手法です。

ここでは囲碁AIの「Alpha Go」を例に説明をします。囲碁は手のパターンが膨大過ぎて、既存の最新のコンピュータでも、手を読み切ることは不可能です。

よって、強化学習により、勝ちまでの手を読み切る代わりに、どの手を打てば勝ちに近づくかを学習させています。

試合を繰り返し行い学習させると、最適な行動のみを選択するようになります。こうして「Alpha Go」は強くなっていったのです。

▶《保存版》強化学習とは|関係用語・機械学習での位置付けなど解説!>>

無料メールマガジン登録

週1回、注目のAIニュースやイベント情報を
編集部がピックアップしてお届けしています。

こちらの規約にご同意のうえチェックしてください。

規約に同意する

あなたにおすすめの記事

生成AIで効率化できる業務8選!活用事例や注意点まで完全解説

生成AIを経営戦略に組み込む方法!6つの活用領域と導入5ステップを徹底解説

生成AI導入で経営層を説得する方法!反対理由別の切り返し方も解説

AI導入の成果報告テンプレート!書き方のコツやKPI設計の方法も解説

AI導入の稟議を通す投資判断書の書き方!ROI算出法も紹介

生成AIで社内ナレッジ共有を仕組み化!RAG活用と導入事例7選を解説

生成AI導入計画書の作り方を9項目で解説!経営層を動かすテンプレ付き

生成AIの意識改革を進める6ステップ!3層別アプローチで現場の抵抗を突破

生成AIの社内管理の作り方!ガイドライン・体制・シャドーAI対策の手順も

生成AIの社内教育を成功させる5ステップ!階層別カリキュラム設計も

あなたにおすすめの記事

生成AIで効率化できる業務8選!活用事例や注意点まで完全解説

生成AIを経営戦略に組み込む方法!6つの活用領域と導入5ステップを徹底解説

生成AI導入で経営層を説得する方法!反対理由別の切り返し方も解説

AI導入の成果報告テンプレート!書き方のコツやKPI設計の方法も解説

AI導入の稟議を通す投資判断書の書き方!ROI算出法も紹介

生成AIで社内ナレッジ共有を仕組み化!RAG活用と導入事例7選を解説

生成AI導入計画書の作り方を9項目で解説!経営層を動かすテンプレ付き

生成AIの意識改革を進める6ステップ!3層別アプローチで現場の抵抗を突破

生成AIの社内管理の作り方!ガイドライン・体制・シャドーAI対策の手順も

生成AIの社内教育を成功させる5ステップ!階層別カリキュラム設計も