【強化学習初心者向け】シンプルな実装例で学ぶSARSA法およびモンテカルロ法【CartPoleで棒立て:1ファイルで完結】

最終更新日:

強化学習の代表的な手法である「SARSA法」と「モンテカルロ法」の、実装コード紹介と解説を行います学習する対象には、強化学習の「Hello World!」的存在である「CartPole」を使用します。概要強化学習の代表的な手法であるSARSA法、モンテカルロ法の2通りを実装・解説します。※ディープラ

サイト名: Qiita

無料メールマガジン登録

週1回、注目のAIニュースやイベント情報を
編集部がピックアップしてお届けしています。

こちらの規約にご同意のうえチェックしてください。

規約に同意する