Google、TensorFlowベースの強化学習フレームワーク「Dopamine」(ドーパミン)、オープンソースで公開。脳の報酬系をインスパイヤ


機械学習のアルゴリズムのひとつである「強化学習」は、コンピュータが行動を選択した結果なんらかの報酬を得るとき、選択を繰り返していくなかでできるだけ多くの報酬を得るように学習していく、というものです。 この強化学習は、プロ囲碁棋士を破った初め…

サイト名: Publickey

無料メールマガジン登録

週1回、注目のAIニュースやイベント情報を
編集部がピックアップしてお届けしています。

こちらの規約にご同意のうえチェックしてください。

規約に同意する