OpenAI、同団体デフォルト強化学習アルゴリズム「PPO」をリリース。Boston Dynamicsのような人型ロボットシミュレーション環境でもポリシーを最適に訓練可能


Elon Musk氏などが設立した人工知能を研究する非営利団体「OpenAI」は、現在のOpenAIのデフォルト強化学習アルゴリズムとなる「PPO(Proximal Policy Optimization)」をリリースしました。 PPOでは、エージ […]続きを読む

サイト名: Seamless

無料メールマガジン登録

週1回、注目のAIニュースやイベント情報を
編集部がピックアップしてお届けしています。

こちらの規約にご同意のうえチェックしてください。

規約に同意する