2023-01-01から1年間の記事一覧

強化学習でポケモンをプレイする

強化学習

より多くの人に見てもらいたいと思いQiitaで投稿しましたが、こちらにも載せておきます。 qiita.com 本ブログでは、より専門的な内容を記載します。 Qiitaではカジュアルな内容を投稿しています。

強化学習

久しぶりの記事です。オフライン強化学習を真面目に使いこなしていきたい。ということでオフライン強化学習の中では基本的な手法であるFitted Q-iterationについてみていきます。D. Ernstらによって2005年に提案されています。 Tree-Based Batch Mode Rein…