2023-10-01から1ヶ月間の記事一覧

Fitted Q-iteration

強化学習

久しぶりの記事です。オフライン強化学習を真面目に使いこなしていきたい。ということでオフライン強化学習の中では基本的な手法であるFitted Q-iterationについてみていきます。D. Ernstらによって2005年に提案されています。 Tree-Based Batch Mode Rein…