2022-02-23から1日間の記事一覧

2022-02-23

MDP: Value Iteration

強化学習

NeurIPS 2021のOutstanding papersの1つであるOn the Expressivity of Markov Rewardを理解したいと思いつつ、実験を通じて色々理解を深めようとしてきました（全然できていません）。論文の内容としては、マルコフ決定過程（MDP）において、3通りのタスク…

#強化学習

グラフ機械学習と強化学習について

主にグラフ機械学習や強化学習手法を記載します。

2022-02-23から1日間の記事一覧

MDP: Value Iteration