2019-03-03から1日間の記事一覧

2019-03-03

強化学習入門（理論）その2

強化学習

強化学習理論のまとめ（その2）です。その1（強化学習の一般的な定義から方策勾配法まで）は以下から。 udnp.hatenablog.com DPG DDPG D4PG MADDPG 参考・引用文献 DPG paper 方策は現在の状態sでの行動aに対する確率分布としてモデル化されますが、Determin…

グラフ機械学習と強化学習について

主にグラフ機械学習や強化学習手法を記載します。

2019-03-03から1日間の記事一覧

強化学習入門（理論）その2