グラフ機械学習と強化学習について

主にグラフ機械学習や強化学習手法を記載します。

2019-03-01から1ヶ月間の記事一覧

ベイズ最適化:ガウシアンプロセス

創薬を行っていくとき、定量的構造活性相関(QSAR)を用いればハイスループットスクリーニングが可能となりますが、本当に欲しいのは所望の特性を満たす化合物です。目標となる活性値や物性値を得るために用いられる方法は、 数理最適化 ベイズ最適化 強化学…

強化学習入門(理論)その2

強化学習理論のまとめ(その2)です。その1(強化学習の一般的な定義から方策勾配法まで)は以下から。 udnp.hatenablog.com DPG DDPG D4PG MADDPG 参考・引用文献 DPG paper 方策は現在の状態sでの行動aに対する確率分布としてモデル化されますが、Determin…