2019-03-01から1ヶ月間の記事一覧

2019-03-30

ベイズ最適化：ガウシアンプロセス

創薬を行っていくとき、定量的構造活性相関（QSAR）を用いればハイスループットスクリーニングが可能となりますが、本当に欲しいのは所望の特性を満たす化合物です。目標となる活性値や物性値を得るために用いられる方法は、数理最適化ベイズ最適化強化学…

2019-03-03

強化学習入門（理論）その2

強化学習

強化学習理論のまとめ（その2）です。その1（強化学習の一般的な定義から方策勾配法まで）は以下から。 udnp.hatenablog.com DPG DDPG D4PG MADDPG 参考・引用文献 DPG paper 方策は現在の状態sでの行動aに対する確率分布としてモデル化されますが、Determin…

グラフ機械学習と強化学習について

主にグラフ機械学習や強化学習手法を記載します。

2019-03-01から1ヶ月間の記事一覧

ベイズ最適化：ガウシアンプロセス

強化学習入門（理論）その2