創薬を行っていくとき、定量的構造活性相関(QSAR)を用いればハイスループットスクリーニングが可能となりますが、本当に欲しいのは所望の特性を満たす化合物です。目標となる活性値や物性値を得るために用いられる方法は、 数理最適化 ベイズ最適化 強化学…
強化学習理論のまとめ(その2)です。その1(強化学習の一般的な定義から方策勾配法まで)は以下から。 udnp.hatenablog.com DPG DDPG D4PG MADDPG 参考・引用文献 DPG paper 方策は現在の状態sでの行動aに対する確率分布としてモデル化されますが、Determin…
引用をストックしました
引用するにはまずログインしてください
引用をストックできませんでした。再度お試しください
限定公開記事のため引用できません。