HELLO CYBERNETICS

深層学習、機械学習、強化学習、信号処理、制御工学、量子計算などをテーマに扱っていきます

2020-11-10から1日間の記事一覧

【強化学習・変分推論への応用】期待値の勾配推定

はじめに モチベーション 期待値の勾配の計算方法 モンテカルロ近似と再パラメータ化 再パラメータ化できない場合