Old Web

English

Sign In

Acemap > Paper > Optimal Estimation of Off-Policy Policy Gradient via Double Fitted Iteration.

Optimal Estimation of Off-Policy Policy Gradient via Double Fitted Iteration.

2022

Chengzhuo Ni
Ruiqi Zhang
Xiang Ji
Xuezhou Zhang
Mengdi Wang

Correction
Cite
Save
Machine Reading By IdeaReader

0

References

0

Citations

NaN

KQI

[]

Email Address

acemap@cs.sjtu.edu.cn

CCF Conference Analysis

Map Galaxy

Academic Report

What's New

© Copyright 2015-2020 Acemap, Inc. Shanghai Jiao Tong University.

沪ICP备18028330号