Old Web

English

Sign In

Acemap > Paper > Learning Intrinsic Rewards as a Bi-Level Optimization Problem.

Learning Intrinsic Rewards as a Bi-Level Optimization Problem.

2020

Bradly C. Stadie
Lunjun Zhang
Jimmy Ba

Keywords:

Instrumental and intrinsic value
Mathematical optimization
Optimization problem
Computer science

Correction
Source
Cite
Save
Machine Reading By IdeaReader

42

References

5

Citations

NaN

KQI

[]

Email Address

acemap@cs.sjtu.edu.cn

CCF Conference Analysis

Map Galaxy

Academic Report

What's New

© Copyright 2015-2020 Acemap, Inc. Shanghai Jiao Tong University.

沪ICP备18028330号