标签搜索 - 离线强化学习 - 字舞流文

标签： 离线强化学习

关注

Conservative Q-Learning for Offline Reinforcement Learning

这篇论文发布于2020年的NIPS，一作为伯克利人工智能实验室的研究人员 Aviral Kumar。论文旨在解决离线（offline）强化学习中由分布漂移（distributional shift）导致的价值函数超估（overestimation）问题。

这篇论文发布于2020年的NIPS，一作为伯克利人工智能实验室的研究人员 Aviral Kumar。论文旨在解决离线（offline）强化学习中由分布漂移（distributional shift）导致的价值函数超估（overestimation）问题。

强化学习离线强化学习分布漂移价值超估 CQL

爱吃猫的鱼

1802

0

2022年6月1日

热门主题

深度学习区块链批标准化 FAW Batch-Normalization 机器学习基础自私挖矿机器学习人工智能比特币