标签搜索 - 连续性控制 - 字舞流文

标签： 连续性控制

关注

Soft Actor-Critic: Off-Policy Maximum Entropy Deep Reinforcement Learning with a Stochastic Actor

SAC算法是Tuomas Haarnoja于DeepMind在2018年提出的强化学习算法。无模型深度强化学习在决策和控制任务中应用时会遇到两个挑战：1. 需要大量的样本；2. 收敛性。此算法希望为解决这两个挑战提供一个好的解决方案。

SAC算法是Tuomas Haarnoja于DeepMind在2018年提出的强化学习算法。无模型深度强化学习在决策和控制任务中应用时会遇到两个挑战：1. 需要大量的样本；2. 收敛性。此算法希望为解决这两个挑战提供一个好的解决方案。

强化学习神经网络无模型强化学习 SAC 连续性控制

爱吃猫的鱼

8997

1

2022年3月30日

热门主题

深度学习区块链批标准化 FAW Batch-Normalization 机器学习基础自私挖矿机器学习人工智能比特币