我的论文讲解

流文

最新推荐

大语言模型加持下的自动化引擎

LLM CoT 大语言模型 LLM智能体

爱吃猫的鱼 1167 1 发布于1 年，1 月前

深度强化学习中的探索策略

人工智能强化学习探索与利用探索策略

爱吃猫的鱼 1748 1 发布于2 年前

Robust Speech Recognition via Large-Scale Weak Supervision

鲁棒性大规模数据集语音识别 ASR

爱吃猫的鱼 1756 0 发布于2 年，1 月前

视觉语言模型

视觉语言模型视觉模型语言模型

爱吃猫的鱼 2144 1 发布于2 年，2 月前

BadEncoder: Backdoor Attacks to Pre-trained Encoders in Self-Supervised Learning

深度学习安全预训练模型攻击人工智能安全

爱吃猫的鱼 1990 0 发布于2 年，4 月前

Evolution Strategies as a Scalable Alternative to Reinforcement Learning

强化学习进化算法自然进化策略并行大规模并行

爱吃猫的鱼 1880 0 发布于2 年，5 月前

Bad Characters: Imperceptible NLP Attacks

机器学习 NLP 字符编码攻击 NLP攻击

爱吃猫的鱼 1847 1 发布于2 年，5 月前

Conservative Q-Learning for Offline Reinforcement Learning

强化学习离线强化学习分布漂移价值超估 CQL

爱吃猫的鱼 2225 0 发布于2 年，5 月前

有限样本学习（三）：数据生成

有限样本学习小样本学习数据增强数据生成

爱吃猫的鱼 1775 0 发布于2 年，6 月前

Learning Invariant Representations for Reinforcement Learning without Reconstruction

强化学习表征学习 Bisimulation Metric 环境编码 Bisimulation

爱吃猫的鱼 2058 0 发布于2 年，7 月前

强化学习经典算法实验之REINFORCE

强化学习 cartpole-v0 REINFORCE gym 算法实现

爱吃猫的鱼 3302 0 发布于2 年，8 月前