文
论文分享
演练场
杂货铺
论文推荐
字
编辑器下载
登录
注册
流
文
搜 索
最新推荐
大语言模型加持下的自动化引擎
LLM
CoT
大语言模型
LLM智能体
爱吃猫的鱼
1141
1
发布于1 年前
深度强化学习中的探索策略
人工智能
强化学习
探索与利用
探索策略
爱吃猫的鱼
1723
1
发布于1 年,11 月前
Robust Speech Recognition via Large-Scale Weak Supervision
鲁棒性
大规模数据集
语音识别
ASR
爱吃猫的鱼
1719
0
发布于2 年前
视觉语言模型
视觉语言模型
视觉模型
语言模型
爱吃猫的鱼
2113
1
发布于2 年,2 月前
BadEncoder: Backdoor Attacks to Pre-trained Encoders in Self-Supervised Learning
深度学习
安全
预训练模型
攻击
人工智能安全
爱吃猫的鱼
1966
0
发布于2 年,3 月前
Evolution Strategies as a Scalable Alternative to Reinforcement Learning
强化学习
进化算法
自然进化策略
并行
大规模并行
爱吃猫的鱼
1835
0
发布于2 年,4 月前
Bad Characters: Imperceptible NLP Attacks
机器学习
NLP
字符编码攻击
NLP攻击
爱吃猫的鱼
1828
1
发布于2 年,5 月前
Conservative Q-Learning for Offline Reinforcement Learning
强化学习
离线强化学习
分布漂移
价值超估
CQL
爱吃猫的鱼
2163
0
发布于2 年,5 月前
有限样本学习(三):数据生成
有限样本学习
小样本学习
数据增强
数据生成
爱吃猫的鱼
1758
0
发布于2 年,6 月前
Learning Invariant Representations for Reinforcement Learning without Reconstruction
强化学习
表征学习
Bisimulation Metric
环境编码
Bisimulation
爱吃猫的鱼
2034
0
发布于2 年,6 月前
强化学习经典算法实验之REINFORCE
强化学习
cartpole-v0
REINFORCE
gym
算法实现
爱吃猫的鱼
3269
0
发布于2 年,8 月前