文
Paper Sharings
Playground
Grocery
Paper Recommendation
字
Editor Download
Login
Register
流
文
搜 索
最新推荐
大语言模型加持下的自动化引擎
LLM
CoT
大语言模型
LLM智能体
爱吃猫的鱼
1190
1
发布于1 年,2 月前
深度强化学习中的探索策略
人工智能
强化学习
探索与利用
探索策略
爱吃猫的鱼
1781
1
发布于2 年前
Robust Speech Recognition via Large-Scale Weak Supervision
鲁棒性
大规模数据集
语音识别
ASR
爱吃猫的鱼
1793
0
发布于2 年,1 月前
视觉语言模型
视觉语言模型
视觉模型
语言模型
爱吃猫的鱼
2210
1
发布于2 年,3 月前
BadEncoder: Backdoor Attacks to Pre-trained Encoders in Self-Supervised Learning
深度学习
安全
预训练模型
攻击
人工智能安全
爱吃猫的鱼
2020
0
发布于2 年,4 月前
Evolution Strategies as a Scalable Alternative to Reinforcement Learning
强化学习
进化算法
自然进化策略
并行
大规模并行
爱吃猫的鱼
1919
0
发布于2 年,5 月前
Bad Characters: Imperceptible NLP Attacks
机器学习
NLP
字符编码攻击
NLP攻击
爱吃猫的鱼
1874
1
发布于2 年,6 月前
Conservative Q-Learning for Offline Reinforcement Learning
强化学习
离线强化学习
分布漂移
价值超估
CQL
爱吃猫的鱼
2323
0
发布于2 年,6 月前
有限样本学习(三):数据生成
有限样本学习
小样本学习
数据增强
数据生成
爱吃猫的鱼
1845
0
发布于2 年,7 月前
Learning Invariant Representations for Reinforcement Learning without Reconstruction
强化学习
表征学习
Bisimulation Metric
环境编码
Bisimulation
爱吃猫的鱼
2082
0
发布于2 年,7 月前
强化学习经典算法实验之REINFORCE
强化学习
cartpole-v0
REINFORCE
gym
算法实现
爱吃猫的鱼
3341
0
发布于2 年,9 月前