论文信息 - SURF: Semi-supervised Reward Learning with Data Augmentation for Feedback-efficient Preference-based Reinforcement Learning - 字舞流文

SURF: Semi-supervised Reward Learning with Data Augmentation for Feedback-efficient Preference-based Reinforcement Learning

P. Abbeel | Jinwoo Shin | Kimin Lee | Younggyo Seo | Honglak Lee | Jongjin Park