论文信息 - Okapi: Instruction-tuned Large Language Models in Multiple Languages with Reinforcement Learning from Human Feedback - 字舞流文

Okapi: Instruction-tuned Large Language Models in Multiple Languages with Reinforcement Learning from Human Feedback

Thien Huu Nguyen | Viet Dac Lai | Nghia Trung Ngo | Ryan A. Rossi | Franck Dernoncourt | Chien Van Nguyen | Thuat Nguyen