论文信息 - Energy-Efficient Online Scheduling of Transformer Inference Services on GPU Servers - 字舞流文

Energy-Efficient Online Scheduling of Transformer Inference Services on GPU Servers

X. Chu | Qiang Wang | Yuxin Wang