论文信息 - On Optimal Caching and Model Multiplexing for Large Model Inference - 字舞流文

On Optimal Caching and Model Multiplexing for Large Model Inference

Michael I. Jordan | Lianmin Zheng | Banghua Zhu | Jiantao Jiao | Clark W. Barrett | Ying Sheng