2月26日,据计算机存储领域顶会FAST2025,Kimi与清华大学联合参与的项目论文《Mooncake: Trading More Storage for Less Computation-A KVCache-centric Architecture for Serving LLM Chatbot》获得最佳论文奖。Mooncake是月之暗面Kimi的底层推理服务平台。

2024年11月,Kimi和清华大学 MADSys实验室联合9#AISoft、阿里云、华为存储、面壁智能、趋境科技等机构启动Mooncake开源计划,开源Mooncake Transfer Engine。Mooncake团队还和vLLM团队(UC伯克利大学的开源大语言模型)共同宣布,将把Mooncake的创新性KVCache中心架构引入更多开源社区。(澎湃新闻记者 范佳来)

ad1 webp
ad2 webp
ad1 webp
ad2 webp