欢迎访问:新清华

日期选择

建筑学院教授徐甜甜获2025年沃尔夫奖 计算机系团队获得第23届USENIX文件与存储技术会议最佳论文奖 机械系生物制造团队开发出促血管化动态生物墨水 自动化系提出推断病理影像微观信息新算法 药学院研究报道靶向cGAS新型降解剂 公管学院举办“聚焦两会热点 共话发展新篇”主题论坛
学术前沿
新清华

2025年03月21日

2357

本期8

文章23

字号【 加大 还原 减小

计算机系团队获得第23届USENIX文件与存储技术会议最佳论文奖

新清华 2025年03月21日 第2357期 学术前沿

最佳论文奖证书。

  本报讯 2月25日至27日,第23届USENIX文件与存储技术会议(FAST)在美国圣克拉拉举行。清华大学计算机系教师章明星、武永卫、郑纬民团队与合作者发表的论文“以键值缓存为中心的以存换算大语言模型推理架构”获得埃里克·里德尔最佳论文奖。章明星和合作方许欣然为该论文的共同通讯作者,计算机系2024级博士生秦若愚为第一作者。
  该论文提出的系统Mooncake是合作方月之暗面公司推出的大语言模型服务Kimi的底层推理服务平台。Mooncake采用了一种以键值缓存(KVCache)为中心的分离架构,不仅将预填充和解码集群分离,还高效利用了推理集群中未充分利用的中央处理器、内存、磁盘和网卡资源,构建了一个独立的KVCache缓存池。它的核心创新在于以KVCache为中心的全局缓存和调度器,旨在严格延迟相关服务级别目标(SLOs)下最大化吞吐量。
  实验结果显示,Mooncake在处理长上下文输入的场景中表现出色。在使用真实数据进行的测试中,与基线方法相比,Mooncake在符合SLOs的情况下,将有效请求处理能力提升了59%至498%。目前,Mooncake已在数千个节点上运行,每日处理超过1000亿个词元。在实际部署中,Mooncake的创新架构使Kimi在英伟达(NVIDIA)A800和H800集群上分别比以前的系统多处理115%和107%的请求。
  FAST是计算机存储领域的顶级学术会议,已创立20余年,在存储领域具有重要影响力,被中国计算机学会(CCF)认定为存储系统领域的A类国际学术会议。(计算机系)

  • 语音播报
  • 一键复制
  • 导出
清华大学新闻中心版权所有,清华大学新闻网编辑部维护,电子信箱: news@tsinghua.edu.cn
Copyright 2001-2020 news.tsinghua.edu.cn. All rights reserved.