近日,上海交通大学李健教授团队依托上海交通大学鲲鹏昇腾科教创新卓越中心的算力支持,基于vLLM-Ascend推理框架研发出一套针对超长上下文推理的稀疏注意力KVCache分层缓存管理系统。在昇腾AI软硬件平台的全方位赋能下,该项目成功破解单卡支持超长上下文推理的显存与性能双重难题,同时大幅提升吞吐量。
IT产业网 2025/11/26 16:33 上交大 昇腾 鲲鹏昇腾科教创新卓越中心
关于我们┊联系我们┊友情链接┊网站地图┊内容联系┊最新报道┊法律声明
鄂ICP备18015839号-1专注IT产业报道,IT产业网 IT产业生态价值发现平台|IT榜单|IT活动|IT峰会|IT直播
风险提示:文章内容仅供阅读,不构成投资建议,请谨慎对待。
IT产业网&WWW.CITMT.CN © 2016-2024
