MLA(Multi-headLatentAttention多头潜在注意力架构)凭借低秩压缩KV缓存设计,实现长上下文推理的显存与带宽双重优化,其有效性已在DeepSeek-V2等模型中得到了验证。但主流预训练模型如LLaMA、Qwen千问等多基于GQA构建,企业已投入大量工程优化,复用MLA需重训,成本极高。为此,在北京大学鲲鹏昇腾科教创新卓越中心的算力支持下,北京大学人工智能研究院助理教授张牧涵团队提出TransMLA转化框架,实现了无需重训便可将主流模型向MLA迁移。
IT产业网 2026/01/13 14:14 昇腾 大模型 北大
近日,上海交通大学李健教授团队依托上海交通大学鲲鹏昇腾科教创新卓越中心的算力支持,基于vLLM-Ascend推理框架研发出一套针对超长上下文推理的稀疏注意力KVCache分层缓存管理系统。在昇腾AI软硬件平台的全方位赋能下,该项目成功破解单卡支持超长上下文推理的显存与性能双重难题,同时大幅提升吞吐量。
IT产业网 2025/11/26 16:33 上交大 昇腾 鲲鹏昇腾科教创新卓越中心
北京大学计算机学院李戈教授团队深耕该技术方向并在鲲鹏昇腾科教创新卓越中心的算力支持下,成功研发出一套基于昇腾平台的智能化软件开发系统,通过大模型自动代码生成和优化技术实现了软件开发效率的显著提升。该成果完成了开源代码大模型aiXcoder-7B在昇腾NPU硬件平台上的适配,通过集成torch_npu扩展库与MindIE推理加速套件,实现了模型的高效运行。同时,构建了基于DeepSeek-V3Agent的智能开发系统。
IT产业网 2025/11/19 15:36 解决方案 软件开发 代码 北大 昇腾
北京大学人工智能研究院助理教授杨耀东团队研发出一套覆盖全模态、兼顾高效率、赋能强推理的大模型对齐框架——Align-Anything,并依托鲲鹏昇腾科教创新卓越中心(以下简称“卓越中心”)的算力支持成功迁移至昇腾平台,目前,已在智慧医疗、网络安全等多个关键领域实现规模化落地,展现了广阔的应用前景,并在人才培养方面取得显著成效。
IT产业网 2025/11/14 09:09 大模型 昇腾
4月25日至26日,东南大学鲲鹏昇腾科教创新孵化中心特训营(第一期)在九龙湖校区成功举办。
IT产业网 2025/04/30 22:28 东南大学 鲲鹏 昇腾