Deepseek MLA和MLA absorb

张

张建站

2026/5/30 8:32:09

10分钟阅读

1. MLA原理多头潜在注意力Multi-Head Latent AttentionMLA是由深度求索DeepSeek公司在2024年5月发布的DeepSeek V2模型中提出的一种创新注意力机制, 可以理解为一种升级版的MHAMulti-Head Latent Attention。主要方法是将Q K V用一个相对低秩的矩阵来存储可以降低显存空间以及一部分计算量为解决位置相关的信息丢失问题将压缩后的QK又单独concat。MLA和MHA的区别是QKV计算的过程不同其后的Attention计算以及linear流程基本是一致的。其中2. MLA 模型架构图图中可以看到tokens输入的d维度是7168q_down压缩之后的维度是1536q_up解压后的维度是32*128646144。kv_down压缩之后的维度是576K解压之后的维度是32*(12864)6144V解压之后的维度是32*1284,096 QK和V维度的差别是QK需要加RoPE部分V不需要RoPE。整体维度都是压缩了。MLA 并行结构图3.MLA absorb原理MLA absorb 解决性能问题的方法和Linear attention有点像。本质是矩阵三连乘问题应该是先左乘还是右乘显存占用以及计算量越少。变化在, 优先做左乘而不是原生的。其中,,其中这部分原生MLA的复杂度, 主要复杂度是, MLA absorb的复杂度, 主要复杂度是, 算子显存优化比是d:dc 以上图中d7168, dc1538。注意RoPE部分不能被吸收RoPE算子里包含一个位置旋转矩阵Rt(随时间/位置动态变化。如果强行代入公式因为Rt和Rj夹在中间且随着每个token的位置不同而实时变化导致和在空间上被隔开无法提前相乘合并。 NoPE可以合并是因为和都是常量矩阵要以先直接合并。

从Word到PDF：一次搞定Java项目中的文档导出（EasyPOI避坑与Docx4j字体配置全记录）

Java项目实战：从Word模板到PDF导出的完整解决方案与避坑指南在Java企业级应用开发中，文档导出功能几乎是每个业务系统都绕不开的需求场景。想象一下这样的典型场景：人力资源系统需要生成员工合同、财务系统要输出对账单、教育平台需制作学员…...

2026/5/30 8:29:04 阅读更多 →

从‘空间谱’到‘多项式根’：一文讲透root-MUSIC的数学之美与工程实现

从‘空间谱’到‘多项式根’：一文讲透root-MUSIC的数学之美与工程实现当均匀线阵(ULA)捕捉到远场信号时，阵列流型与信号子空间的微妙关系，往往隐藏着令人惊叹的数学转换。传统MUSIC算法通过谱峰搜索定位信源，而root-MUSIC却另辟蹊…...

2026/5/30 8:27:05 阅读更多 →

别再手动写AXI总线测试了！用Xilinx AXI VIP（Master模式）5分钟搞定验证

用Xilinx AXI VIP实现高效验证：从手工测试到自动化革命的实战指南在FPGA和数字IC验证领域，AXI总线协议已经成为事实上的标准接口规范。然而，每次设计变更都需要手工编写大量测试序列的日子应该结束了。当我第一次接触Xilinx AXI VIP时&#x…...

2026/5/30 8:26:13 阅读更多 →

ML模型监控工具：监控和维护机器学习模型的性能

ML模型监控工具：监控和维护机器学习模型的性能一、ML模型监控工具概述 1.1 ML模型监控工具的定义 ML模型监控工具是指用于监控和维护机器学习模型性能的软件工具。它通过收集模型的预测数据、性能指标和数据质量，帮助用户了解模型的状态，及时…...

2026/5/30 6:22:30 阅读更多 →

AI 开发工具选择指南：Qoder、Qwen 与开发者使用策略

AI 开发工具选择指南：Qoder、Qwen 与开发者使用策略引言在 AI 技术快速发展的今天，越来越多的 AI 工具涌现出来，帮助开发者提高工作效率。但对于许多开发者来说，面对众多的 AI 产品和服务，往往感到困惑：这…...

2026/5/29 11:42:12 阅读更多 →

全平台资源下载神器：5分钟掌握res-downloader的完整使用指南

全平台资源下载神器：5分钟掌握res-downloader的完整使用指南【免费下载链接】res-downloader 视频号、小程序、抖音、快手、小红书、直播流、m3u8、酷狗、QQ音乐等常见网络资源下载! 项目地址: https://gitcode.com/GitHub_Trending/re/res-downloader 还在…...

2026/5/29 4:41:15 阅读更多 →

2024三星固件下载完整指南：Bifrost跨平台工具终极解决方案

2024三星固件下载完整指南：Bifrost跨平台工具终极解决方案【免费下载链接】Bifrost Cross-platform tool for downloading Samsung mobile device firmware. 项目地址: https://gitcode.com/gh_mirrors/sa/Bifrost 还在为三星设备固件下载而烦恼吗&#xff…...

2026/5/29 11:37:03 阅读更多 →