028、片上SRAM vs 片外DRAM：NPU存储设计的权衡

张

张建站

2026/5/25 13:03:19

10分钟阅读

028、片上SRAM vs 片外DRAM：NPU存储设计的权衡去年调一个边缘推理板卡，模型跑MobileNetV3，帧率死活上不去。看波形图，NPU核心利用率只有40%多，大部分时间在等数据。我盯着DDR总线上那些长长的读延迟波形，突然意识到一个残酷的事实：NPU不是在算，是在等。那次之后，我花了两周时间重新梳理了NPU存储架构。今天这篇笔记，就是当时踩坑的总结。一个真实的调试现场先说说那个让我失眠的bug。板子上用的是某款国产NPU芯片，片上SRAM只有2MB，片外挂了两颗LPDDR4，总容量4GB。跑分类网络时，模型权重大概3.8MB，激活值中间结果大约1.2MB。按说4GB的DDR带宽有25.6GB/s，应该够用才对。但实际跑起来，NPU的PE阵列（处理单元阵列）经常空转。用逻辑分析仪抓DDR总线，发现每笔读请求的延迟在80-120ns之间，而NPU内部一个MAC操作只需要0.5ns。这意味着，等一次DDR读的时间，足够PE做200次乘法。更坑的是，权重数据是反复重用的。同一个卷积核的权重，在滑动窗口过程中会被读取几十次。每次都要从DDR读，带宽全浪费在重复传输上了。片上SRAM：贵但快，容量是硬伤片上SRAM的延迟通常在1-2ns，带宽可以做到几百GB/s（取决于工艺和设计）。但代价是面积和功耗。在28nm工艺下，1MB的SRAM面积大约2-3平方毫米，而同样容量的DRAM（需要外挂）面积成本低两个数量级。NPU设计里，SRAM主要用来做三件事：

网络运维与网络安全阶段一基础篇二十

弹性交换网络2026.5.231、DHCP原理2、基于全局的DHCP3、基于接口的DHCP4、DHCP中继5、交换机部署DHCP6、DHCP地址池管理一、DHCP1、DHCP概述1）为什么使用DHCP？因为手动配置IP地址在小型网络中是可行的，但对于大型网络来说，这种方法…...

2026/5/25 13:02:08 阅读更多 →

3个核心优势，让DyberPet成为桌面宠物开发的首选框架

3个核心优势，让DyberPet成为桌面宠物开发的首选框架【免费下载链接】DyberPet Desktop Cyber Pet Framework based on PySide6 项目地址: https://gitcode.com/GitHub_Trending/dy/DyberPet 想象一下，你的桌面上有一个会呼吸的虚拟伙伴——它在你…...

2026/5/25 13:01:33 阅读更多 →

Python爬虫避坑手册：10年爬取经验总结，看完再也不会被封IP

做爬虫这么多年，我见过太多新手从入门到放弃，不是因为学不会Python，而是被各种反爬机制虐得怀疑人生。我刚入行的时候，写的第一个爬虫是爬某电商网站的商品价格。当时觉得爬虫不就是发个请求，解析个HTML吗？结果代码刚跑了5分钟，IP就被封了。我当时还傻乎乎地重启路由器…...

2026/5/25 13:01:10 阅读更多 →

ML模型监控工具：监控和维护机器学习模型的性能

ML模型监控工具：监控和维护机器学习模型的性能一、ML模型监控工具概述 1.1 ML模型监控工具的定义 ML模型监控工具是指用于监控和维护机器学习模型性能的软件工具。它通过收集模型的预测数据、性能指标和数据质量，帮助用户了解模型的状态，及时…...

2026/5/24 0:08:10 阅读更多 →

AI 开发工具选择指南：Qoder、Qwen 与开发者使用策略

AI 开发工具选择指南：Qoder、Qwen 与开发者使用策略引言在 AI 技术快速发展的今天，越来越多的 AI 工具涌现出来，帮助开发者提高工作效率。但对于许多开发者来说，面对众多的 AI 产品和服务，往往感到困惑：这…...

2026/5/25 8:18:41 阅读更多 →

全平台资源下载神器：5分钟掌握res-downloader的完整使用指南

全平台资源下载神器：5分钟掌握res-downloader的完整使用指南【免费下载链接】res-downloader 视频号、小程序、抖音、快手、小红书、直播流、m3u8、酷狗、QQ音乐等常见网络资源下载! 项目地址: https://gitcode.com/GitHub_Trending/re/res-downloader 还在…...

2026/5/24 0:26:41 阅读更多 →

2024三星固件下载完整指南：Bifrost跨平台工具终极解决方案

2024三星固件下载完整指南：Bifrost跨平台工具终极解决方案【免费下载链接】Bifrost Cross-platform tool for downloading Samsung mobile device firmware. 项目地址: https://gitcode.com/gh_mirrors/sa/Bifrost 还在为三星设备固件下载而烦恼吗&#xff…...

2026/5/24 0:26:45 阅读更多 →