闪迪正在推动一场存储架构的根本性重构——将计算单元与NAND闪存直接键合,并将HBM的角色从核心内存降级为辅助层级。
据美国专利商标局公开的专利文件,闪迪提出了一种将多核处理器直接集成于CBA存储芯片之上的3D堆叠架构,整体封装于同一中介层之上,HBM则围绕该堆叠结构分布于周侧。这一设计意在同时突破HBM容量天花板与现有高带宽闪存(HBF)架构在延迟、功耗及系统集成层面的局限。

该专利的曝光表明,闪迪在加速推进HBF量产路线的同时,已在专利层面布局更激进的存储-计算融合方案,对AI加速器及GPU的内存架构设计路径具有潜在的深远影响。
HBM容量瓶颈催生新架构探索
HBM凭借高带宽优势成为当前AI芯片的主流内存方案,但其容量限制日益成为制约因素。据科技媒体Wccftech报道,现有HBM解决方案单栈容量通常为32至64GB,难以满足大规模AI模型对内存容量的持续增长需求。
为此,闪迪此前已推出HBF架构,借鉴HBM的垂直堆叠理念,通过硅通孔(TSV)将多层NAND闪存互联,形成统一存储栈。据闪迪披露,HBF单栈容量可扩展至4TB,在带宽上接近HBM水平,同等成本下容量可达HBM的8至16倍。
然而,NAND闪存在容量优势之外仍存在固有短板。Wccftech指出,NAND在系统架构中距离计算核心较远,数据访问速度慢于基于DRAM的架构,这一结构性劣势限制了HBF在延迟敏感型工作负载中的适用性。
新专利核心:计算与NAND直接键合
闪迪最新专利提出的方案,正是针对上述延迟问题的直接回应。根据专利文件,该设计将一块基于CBA结构构建的NAND闪存芯片置于计算芯片(如AI加速器或GPU)正下方,实现处理器与NAND的直接物理键合。
CBA结构本身将大容量NAND闪存阵列与CMOS逻辑层合二为一,而整个集成堆叠随后被安装于中介层之上。HBM芯片栈则附着于该组合堆叠的一侧或多侧,与NAND层共享同一中介层平台。
这一架构的关键在于重新定义了各类存储介质的分工边界:HBM负责处理即时性、高速内存操作,而NAND闪存层则承担读写密集型工作负载及大规模数据存储任务。据Wccftech报道,在此配置下,HBM仍被集成于系统之中,但其角色已从主导地位转变为整体存储-计算层级中的特定功能模块。
HBF之外的并行布局
值得关注的是,上述专利所呈现的架构方向与闪迪现阶段主推的HBF路线并非替代关系,而是并行推进的技术储备。闪迪目前仍在加速HBF的开发进程,HBF代表着其在近期可落地的高容量存储方案上的主要商业押注。
新专利所描述的处理器直接键合NAND的3D堆叠方案,则指向更长期的架构演进路径,旨在从根本上缩短计算单元与大容量存储之间的物理距离,从而在系统层面同时优化带宽、延迟与能效表现。
对于AI芯片设计商及封装技术供应链而言,闪迪此次专利布局释放出明确信号:存储与计算的深度融合正从概念走向具体技术路径,围绕中介层封装平台的生态竞争或将进一步加剧。










