荣格工业资源APP
了解工业圈,从荣格工业资源APP开始。
当手机AI摄影卡顿、智能汽车环境感知延迟时,很少有人知道,问题根源可能藏在计算机半个多世纪前的架构设计里。
传统冯·诺依曼架构将计算与存储分离,就像工厂与仓库分处两地,数据每次运算都要在“仓库”(内存)和“车间”(计算单元)间来回搬运——这一被称为“内存墙”的瓶颈,如今已成为制约AI性能提升的关键,尤其在需要海量数据处理的场景中,数据搬运的能耗甚至占整体能耗的90%,效率短板愈发明显。
而存算一体芯片的出现,正以“车间建在仓库里”的创新思路,为破解这一难题提供了新方向。
存算一体的核心逻辑,是让计算“靠近”数据。它通过将计算单元直接嵌入存储阵列,省去数据反复搬运的步骤,就像在货架旁直接完成分拣,大幅降低能耗与延迟。
实现这一突破的关键,在于忆阻器(ReRAM)等新型存储器件的应用:忆阻器既能像传统内存一样存储数据,又能通过电阻变化完成逻辑运算,天然具备“存储-计算融合”的物理特性。比如在AI推理中,传统架构需要将权重数据从内存读取到CPU/GPU,而基于ReRAM的存算芯片可直接在存储阵列内完成矩阵乘法运算,数据“零搬运”即可输出结果。
当前存算一体技术主要分为三大路线,各有侧重。SRAM-CIM(静态随机存储器存算一体)速度快、可靠性高,像“快递站”一样适合小容量、低延迟的端侧场景,比如手机AI降噪,但成本较高、容量有限;
DRAM-PIM(动态随机存储器近存计算)容量大、成本低,更像“大型仓库”,适合数据中心的大规模数据处理,不过运算速度略逊于SRAM路线;
而ReRAM为代表的新型非易失性存算路线,则兼顾了高容量、低功耗与较快速度,是当前业界关注的重点方向,尤其适配AI端侧与边缘计算场景。
实际性能数据更能体现存算一体的突破。知存科技的WTM系列芯片,在端侧AI推理场景中,能效比达到传统GPU的30倍以上,单芯片可支持语音识别、图像分类等多任务;后摩智能M50芯片则将算力密度提升至每平方毫米1TOPS,延迟较传统架构降低80%,能满足智能驾驶对实时性的严苛要求。
更具创新性的是北京大学团队研发的存算一体化排序芯片——它跳出传统排序依赖比较器的思路,创新设计出无需比较器的排序架构,在处理北京地铁路径规划等复杂任务时,数据处理效率较传统芯片提升10倍,且能耗仅为后者的1/20,让“复杂计算低功耗化”成为现实。
图片来源:豆包
这种“高能效、低延迟”的特性,让存算一体在多个场景中展现出巨大潜力。在端侧AI领域,它能让手机、智能家居设备在本地完成复杂AI运算——比如手机拍照时实时优化人像虚化效果,无需依赖云端,既保护隐私又提升响应速度;在机器人领域,存算芯片可支持机器人实时识别环境障碍物,避免传统架构因数据搬运延迟导致的反应滞后。而在边缘计算场景中,智能汽车的激光雷达、摄像头需要每秒处理海量环境数据,存算一体芯片能以低功耗实现毫秒级数据处理,为自动驾驶的安全决策提供保障。
不过,存算一体技术的普及仍需跨越认知与技术的双重门槛。一方面,需用更通俗的方式解读技术原理,避免因“存算融合”“忆阻器”等术语让普通读者望而却步;
另一方面,不同应用场景对芯片的算力、容量、成本需求差异较大,如何实现技术路线与场景的精准匹配,仍是业界需要探索的方向。
但不可否认的是,随着技术不断成熟,存算一体芯片正从实验室走向产业应用,它不仅打破了“内存墙”的束缚,更将成为AI算力的新引擎,推动智能设备向“更轻、更快、更节能”的方向发展,为零碳社会与智能生活的落地提供核心技术支撑。