官方网站-首页官方网站-首页

2025-08-20 03:01:59

“存算一体”:大模型时代端边算力瓶颈的破局者?

【导语】随着信息时代数据量的爆炸式增长和人工智能技术的迅猛发展,传统冯·诺依曼架构在AI浪潮中遭遇“功耗墙”和“内存墙”两大难题。在此背景下,存算一体技术应运而生,旨在通过颠覆式创新打破算力瓶颈。近年来,存算一体技术凭借解决数据搬运难题、提升计算效率的优势,与大模型的发展需求完美契合,市场前景广阔。后摩智能作为国内存算一体AI芯片的先行者,于WAIC 2025期间推出了M50芯片及其产品矩阵,标志着端边智能新时代的开启。在即将举行的“IOTE 2025深圳・边缘计算产业生态大会”上,后摩智能将分享更多关于存算一体技术在端边算力提升、应用场景拓展等方面的思考与实践。

  近年来,随着信息时代的数据大爆炸以及人工智能浪潮的到来,尤其是大模型技术的广泛应用,其训练和推理所需处理的数据量呈指数级增长。而基于“存储-计算分离”原理的冯(féng)·诺(nuò)依(yī)曼(màn)架(jià)构(gòu)虽(suī)独(dú)具(jù)优(yōu)势(shì),但(dàn)在(zài)AI浪(làng)潮(cháo)中(zhōng)已(yǐ)显(xiǎn)疲(pí)态(tài),存(cún)在(zài)着(zhe)不(bù)容(róng)忽(hū)视(shì)的(de)局(jú)限(xiàn)。

  在(zài)传(chuán)统(tǒng)冯(féng)・诺(nuò)依(yī)曼(màn)架(jià)构(gòu)中(zhōng),数(shù)据(jù)需(xū)要(yào)在(zài)存(cún)储(chǔ)单(dān)元(yuán)与(yǔ)计(jì)算(suàn)单(dān)元(yuán)间(jiān)频(pín)繁(fán)搬(bān)运(yùn),导(dǎo)致(zhì)大量的资源被浪费在数据搬运这一环节上。根据英特尔的研究表明,当半导体工艺达到7nm时,数据搬运功耗高达35pJ/bit,占总功耗的63.7%。数据传输造成的功耗损失越来越严重,限制了芯片发展的速度和效率,形成了“功耗墙”问题。

  此外,在冯·诺依曼架构中,存储器与处理器是两个完全分离的单元,处理器根据指令从存储器中读取数据、完成运算,并存回存储器。但随着人工智能、大数据等新兴技术的迅猛发展,计算任务对数据处理的速度和规模提出了前所未有的高要求。而当下的存储器的数据访问速度跟不上计算单元的数据处理速度,二者之间形成了巨大的性能差距,“内存墙”问题日益凸显。

  面对大模型推理对算力需求的持续拉动,如何攻克“功耗墙”“内存墙”等难题已然成为了工业界和学术界的焦点问题,一场旨在突破现有算力瓶颈的革命正蓄势待发。

  在此背景下,“存算一体”正试图用一场颠覆式创新打破这一僵局。近年来,在半导体工艺持续突破与AI算力需求爆发的双重推动下,存算一体技术迎来了新的发展机遇。

  从原理上来看,存算一体的核心是将存储功能与计算功能融合在同一个芯片上,直接利用存储单元进行数据处理——通过修改“读”电路的存内计算架构,可以在“读”电路中获取运算结果,并将结果直接“写”回存储器的目的地址,不再需要在计算单元和存储单元之间进行频繁的数据转移,消除了数据搬移带来的消耗,极大降低(dī)了(le)功(gōng)耗(hào),大(dà)幅(fú)提(tí)升(shēng)计(jì)算(suàn)效(xiào)率(lǜ)。

  正(zhèng)是(shì)基(jī)于(yú)这(zhè)样(yàng)的(de)特(tè)性(xìng),存(cún)算(suàn)一(yī)体(tǐ)有(yǒu)力(lì)地突破冯·诺依曼架构所面临的瓶颈限制。

  存算一体属于非冯诺伊曼架构,在特定领域可以提供更大算力(1000TOPS以上)和更高能效(超过10-100TOPS/W),明显超越现有ASIC算力芯片。除了用于AI计算外,存算技术也可用于感存算一体芯片和类脑芯片,代表了未来主流的大数据计算芯片架构。

  近年来,大模型的蓬勃发展与广泛应用,其对强大算力和高存储带宽提出了迫切需求。而存算一体技术凭借其解决数据搬运难题、显著提升计算效率的优势,与大模型的发展需求完美契合。与此同时,大模型计算的应用场景正从云端逐步向端边侧拓展延伸,这一趋势为存算一体技术带来了更为广阔的发展空间。

  根据量子位智库数据,预计2025年存算一体市场规模将达125亿元,随着技术成熟度提高以及大规模商用落地,至2030年这一市场规模将达1136亿元。

  面(miàn)对(duì)极(jí)具(jù)潜(qián)力(lì)且(qiě)规(guī)模(mó)不(bù)断(duàn)扩(kuò)张(zhāng)的(de)市(shì)场(chǎng)前(qián)景(jǐng),存(cún)算(suàn)一(yī)体(tǐ)芯(xīn)片(piàn)成(chéng)为(wèi)了(le)科(kē)技(jì)领(lǐng)域备(bèi)受(shòu)瞩(zhǔ)目(mù)的(de)焦(jiāo)点(diǎn)。越(yuè)来(lái)越(yuè)多(duō)的(de)企(qǐ)业(yè)正(zhèng)竞相投身存算一体芯片领域,并不断加快布局进程。国内诸如恒烁股份、亿铸科技等企业,均依托自身优势在不同技术路线上积极开展探索,力求在存算一体芯片市场中占据一席之地。

  而在这股热潮下,后摩智能作为国内存算一体AI芯片的先行者和落地者,具有显著的代表性,其探索历程与实践成果生动展现出了我国存算一体芯片技术的多元化发展图景。

  在大模型技术迅猛发展、应用场景持续拓展的大背景下,市场对于适配大模型的高性能芯片需求日益迫切。基于这一趋势洞察,后摩智能凭借在存算一体技术领域的前瞻性布局与深厚技术积累,于2023年年底果断调整研发方向,将重点转向基于大模型的应用需求,全力投入存算一体AI芯片的研发工作。

  经过不懈努力与技术攻关,后摩智能迎来了重要时刻。在WAIC 2025期间,后摩智能的后摩漫界®M50芯片正式对外亮相,并同步推出力擎™系列M.2卡、力谋®系列加速卡及计算盒子等硬件组合,形成覆盖移动终端与边缘场景的完整产品矩阵。

  据了解,后摩漫界M50定位到了端边大模型应用场景。M50芯片采用存算一体计算架构,实现了160TOPS@INT8、100TFLOPS@bFP16的物理算力,搭配最大48GB内存与153.6GB/s的超高带宽,而典型功耗仅10W,相当于手机快充的功率。这一性能指标意味着,PC、智能语音设备、机器人等智能移动终端无需依赖云端,即可高效运行1.5B到70B参数的本地大模型,真正实现了“高算力、低功耗、即插即用”的愿景。

  后摩智能的M50芯片及其产品矩阵的发布,标志着端边智能新时代的正式开启。通过存算一体技术的深度融合,后摩智能成功解决了端边设备在算力、功耗与带宽方面的痛点,为消费终端、智能办公与智能工业等领域提供了高效、安全、低成本的AI解决方案。

  值得一提的是,8月27日,在深圳国际会展中心(宝安)举办的“IOTE 2025深圳・边缘计算产业生态大会”上,后摩智能产品市场负责人张伟超将发表“大模型时代的算力革命-‘存算一体’重塑端边智能体验”主题演讲,为我们带来更多后摩智能关于存算一体技术在端边算力提升路径、应用场景拓展以及与边缘计算生态深度融合等方面的结合与思考。

f692cc90be2e85801e0454889edf9c26.png

关注公众号 联系电话