首页 > 汽车笔记 > 汽车笔记 > 华为清华联手,研发28nm存内计算芯片

华为清华联手,研发28nm存内计算芯片

发布时间:2026-02-27 18:57:26来源: 18811119908

2月26日消息,2月15日-19日,在被业界誉为“芯片设计国际奥林匹克会议”的国际固态电路大会(ISSCC 2026)上,清华大学、华为等大学与公司的研究人员发表论文,首次提出一款基于HYDAR框架的28nm混合存内计算(CiR)芯片的推荐系统(RecSys)加速器。



这款36M RRAM CiR芯片能实现390K QPS的吞吐率与1574K QPS/W能效比。其构建的多芯片系统可实现百万级实时端到端推荐系统(RecSys)。



▲芯片显微照片与系统概述

在实际推荐系统任务中,CiR通过扩展至576M规模的多芯片系统,QPS提升了66倍,QPS/W提升181倍,准确率与CPU相当



▲芯片性能与当前顶尖设计的对比

该芯片的核心优势包括:采用DL-ADC实现非Top-K计算的早期终止;基于预测的预取调度流水线(PPSP)数据流提升不规则工作负载的吞吐量;由粗到细的检索架构(coarse-to-fine)在保证系统召回精度的同时,可扩展至大规模应用。

推荐系统中的核心运算单元是相似向量检索(SVS),该方式通过计算查询向量与大规模向量库之间的距离,检索出Top‑K最邻近向量。

SVS会占据推荐系统绝大部分的计算时间与功耗,主要原因是外部存储器访问(EMA)开销。其中,采用混合键合技术的DRAM加速器成本高昂,基于NAND TCAM的加速器存在读取延迟高、数据与距离表示精度有限等问题。

针对上述痛点,研究人员提出一种基于RRAM的数模混合存内计算加速器HYDAR,可实现高吞吐量、高能效、高精度的SVS。

基于RRAM的存内计算(Compute-in-RRAM,CiR)因能最大限度减少数据移动、存储密度高、并行度极大,已被公认为深度学习加速的极具前景的技术路线。但将CiR应用于SVS仍会带来额外挑战,如能耗与延迟急剧增加、降低PE利用率与吞吐量、精度降低等。

汽车笔记更多>>

6999起三星S26系列发布丨硬件防窥屏 安卓机皇? 三星研发部门负责人解释Galaxy S26系列手机未原生集成磁吸功能 魅族科技宣布战略转型,将暂停国内手机新产品自研硬件项目 魅族第一个停更!内存涨价潮下手机厂商承压 华为清华联手,研发28nm存内计算芯片 又一国产全模态视频大模型杀入Artificial Analysis榜单Top 2 苹果警告旧版Home家庭架构今起停用 OPPO K14x 5G手机海外发布,配置与售价全曝光 华为nova16系列再次确认:三芯分层+方形前摄革新,定价诚意拉满 OPPO Find X10系列配置曝光:2nm芯、双2亿主摄,堆料不讲武德 ColorOS再次发力:二月体验升级大揭秘,覆盖众多机型! 小米17 Max再次被确认:取消副屏和加大电池,两亿像素也没跑了 iQOO Z11系列突然入网:90W+9000mAh,还有LCD屏幕! 三星Galaxy S26系列完整规格曝光,预计2月25日正式发布 京东高端手机Top10,华为Mate 80六连冠,iQOO 15 Ultra大亮 CounterPoint报告2025全球手机存量:8大品牌破2亿 分析师:苹果iPhone 18 Pro系列起售价将与前代持平 苹果即将移除iTunes愿望清单功能,提醒用户迁移内容 苹果预计本月推出搭载M5 Pro/Max芯片的新款MacBook Pro笔记本电脑 联想拯救者Y700 2026款小平板配置曝光:骁龙8E5处理器配8.8英寸3K LCD屏 SK海力士、闪迪:2025Q4 NAND闪存平均单价上涨30%以上 PGYTech蒲公英RetroVa摄影套件亮相,适配苹果iPhone多机型 Mate 80卖爆!华为拿到1月中国手机市场份额第一名:份额提升至18.6% 人民日报头版力挺,OPPO折叠屏技术引苹果学习! 《后厂村AI派》正式启动:Pitch Your Next Move! 中途退学的艺术生,开发Web 3D项目,周下载量破400万 印奇挂帅后,阶跃星辰最强开源模型登场!六大国产AI芯片已适配 Moltbook漏洞大到可以冒充Karpathy发帖,黑客都急了 苹果妙控键盘固件更新,覆盖M4/M5款iPad Pro与M3 Air机型 昔日HDD巨头Conner重生回归!进军外置存储与手机周边