据RISC-V国际基金会数据,2024年全球基于RISC-V指令集的芯片出货量超百亿颗,其中30%应用于AI加速场景。 在刚刚结束的第五届RISC-V中国峰会上,RISC-V芯片在人工智能和大模型推理方面的应用也备受关注。 多名业内专家表示,AI推理的算力需求呈现新特征,这让RISC-V芯片在大模型推理领域有非常大的应用潜力。 RISC-V为大模型推理降本增效 中国科学院计算技术研究所副所长、中国开放指令生态(RISC-V)联盟秘书长包云岗表示,AI推理的算力需求呈现新特征,RISC-V+AI将成为未来新组合。AI与CPU的紧密协同设计,将对RISC-V提出多样化需求。 知合计算CEO孟建熠则认为,RISC-V在通用计算方面一定可以落地,在AI推理上面也可以做得很好。 “通用计算需做到足够的高性能、高能效,AI推理则需要在性能和成本上做的比较好。通过RISC-V的可扩展性、可定制性,能够把这两方面做好。并且,RISC-V还能更好地实现统一地址寻址、存储访问优化、高计算效率,可以实现传统AI计算做不了的事情。” 中兴微电子副总经理石义军表示,RISC-V在大模型推理领域有非常多的应用机会。他分享了大模型领域的发展趋势,:“随着DeepSeek等MOE模型的出现,让计算重心从算力转向效率,RISC-V在新型MOE架构下帮助大模型推理降本增效,有非常多的机会。未来整个模型呈现稀疏性,总参数量大幅上升,而每个token对应的活跃参数量大幅下降,因此每一次推理所调用的算力在下降。不过,每个token推理的存储容量和带宽需求大幅上升。” 石义军提到,模型架构还会继续优化,算力架构需要新型AI算力支持,超长的上下文需求对存储管理提出新的要求。在大模型推理浪潮下,掀起下一代AI算力的需求和更新。而CPU如何更好地支持新型AI算力,成为发展重点。RISC-V指令集和架构的开放性和灵活性,能更快更好赋能CPU下一代新型算力。 目前,RISC-V架构在大模型推理上机会与挑战并存。在挑战方面,RISC-V架构的多核同步性能待完善,与ARM LSE等扩展存在差距。“大模型芯片采用多核扩展来适应不同的模型尺寸,如何有效降低同步代价,是RISC-V在大模型推理架构创新的关键。此外,超大规模参数下,多芯片互联通讯的效率也将成为瓶颈,RISC-V如何融入现代AI通讯生态,也很重要。”石义军称。 此外,RISC-V架构的AI扩展标准化尚待完善,架构和技术成熟度也还不够,矩阵指令方案尚未收敛,AI软件栈标准亦有待完善。 石义军表示,正积极推进RISC-V在AI场景中的应用机会,寻找本地化部署一体机和小规模推理集群成本的最优解,以及云端大规模部署中,寻找RISC-V CPU和GPU高效协同的最优解。 “我们正与新思科技合作,通过Chiplet技术实现RISC-V CPU与GPU的高效互联。”石义军透露,这一方案已在中兴微电子的AiCube训推一体机中应用,兼容DeepSeek等大模型,降低企业AI部署成本。 石义军称,RISC-V在大模型推理中的成功取决于技术突破与生态共建的双重推进。他呼吁,行业应构建开放共享的RISC-V产业链,完善行业标准,培育RISC-V人才,构建可持续的RISC-V生态体系,落地通算和大模型推理场景,打造有竞争力的解决方案,打通产业上下游RISC-V应用。 消费电子、汽车等领域加速落地 《科创板日报》记者从峰会现场获悉,RISC-V芯片在智能手表、手环、智能摄像头等领域正在落地,市场培育已经成熟。 根据SHD Group报告的统计预测,基于RISC-V的SoC芯片从2024到2031年期间的市场渗透率将从5.9%增长到25.7%,到2031年RISC-V出货量将超过200亿颗。预计将在以下六大市场占据显著份额:消费电子(39%)、计算机(33%)、汽车(31%)、数据中心(28%)、工业(27%)和网络通信(26%)。 在阿里达摩院的玄铁展台上,《科创板日报》记者看到了RISC-V处理器在边缘和AI智算、服务器及周边、数据存储、消费电子、汽车电子、网络通讯、智能工控等领域的应用。 在消费电子领域,玄铁团队与凌思微、博流智能,以及上市公司全志科技、东软载波等合作。 比如,石头扫地机器人内置搭载玄铁E906处理器的全志 MR527芯片,汤姆猫AI语音情感陪伴机器人内置搭载玄铁C906处理器的全志R128芯片,卡片相机内置搭载玄铁E907处理器的全志V851s芯片,台电P50AI平板电脑内置搭载玄铁E902处理器的全志A733芯片,Insta360 Go3s运动相机内置搭载玄铁C906处理器的全志F133芯片等。 (文章来源:科创板日报) |
1 小时前
1 小时前
1 小时前
1 小时前
1 小时前