
3月21日消息,在刚刚结束的华为中国合作伙伴大会2026上,华为重磅发布并展出了搭载全新昇腾950PR(Ascend 950PR)处理器的AI训练推理加速卡Atlas 350,并宣布该加速卡正式上市。

根据华为此前公布的资料显示,昇腾950PR芯片于今年一季度推出,基于SIMD架构,算力达到1PFLOPS(FP8)/ 2PFLOPS(FP4),支持FP32/HF32/FP16/BF16/FP8/MXFP8 /HiF8/MXFP4/HiF4等数据格式,互联带宽为2TB/s。内存容量和带宽上,昇腾950PR为128GB、1.6TB/s。
与前一代昇腾芯片相比,昇腾950PR在低精度数据格式、向量算力、互联带宽及自研HBM等方面实现大幅提升。与英伟达H20相比,该芯片的HBM(高带宽内存)容量是H20的1.16倍,达到了112GB,多模态生成速度可以提升60%;内存访问颗粒度从512字节减少到128字节,小算子访存效率提升4倍。
针对基于昇腾950PR芯片的Atlas 350加速卡的硬件参数,华为公布的数据是:FP4精度算力为1.56P,带宽达到了1.4TB/s;功耗为600W,是H20的1.5倍。

华为昇腾计算业务总裁张迪煊表示,Atlas 350的单卡算力达到了英伟达H20的2.87倍,是目前国内唯一支持FP4低精度的推理产品。这意味着,集成Atlas 350板块的服务器能够支持更大的模型以及时延更低的推理,精度小了,计算速度就会更快,寄存器效率业会更高。
据上海证券报报道,目前Atlas 350在互联网推荐场景的实测数据显示,该卡的时延更低、响应更快,特别适合短视频、电商、广告推荐等高并发场景。在大模型推理、文生图、文生视频等多模态场景,其性能也和英伟达的L20相当。
张迪煊也表示,基于Atlas 350等产品,结合AI发展趋势与客户需求,昇腾将打造大、中、小三大核心算力场景,助力伙伴满足差异化场景需求,共同深耕行业智能化。
在此次大会上,昆仑、华鲲振宇、神州鲲泰、长江计算、宝德、软通华方、百信7家华为核心伙伴在会上发布了基于Atlas 350的服务器整机产品,标志着昇腾950代际推理算力正式进入商用阶段。

软通动力旗下的软通华方在会上发布的“超强A860 A5”就是其中之一。软通动力计算产品事业群企业级产品研发管理本部总经理邓忠良将超强A860 A5比作赋能大模型时代的“核武级”算力。据介绍,超强A860 A5是一款6U2路AI服务器产品,搭载鲲鹏920新型号处理器,可支持8块昇腾Atlas350加速卡,具有超强算力、灵活拓展、安全可靠等特点,适合用于AI大语言模型训练和推理、AI加速计算、视频分析等应用场景。
科大讯飞集团副总裁、星火企业军团总裁刘江在会上表示,讯飞新一代星火大模型也将与昇腾910/950系列算力底座进行充分适配,为用户提供“懂行业、能干活、守规矩、会进化”的整体AI解决方案。
华为昇腾还联合20家行业头部伙伴,发布了2026昇腾AI应用场景解决方案,覆盖辅助办公、AI实训、电子病历、智能客服、政务办公等多个行业核心场景,以“轻量部署、快速落地、可规模复制”的特点,破解行业智能化部署复杂、周期长的痛点。
值得一提的是,近期基于OpenClaw的“养虾”热潮再度激起了相关AI一体机的需求。华为副总裁、ICT产品组合管理与解决方案部总裁马海旭在会上透露,过去一个多月已有十几家合作伙伴推出了基于昇腾的OpenClaw一体机。截至目前,昇腾已联合伙伴打造400多款行业一体机,服务客户逾2700家,占据国内一体机市场80%以上份额。
编辑:芯智讯-浪客剑 部分资料和图片来源:上海证券报