中国为什么不拆开英伟达的显卡研究,从而造出自己的国产显卡?
拆解英伟达显卡的工作其实一直在做。研究人员用专业设备一层一层扫描GPU芯片,记录晶体管怎么排列、内存接口怎么连接。
这些信息能大致还原并行计算的框架,对理解设计思路有帮助。但是从拿到数据到造出能用的芯片,中间差得远。英伟达现在的高端产品靠5纳米甚至更小的制程,这得用极紫外光刻机在硅片上刻出极细的图案。
中国大陆的设备主要还是深紫外那一套,通过多次曝光叠加来实现7纳米级别生产。结果就是良率不高,很多晶圆达不到标准,整体成本比别人高出一大截。
制造基础差了,抄也抄不齐全。SMIC目前就卡在7纳米节点,用多重曝光技术硬顶,但成品率和能效跟英伟达用极紫外设备的差距明显,批量做AI训练芯片时功耗和稳定性都吃亏。
知识产权保护也是绕不过去的坎。英伟达的GPU从架构到具体优化算法,专利申请了一大堆。
假如直接照着拆解结果做产品,很容易被认定侵权。国外代工厂像台积电一看订单就摇头,不想惹官司上身。中国企业这些年也重视合规,宁可慢点也不冒险走灰色路线。
实验室里分析出来的东西最多当做学习材料,用在自家开发上还能参考,拿来直接复制就麻烦了。
后期万一打官司,不仅产品卖不出去,还可能影响整个供应链的信誉。这么算下来,风险太大,不值得。英伟达专利覆盖面广,国际上很多公司都吃过亏,中国企业现在更倾向于避开这些雷区,专注自己从头设计。
软件这一块更是关键。英伟达CUDA平台用了十几年,全球几百万开发者都熟悉这套工具,训练大模型、跑推理任务都靠它。中国有昇腾的CANN框架,还有其他公司在做类似的东西,但开发者迁移起来费劲。
代码要重写,模型要重新调优,兼容性测试一轮接一轮。有些AI团队试过用国产硬件跑项目,发现互联速度或稳定性跟不上,又得切回合规的英伟达芯片。
生态不是光有硬件就行,得让大家愿意用、用得顺手才成。现在国产软件还在追赶阶段,短期内没法完全替代。
DeepSeek这样的团队就遇到过类似情况,硬件换了之后训练效率掉下来,只好部分回退。这说明软件栈的积累需要时间,不是拆几张卡就能解决的。
