昊梵体育网

花更多钱,买更慢的回复,就因为是中文。这不是错觉,是实打实的数据。训练同样一个A

花更多钱,买更慢的回复,就因为是中文。这不是错觉,是实打实的数据。训练同样一个AI模型,用中文语料的成本比英文高出将近一倍。一个叫Claude的模型更狠,中文调用直接比英文贵65%。标榜“信息熵最高”的汉字,在AI眼里就是个待解压的乱码包。欧美公司靠堆显卡暴力破解算力瓶颈,这条路咱们走不通,因为汉字本身就是一道更高的墙。

这道墙不是今天才砌起来的。七十年代,全国印刷厂为了排出那几个常用的五六千个汉字,硬是堆了20万吨铅合金、200万副铜模。一辆卡车拉五吨,得拉四万趟。老外排报纸,26个字母捡起来就完事,咱们的排字工人得在几吨重的铅字架前跑来跑去。这还不算最绝的。一百五十年前,汉字差点被电报技术给灭了门。法国人搞出一套四码电报,每个汉字对应四个数字。发一封“母病速归”的电报,要经历汉字转数字、数字转嘀嗒声、嘀嗒声再转回数字、最后才变回汉字。折腾完这一圈,生僻字直接没人用了,连古代那些对仗工整的骈体文都发不起了。技术不但不等人,技术还会反过来重塑文化。

韩国人最懂这种疼。他们废了汉字几十年,结果法律条文全用韩文写出来,满纸都是同音歧义。一个发音对应好几个意思,法官判案都得吵半天。现在韩国宪法里四分之一的内容必须括号标汉字,不是他们想复古,是不标连法都立不了。这就是扔掉老拐杖之后才发现,自己其实是个瘸子。

那些吹嘘汉字在AI时代省算力的人,大概不知道一个最基本的事实:现在的AI是用英语思维训练出来的。你让一个只认识英文的人去处理中文,就像让一个只会炒菜的厨子去修发动机。不是汉字不行,是整个技术底座就没为汉字优化过。硅谷那帮人忙着教机器学语言,却从来没想过,有些语言从根上就不是为了被机器“读懂”而存在的。汉字是为人的大脑设计的,它调动形象思维,它形音义合一,它让一个掌握了三千字的人能读量子力学。但这些优势,在二进制面前一文不值。

真正有意思的是,学汉字的老外前三个月比学英语的慢四分之一,但半年后反超将近两成。人的大脑经过几百万年进化,天生就是为处理复杂图像长的。机器不是。所以别指望什么“汉字红利”了。红利从来不在技术里,红利在人身上。当全世界还在教机器认字的时候,中国人早就学会了用更少的字,想更深的事。至于机器认不认这笔账,那是硅谷的问题,不是汉字的问题。