很多人吹字母语言“精准”,理由是专用名词多、歧义少。但如果你真翻开汉语的老底,会发现一个恐怖的事实——这套“精准”的把戏,我们的祖先早玩腻了,然后直接扔了。
为什么扔?因为那玩意儿,纯属给自己找不痛快。
一、先看一组让你头皮发麻的汉字
下面这些字,全都和马有关:
骐、骅、骝、骃、骓、骆、骢、驷、驸、骁、骠、骥、骊……这还算常见的。
再往下翻,你就不认识了:
馰(额头上白毛的马)、馵(左后蹄白毛的马)、騚(四蹄全白的马)、驓(膝下白毛的马)、驠(屁股白毛的马)、駺(白尾巴的马)、騴(尾巴根白毛的马)……
这还只是按“白毛位置”分的。按毛色,有骍(赤色马)、骊(纯黑马)、駽(铁青马)、騟(紫色马);按身高,有骄(六尺)、騋(七尺)、駥(八尺);按年龄,有驹(两岁以下)、騑(三岁)、駣(三四岁)。

光马这一种动物,汉语曾经造出上百个专用字。
这套系统“精准”吗?精准到变态。一个懂行的人,看到一个“馰”,就知道这马额头上有白斑,不用多说一个字。
但问题来了——这套系统现在还活着吗?
没活下来。除了“骐”“骅”“骝”这些零星几个,大部分都进了故纸堆,成了考古学家的研究对象。
为什么?因为成本太高。
二、字母语言正在走的,就是这条老路
英语里“羊”叫sheep,“羊肉”叫mutton,不是“sheep meat”。牛叫cattle,牛肉叫beef,不是“cattle meat”。猪叫pig,猪肉叫pork,不是“pig meat”。

每个新东西,都要造一个新词。医学里,每个病名来自拉丁语;法律里,每个术语来自法语。学一个专业,先背几百个“专用词根”。
这叫什么?这叫词汇膨胀。
牛津词典收录的词超过60万,还不算技术术语。一个新入行的医生,要记几万个拉丁词根。一个新律师,要背几百年的判例专用语。
这套系统“精准”吗?精准。代价是什么?学习成本指数级上升。
汉语的选择是什么?
用组合代替创造。
“马”字就一个。白额头马?叫“白额马”。四蹄白的?叫“四蹄白”。两岁以下的?叫“马驹”。三岁的?叫“马驹”也行,加个“三岁”就行。
不是造不出专用字,是不想造了。
秦始皇书同文,干的其实就是一件事:把几百种地方写法,压缩成一套通用体系。这套体系不是“牺牲”了什么,而是把冗余砍掉了。

三、信息密度这个指标,汉语是碾压级的
国外有研究机构做过测算:同样一段联合国宪章,中文版比英文版短三分之一,比法文版短一半。
语言学里有个概念叫“信息密度”。汉语每个音节承载的信息量,在主流语言里排第一。
为什么?因为汉字是二维的。一个字,能同时传递音、形、义三层信息。字母文字是线性的,一个词拉得越长,消耗的时间越多。
中文打字速度也更快。同样的内容,用拼音输入法打出来,按键次数比英文少。
这不是什么“民族自豪感”自嗨,是硬指标。
四、更深一层:汉语的“高效”是文明选择的结果
你看上面那堆“马”字,它们消失不是偶然。
秦汉之后,中国进入大一统时代。一个中央政府要管理几千万人,文书要传遍全国。如果每个地方都用自己的“马”字,公文怎么看得懂?

统一,必然要求简化。简化,必然要求用组合替代造字。
这套逻辑跑了2000年,跑出来的结果是什么?是汉字用3000多个常用字,组合出覆盖现代科技、经济、文化的所有词汇。
“电脑”不是新造字,“互联网”不是新造字,“芯片”也不是。都是老字新组。
字母语言呢?互联网是internet,芯片是chip,每个都是新词,每个都要从头学。
五、一个被忽视的事实:汉语的“灵活”正在成为优势
现在大语言模型训练,中文语料的优势开始显现了。
因为汉字组合的灵活性,同样一个概念,中文可以用更少的token表达。训练成本更低,推理速度更快。这不是我瞎说,AI圈子里已经有人在讨论“中文是否天然更适合大模型”。
另一个领域:国际标准。越来越多中国企业在参与制定国际标准时,直接用中文术语参与讨论,再翻译成英文。因为中文术语的逻辑更清晰,组合更合理,外国专家反而要反过来学中文概念。

六、回到开头的问题:汉语牺牲了什么?
答案是:它牺牲了“为每一个细分概念造一个专用词”的冲动。
这不是牺牲,是进化。
英语现在每增加一个专业领域,就要增加一套词根。医学词根来自拉丁,计算机来自英语,法律来自法语。一个美国学生,学完本科,词汇量可能只有两三万,但生僻词已经认不全了。
汉语不是。一个中国高中生,3500个常用字认全,大学教材、科技文献、法律条文,都能读。新概念来了,看一遍组合就懂。
这套系统的底层逻辑,不是“造新字”,而是“用旧字”。
黄奇帆说过一个观点:人民币国际化不走美元老路。汉语也一样——它没有走“词汇膨胀”的老路。
两千年前,我们的祖先面对上百个“马”字,做了一个选择:砍掉它们,用组合替代。这个选择在当时看是“损失”,在今天看,是超前两千年的系统优化。
结尾
有人说汉语“不精准”。那是因为他不理解,精准不是靠堆词实现的,是靠逻辑实现的。
一个“骐”字,精准到极致,但没人用。一个“青黑色花纹的马”,七个字,谁都懂。
语言的第一功能不是炫技,是沟通。汉语把这条底线守了两千年,从来没丢过。
下一篇:没有了