地球上七千多种语言各成体系,发音词汇语法天差地别,却为何都有主谓结构,都能清晰划分名词与动词?《自然·人类行为》的一项重磅研究,为这个千古疑问给出了答案。研究团队深挖Grambank数据库中1705种覆盖全球所有语系和地区的语言样本,用贝叶斯空间系统发育分析排除亲缘、地理因素的干扰,对191条经典语言普遍规律展开验证,最终发现约60条规律通过了最严苛的检验。这三分之一的不变法则,不是冥冥之中的巧合,而是刻在人类认知深处的共同印记,是跨时空跨种族的思维共识。

汉语靠四声表意,属于孤立语无形态变化;英语有丰富屈折变化,重时态且是SVO语序;非洲土著语藏着独特搭嘴音,多式综合且后缀复杂。这些语言从表面看毫无关联,仿佛是随机演化的结果,可深入探究便会发现,其底层藏着高度统一的逻辑。语序的排布始终遵循和谐原则,这也是所有语言中最稳固的共性。日语、韩语、藏语这类SOV语序的语言,后置词、修饰语、助动词皆处于主要动词之后;英语、汉语、法语这类SVO语序的语言,前置词、修饰语、助动词则在主要动词之前;阿拉伯语、爱尔兰语这类VSO语序的语言,各类成分更是极致前置,介词与定语无一例外。这样的排布并非刻意设计,而是语言为了贴合人类认知,追求逻辑一致的必然结果,毕竟人类的大脑天生偏爱省力的表达,拒绝混乱的信息组合。
语法标记的优先级在所有语言中也高度趋同,30条相关规律中有24条得到实证。主语在表达中始终占据核心地位,优先级远高于宾语与间接宾语;数、性、格、时态的标注顺序固定,不会随意颠倒;现在时的表达权重高于过去时,过去时又高于未来时;实义动词、情态动词、助动词的层级划分更是清晰明了。词汇层面的共性更是刻入了语言的基因,名词与动词的划分是所有语言的标配,无任何一种例外。人称代词是交流的基础,我你他、我们你们他们的表达在各语言中都能找到对应;基础颜色词必含黑、白、红三色,在此基础上才会逐步扩展黄、绿、蓝等色彩;父母子女、兄弟姐妹的亲属称谓,更是每一种语言的必备内容,支撑起人类社会交流的基本框架。
关于语言的起源,学界的天赋论与功能论之争已持续百年。乔姆斯基的天赋论认为,人脑天生预装了普遍语法系统,如同电脑的出厂程序,儿童能在三年内轻松掌握复杂语法,不同文化下的语言习得轨迹高度相似,都是这一理论的有力佐证。但这一观点却无法解释,为何仅有三分之一的语言规律能全球通用,为何世间语言会呈现出如此多样的差异。格林伯格的功能论则另辟蹊径,1960年他分析30种语言后提出蕴含共性的观点,认为语言的共性并非先天存在,而是源于人类共同的认知模式、交流的实际需求与生理的天然限制,所有语言规律的最终指向,都是让信息传递更高效。此次1700种语言的研究,终于为这场百年论战画上句号。研究否定了强天赋论,证实不存在全人类统一的先天语法;同时印证了功能认知论的合理性,那些跨越时空的通用规律,是人类在认知最优解与交际压力下的趋同演化。人类本就拥有模式识别、序列学习、范畴化、效率偏好的通用认知工具包,在生存与交流的刚需驱动下,反复摸索中最终收敛出有限的语法方案,让语言的演化始终有迹可循。
这些被证实的语言共性,堪称人类认知的活化石,每一条规律的背后,都是认知省力原则的体现。人类大脑擅长分类与嵌套的信息处理模式,语言便顺势形成句子包含短语、短语包含单词的层级结构;常用的信息更易被大脑捕捉,因此主语、现在时这类高频内容会被优先标记,且表达形式更为简化;规律让语言拥有了可预测性,听者能根据固定规则预判后续内容,大幅降低理解成本。语言从来不是凭空产生的,而是为人类的生存与发展而生。名词与动词的划分,让人类能清晰区分事物与动作,在原始社会中精准识别猎物、躲避危险;人称代词明确了自我与他人的边界,是社会协作的前提;亲属称谓维系着血缘群体的联结,筑牢了人类社会的根基;黑、白、红三色对应着人类视觉感知最敏感的区域,是环境识别的必需。祖先状态重建的结果更令人惊叹,全球50余个独立语系、100余个地区的语言,演化轨迹竟惊人一致。孤立语言会慢慢形成清晰的词序规律,无形态语言会逐渐演化出语法标记,混乱的语序最终都会收敛到SOV、SVO、VSO三种最优解。正如研究负责人格雷所言,这是认知的引力在塑造语言,迫使所有语言朝着有限的最优结构前行。
语言与认知的关系,从来都是双向塑造,互为表里。语言会潜移默化影响认知模式,这便是弱萨丕尔-沃夫理论的核心。英语这类重时态的语言,会让使用者的线性时间观更强烈,对未来的规划意识也更突出;原住民的语言惯用东、西等绝对方向描述空间,使用者的空间记忆便格外出色;汉语这类量词丰富的语言,会让使用者更擅长对事物分类,对细节的感知也更为敏锐。而认知的发展,又会成为语言演化的核心动力。人类抽象思维的提升,推动语法不断复杂化,从句与逻辑连接词的出现,让表达的逻辑更严密;儿童在语言习得过程中,会天然选择更贴合自身认知的表达结构,这种偏好代代相传,成为语言演化的无形推力;大脑的工作记忆存在局限,仅能容纳4到7个信息单位,这便决定了语言的句子不可能无限延长,简洁高效始终是语言的核心追求。
这些藏在语言共性中的奥秘,更是人类文明的底层密码,揭开了人类统一起源的冰山一角。无论种族、肤色、文化有何差异,人类的大脑底层思维模式始终一致,这是人类能跨文化交流、能彼此理解的根本所在。语言就像认知的外衣,外表的花纹千变万化,内里的骨架却始终如一。那些看似天差地别的语言差异,不过是表层的形式,而认知的共性,才是支撑起所有语言的骨骼与基因。这一研究发现,也为人工智能的发展提供了重要启发。大语言模型之所以能实现高效的语言理解与生成,核心便是精准学习了人类语言的预测性、层级性与规律性,复刻了人类的认知最优解。
1705种语言的深度研究,撕开了语言差异的表象,让人类认知的统一本质浮出水面。那60条通用规律,并非天生的预装程序,而是人类在千百年的演化中,在共同的认知基础、生存压力与自然选择中凝结的智慧结晶。这是人类文明的底层源代码,是我们读懂自身思维、读懂语言本质、读懂人类共同体的关键钥匙。读懂了语言的共性,便读懂了人类本身,也让我们更清晰地看到,无论身处世界哪个角落,人类的思维深处,始终有着相通的灵魂。










