耿同学对此的概括非常直白:"编造者甚至没有花心思和时间去做一组随机数据,而是完全随心所欲地人为乱填。如果用心去编,其实我是看不出来的。"
这恰恰说明技术逼出了造假者的真实水平。一个在造假时都不愿意花心思的人,足以说明在这个生态里,造假已经成了一种常规操作,没有人觉得会被发现。
本质上,耿同学只不过是把学术争议从学术辩论降维成了数据判断题。他没有和你去争论学科里面的那些高深的知识,只是从大多数只需要有一定观察与推理能力就可以发现的问题问你:
这组数据的末位分布符合统计学规律吗?这两张图片相似度是多少?这组数据有没有在其他表格中出现过?
这些都是可以用算法来回答的,而且答案只有"是"或"否",没有任何灰色地带。
不得不说,耿同学这套打法已经成了可复制的、人人都能掌握的工具,只要是有心人都可以试试。

文学圈的回响
如果说耿同学的故事是"技术赋能"的第一版本,那么"抒情的森林"的故事就是第二版本--它同样印证了技术正在把监督权从中心推向边缘,只不过用的是另一种工具。
抒情的森林是谁?从公开信息来看,他是一位普通的读书博主。从2024年10月开始,他陆续公开了数十位作家已出版作品中与其他作家相似的部分语句和段落,引发舆论剧震。
他在一次采访中坦陈:"我从0人关注开始发帖,很少下判断,只呈现文本对比。直到今天,我更多的也只是展示事实本身,将判断交给看帖子的人。"
过去界定抄袭,需要专家意见,需要法律程序,需要大量的专业辩论。而现在,抒情的森林只用了最基础的"文本比对"--这是任何一个识字的人、会使用搜索引擎的人都能独立完成的。
比如,他把贾平凹的《三十未立》和美国作家华盛顿·欧文《英国的农村生活》并列排在一起,让读者看到两段文字几乎完全相同,这样简单的技术工具就可以让传统上依赖专家权威才能做的事情,变成了任何人都能参与的"判断题"。
在这一点上,耿同学和抒情的森林是殊途同归的,一个靠的是AI图片比对和统计学分析,把高深的学术论文变成了数据题;另一个靠的是文本比对和互联网搜索,把模糊的抄袭争议变成了直观对照。










