公开指控中国三家大模型公司非法蒸馏攻击,Anthropic的指控站得住脚吗?(4)

2026-02-28 13:32  钛媒体APP

Anthropic用户协议中存在"禁止用于训练竞争性模型"的条款,一方面,"竞争性模型"的定义模糊不清。另一方面,即便相关企业违反了禁止将模型输出用于竞争模型训练的用户协议,其承担的主要是合同法上的违约责任,但这并不等同于实施了不正当竞争行为。通过正常且付费的API调用获取公开输出,是否构成入侵系统获取底层代码或参数,值得商榷。

综上所述,受访律师认为,Anthropic的指控在现行法律框架下,无论是从版权还是不正当竞争的角度,都面临着相当大的举证困难和法律适用障碍。Anthropic选择发布公开报告而非提起正式诉讼,或许与上述法律层面的挑战不无关系。

蒸馏不是"万能药",省下成本省不下创新

尽管在法律上难以被严格界定为"窃取",但模型蒸馏在商业战略层面无疑是一把双刃剑。它为AI领域的追赶者提供了一条看似高效的"捷径",但也带了局限和挑战。

首先是能力天花板和创新能力受限。学生模型的能力上限被教师模型牢牢锁住,它能学会老师教的知识,却很难超越老师,更无法实现真正的源头创新。

Frank告诉「AIX财经」,蒸馏后的模型大多会做轻量化处理,虽然参数更少、算力需求更低,但在处理复杂、全新任务时也会表现不佳,甚至出现输出不稳定的情况,能力天花板有限。

他进一步解释,如果原模型的思维偏理性,类似于"数学老师",蒸馏后的模型也会延续这一特点,在语文等其他领域的能力可能会相对薄弱。

过度依赖蒸馏也会使模型在回答风格和思维范式上趋同于教师模型,丧失独特性和创造性,难以形成差异化的竞争优势。

其次是缺陷被继承。Frank表示,教师模型存在的偏见、幻觉、错误认知等问题,会被蒸馏后的模型原样继承,且由于学生模型不具备自主纠错的能力,这些缺陷会被固化甚至放大。