这个过程充满了不确定性。他们需要花费巨额算力去验证哪些路走不通,去发现模型训练中的"地雷"和"陷阱"(如灾难性遗忘、对齐难题)。每一次失败,都是对未知领域的一次排除。
一旦探索成功,他们便定义了新的"道路标准"。例如,GPT系列模型定义了大语言模型的交互范式,这使得后来者必须遵循或在其基础上进行微调。
简而言之,美国把算力用在了"发现可能性"上。他们用昂贵的算力成本,换取了对技术方向的定义权和话语权。
中国的模式:用算力"通车",优化应用效率
反观中国,我们的AI力量更多地集中在如何让技术更好地服务于社会和经济。我们是在一条已经被证明可行的"公路"(深度学习框架、Transformer架构)上,努力跑更多的车,运更多的货。
阿里、腾讯、百度以及Kimi等中国AI力量,将算力主要用于模型的微调、垂直场景的适配以及产品化落地。我们的目标是"从1到100"--如何让AI在电商、社交、办公、教育等领域产生实际价值。
我们不遗余力地用算力去优化推理速度,降低响应延迟,压缩模型体积,以适应海量用户的并发需求。这就像在一条修好的公路上,我们致力于研发更节能的汽车、制定更高效的交通规则,以期在单位时间内通过更多的车辆。
中国拥有全球最丰富的应用场景和最庞大的用户数据。我们利用这一优势,在应用层面实现了对美国的追赶甚至局部超越。例如,在智能客服、内容生成、城市治理等领域,中国AI的应用深度和广度都令人瞩目。










