世界领先的人工智能公司用超级计算机来训练它们的聊天机器人,这些超级计算机需要多达1.6万个芯片,甚至更多。但DeepSeek的工程师却说,他们只用了约2000个英伟达生产的专用芯片。
这些芯片是美中激烈技术竞争的核心。随着美国政府努力保持本国在全球人工智能竞争中的领先地位,它正在试图对能出售给中国以及其他竞争对手的高性能芯片施加限制。
可如今,DeepSeek大模型的表现让人们对美国政府贸易限制的意外后果产生了质疑。
DeepSeek聊天机器人能回答问题、解决逻辑问题,并编写自己的计算机程序,其能力不亚于市场上已有的任何产品。关键在于,其造价非常低,打破了只有最大的科技企业(全都在美国)才能制造出最先进的人工智能系统的普遍观念。
根据中国工程师的说法,他们只花了约600万美元的原始计算能力就训练了新模型,不到科技巨头Meta训练其最新人工智能模型所耗资金的十分之一。
乔治华盛顿大学专门研究新兴技术和国际关系的助理教授杰弗里·丁(音)表示,中国进口芯片受到限制,迫使DeepSeek工程师"更有效地训练大模型,以让其仍有竞争力"。
多伦多的技术顾问鲁文·科恩从去年12月下旬起一直在使用DeepSeek-V3。他说,该模型与OpenAI、谷歌,以及旧金山初创公司Anthropic的最新系统能力相当,而且使用起来便宜得多。
"DeepSeek是让我省钱的办法,"他说,"这正是像我这样的人想使用的技术。"
"深度求索的诞生,说明了为什么特朗普很难打赢贸易战。"1月9日,美国乔治梅森大学经济系教授泰勒·考恩在彭博社刊文称,由于美国限制对华出口芯片,深度求索等中企无法获得最新的尖端芯片,因此不得不寻找其他更便宜的方法来训练其模型,并"间接导致了中国重要创新的出现"。