DeepSeek-R1总参数671亿,主要用于数学推理、代码生成、自然语言推理等需要深度逻辑分析的任务,在数学、编码等任务中性能对标OpenAI o1,但API成本仅为后者的1/30。推理模型DeepSeek-R1思维链推理类似于OpenAI o1。虽然R1不是第一个开放推理模型,但它比以前的模型功能更强大。
DeepSeek R1是一款开源 LLM,与OpenAI的最佳产品相比,拥有卓越的性能的同时需要的计算和训练资源大大减少,因此在科技领域掀起了波澜。早些时候微软表示,在2025年将在AI基础设施上花费800亿美元,而Meta CEO扎克伯格表示,计划在2025年投资600亿至650亿美元的资本支出,作为其AI战略的一部分。
在DeepSeek的示范下,未来越来越多的LLM将商品化。随着大模型训练技术变得越来越先进,以及培训和运行LLM所涉及的成本不断下降,预计LLM将在不久的将来成为一种商品。
DeepSeek R1模型的问世被一些科技公司CEO视为LLM正变得越来越商品化的进一步指标。
Hugging Face是开源AI项目的常用代码仓库。Hugging Face的联合创始人兼首席科学官 Thomas Wolf表示,LLM将更多地集成到与公司自己的数据库相连的智能系统中。人工智能的Airbnb、人工智能的Stripe将出现,他们与模型无关,而是使模型对任务有用。
微软CEO Satya Nadella认为,随着人工智能变得更加高效和可及,我们将看到LLM的使用量猛增,将其变成我们可能无法完全满足其需求的商品。
与此同时,美国软件公司 Appian CEOMatt Calkins说,DeepSeek的成功表明AI模型在未来将更多地成为一种商品。许多公司将实现有竞争力的AI,而高成本必然会影响大模型的销售。
显然,英伟达在大模型训练的AI芯片市场占据主导地位,但竞争比以往任何时候都更加激烈。瑞穗证券估计,英伟达控制着70%到95%的AI芯片市场,用于训练和部署LLM。78%的毛利率凸显了英伟达的定价能力。竞争对手芯片制造商英特尔和AMD报告的最新季度毛利率分别为41%和47%。
英伟达旗舰AI GPU如H100,再加上该公司的CUDA软件,使其在竞争中领先一步,以至于切换到替代方案似乎几乎是不可想象的。
尽管英伟达GPU市场从30亿美元膨胀到约900亿美元。英伟达承诺每年发布一种新的AI芯片架构,而不是像历史上那样每隔一年发布一次,并推出可以更深入地将其芯片融入AI软件的新软件。
从跨国公司到新兴初创公司都在争夺AI芯片市场的份额,未来五年市场规模可能达到 4000亿美元。