一边是高端芯片出货预期遭投行巨头大幅下调,一边是中国国产算力产业集体支持DeepSeek,在市场看来,GPU巨头英伟达股票遭遇的抛售潮似乎仍未结束。
出货预期遭大幅下调
近日,摩根士丹利发布最新研究报告,将英伟达人工智能芯片GB200 NVL72( 在NVLink域中支持72个GPU)的2025年出货量从3万到3.5万大幅下调至2万到2.5万件。在最坏的情况下,出货量可能低于2万件。
科技媒体Wccftech报道称,这一调整可能导致300亿至350亿美元(约合人民币2184亿至2548亿元)的GB200供应链受到影响,并对相关供应链和半导体企业造成巨大压力。
根据摩根士丹利报告,调整的理由是"GB200芯片的主要客户之一"微软重新关注机型的效率,相应地缩减了资本支出增长,对供应链产生了负面影响。此前,微软CEO纳德拉在电话会上称,AI成本下降是趋势。
同时,尚未成熟的的云计算和人工智能基础设施生态系统,特别是在与GB200相关的网络和电力公用事业等领域仍然存在不足,供应链没有跟上需求的步伐,限制了GB200的部署。
GB200于2024年3月18日正式发布。其NVL72可以在一个机架中配置72个GPU,在两个机架中配置18个双GB200计算节点,即72个GPU,其中有18个单GB200计算节点。
过去两年,得益于AI大模型对算力获取的焦虑,英伟达股价如日中天飙涨,但随着国产大模型DeepSeek的横空出世,它的低成本和高效率,让市场对英伟达的"算力神话"产生动摇,截至美东时间2月3日,英伟达股价对比1月的高点,累计跌幅达23.8%,总市值累计蒸发8931亿美元(约合人民币6.5万亿元)。
摩根士丹利认为,市场上对于大型语言模型(LLM)的效率存在争议,比如DeepSeek与微软之间存在分歧。1月29日,OpenAI与其最大支持者微软宣称就DeepSeek获取数据的方式进行调查。
这家美国投行巨头预计,这些情况将持续到2025年,使市场难以重新评估英伟达等股票的价值。此外,根据行业周期,到2025年第四季度,云计算行业的资本支出增长可能会放缓至个位数。
摩根士丹利指出,云计算行业的资本支出是周期性的。历史数据显示,云计算行业通常经历2-3年的增长周期,随后是2-4个季度的低迷期。这种低迷主要表现在美国大型云服务提供商的同比增长放缓。
国产算力集体支持DeepSeek
在英伟达股票的抛售潮中,中国的工程师们加班加点,国产算力开始相继和DeepSeek联手。
2月5日开工第一天,"华为计算"发文称,DeepSeek系列模型首发即支持昇腾平台,用户能够在昇腾硬件和MindIE推理引擎上实现高效推理。2月4日,DeepSeek-R1、DeepSeek-V3、DeepSeek-V2、Janus-Pro正式上线昇腾社区,支持一键获取DeepSeek系列模型,支持昇腾硬件平台上开箱即用,推理快速部署。
大年初四,经过硅基流动和华为云团队连⽇攻坚,双方联合⾸发并上线基于华为云昇腾云服务的DeepSeekR1/V3推理服务,可获得持平全球⾼端GPU部署模型的效果,提供稳定的、⽣产级服务能力。
随后阿里云、百度智能云、腾讯云、京东云、天翼云、字节跳动火山引擎等国内多个云平台,先后官宣了对DeepSeek的支持和适配。
在市场分析看来,虽然DeepSeek的模型是开源的,但全球云服务厂商们对模型的支持仍然十分关键。通过支持DeepSeek模型的云平台,开发者可以省去买卡、装驱动、配网络、配存储、装环境、装框架、下载模型等一系列繁琐步骤,直接在云服务厂商的平台上去调用DeepSeek模型。
不止这些云厂商,国产芯片厂商也纷纷宣布对DeepSeek的支持。
2月5日,海光信息发文称,近日海光信息技术团队成功完成DeepSeek-Janus-Pro多模态大模型与海光DCU的适配优化,并正式上线。这是继DeepSeek V3和R1模型之后,海光团队近期完成适配优化的第三款DeepSeek大模型。该公司表示,因DCU采用了GPGPU通用加速计算架构,DeepSeek模型可直接在DCU上运行,并不需要大量适配工作,技术团队的主要工作是进行精度验证和持续的性能优化。
2月4日,国产GPU创企摩尔线程透露,该公司基于自研全功能GPU,通过开源与自研双引擎方案,快速实现了对DeepSeek蒸馏模型的推理服务部署,用户也可以基于MTT S80和MTT S4000进行DeepSeek-R1蒸馏模型的推理部署。该公司还表示,为推进国产AI生态发展,摩尔线程即将开放自主设计的夸娥(KUAE)GPU智算集群,全面支持DeepSeek V3、R1模型及新一代蒸馏模型的分布式部署。
同一天,天数智芯与开源平台Gitee AI联合发布消息,在双方的协作下,仅用时一天,便成功完成了与DeepSeek R1的适配工作,并且已正式上线多款大模型服务,其中包括DeepSeek R1-Distill-Qwen-1.5B、DeepSeek R1-Distill-Qwen-7B、DeepSeek R1-Distill-Qwen-14B等。
无独有偶,2月2日,Gitee AI联合沐曦首发全套DeepSeek R1千问蒸馏模型。本次上线的四个模型(1.5B、7B、14B、32B)均部署在国产沐曦曦云GPU上。该平台表示,这次Deepseek R1模型+沐曦曦云GPU + Gitee AI平台,实现了从芯片到平台,从算力到模型的全部国产研发。随后在2月5日,联想集团和沐曦股份联合发布基于DeepSeek大模型的首个国产一体机解决方案,该方案以"联想服务器/工作站+沐曦训推一体国产GPU+自主算法"为核心架构,实现从千亿参数大模型训练到场景化推理落地的全链条覆盖。
不仅如此,相关产业链也在积极行动。AI基础设施企业无问芯穹除夕当天宣布Infini-AI异构云对DeepSeek-R1-Distill 32B模型的支持,PPIO派欧、云轴科技则在2月2日官宣对于DeepSeek模型的支持。
根据介绍,PPIO派欧算力云支持了DeepSeek-V3、DeepSeek-R1、蒸馏模型DeepSeek-R1-Distill-Llama-70B,模型价格与官方价格保持一致;云轴科技ZStack宣布AI Infra平台ZStack智塔支持企业私有化部署DeepSeek V3/R1/Janus Pro三种模型,可基于海光、昇腾、英伟达、英特尔等国内外CPU/GPU适配。
在行业看来,国内算力产业链与DeepSeek的适配,可实现深度学习框架与国内自主硬件的深度融合,充分发挥国内GPU算力优势,提升DeepSeek模型训练和推理的计算效率,还能促进国内人工智能产业链自主可控发展,减少对国外硬件平台的依赖,降低技术风险和成本,更有助于国内GPU拓展市场,吸引更多上下游企业合作,完善产业链生态,促进应用加速落地。