AI进化的关键之年:从DeepSeek看AI趋势(2)

2025-02-14 17:26  蓝鲸新闻

另具有重要意义的是,DeepSeek的崛起不仅打破了中国对西方闭源模型的依赖,推动中国在全球AI治理中的话语权提升,也为其他国产大模型的发展提供了有效范式。

来源:DeepSeek官网

DeepSeek的光芒部分掩盖了媒体对其他国产大模型的关注度,在这里我们将这些国产大模型的进展曝光出来。今年的第一个月,字节跳动旗下的豆包大模型Doubao-1.5-pro、阿里通义千问Qwen2.5-1M、VL和Max、智谱发布的GLM-Zero-Preview、Kimi发布了k1.5多模态思考模型等,DeepSeek自身也拓展到多模态大模型,可以说,国产大模型在推理效率与多模态融合上已经崭露头角。不仅如此,新发布国产大模型在测评指标上也表现不俗,其中豆包综合得分优于 GPT-4o、Claude 3.5 Sonnet;Qwen2.5-Max在多项基准测试中超过DeepSeek V3,DeepSeek Janus-Pro在部分指标已经超越了DALL-E3和Stable Diffusion等热门模型。

从目前来看,国产大模型已经在"开源+低成本+垂直场景"上"摸到规律",这一趋势将在今后几个月延续,预计还将有更多的国产大模型产生飞跃式的发展,进入全球第一梯队。

● 趋势二:全球算力革命、竞争与投资变革

DeepSeek 的影响力已超越技术本身,业已成为AI 产业生态升级的核心动力,从算力芯片、云计算到终端设备,推动全球相关产业迈向高效、低成本、广泛落地的新阶段,或改变现有上下游厂商的格局,如DeepSeek R1发布后,英伟达、博通、甲骨文等产业链股票应声下跌,此后国际顶级厂商,如英伟达、微软、亚马逊云科技纷纷表示,将DeepSeek纳入它们的体系。

国内上下游产业链的整合则更为深入,华为昇腾云、阿里云等平台快速集成DeepSeek,国产算力芯片(如昇腾、海光)与服务器需求激增,带动液冷技术、光模块等产业链升级;摩尔线程实现对DeepSeek蒸馏模型推理服务的部署;联想集团与沐曦发布采用DeepSeek大模型的一体机方案等。这些频繁的举动预示着未来 AI 发展将更加注重高效协同、开源共赢和产业落地,国产芯片和算力也将大有可为。

来源:Statista、DocsBot.
https://www.statista.com/chart/33839/prices-for-processing-one-million-input-output-tokens-on-different-ai-models/

今年资本市场对 AI 产业的投资逻辑正发生重大转变。一方面,投资人开始质疑巨额AI投资回报的合理性;另一方面,过去由于 AI 计算资源昂贵,企业投入回报周期较长,AI 领域的投资较为谨慎,而随着DeepSeek 等新兴技术的突破,使得大模型的开发和应用变得更加经济可行,促使投资者重新评估 AI 的商业价值,推动资金在AI新方向上涌入。