DeepSeek,又一次在海外掀起巨浪。
自DeepSeek在1月20日发布新模型DeepSeek-R1并同步开源模型权重后,这家来自中国的AI创业公司引发了全球AI科技圈的关注。同时,最近包括纽约时报、经济学人、华尔街日报等在内的多家英美主流媒体都报道了DeepSeek的研究进展,高度赞扬其模型的强大性能。其中,CNBC发文称:"DeepSeek-R1因其性能超越美国顶尖同类模型,且成本更低,算力消耗更少,引发了硅谷的恐慌。"
值得注意的是,英伟达的竞争对手、知名半导体公司超微半导体(AMD)昨日发布消息称,已将DeepSeek-V3模型集成到AMD的芯片产品Instinct MI300X GPU上,该模型旨在与SGLang一起实现最佳性能。DeepSeek-V3针对Al推理进行了优化。业内人士分析称,AMD作为全球领先的芯片厂商,通过与DeepSeek合作将为AI推理带来新的想象空间,也有望动摇"英伟达+OpenAI"联合主导的行业格局,改变既有的游戏规则。
在去年底DeepSeek-V3发布后,业内就掀起了关于 DeepSeek打破算力需求"怪圈"的讨论。在最近两天DeepSeek-R1引发海外广泛讨论后,1月24日英伟达股价又大跌3.12%。
值得一提的是,1月26日,有网友反映,DeepSeek崩了,提示服务器繁忙。14时56分,证券时报记者实测发现,已可以正常使用。
记者实测页面