超越ChatGPT！DeepSeek登顶苹果美区免费下载榜

目前，DeepSeek-R1已经一跃成为开源社区Hugging Face上下载量最高的大模型，下载量达10.9万次，这意味着全球的开发人员正在试图了解这一模型以辅助他们自己的AI开发。DeepSeek的服务器也于26日出现了局部服务波动。这一问题在数分钟内得到解决，或与新模型发布后的访问量激增有关。

DeepSeek创始人梁文锋在接受媒体采访时也表示："在颠覆性的技术面前，闭源形成的护城河是短暂的。即使OpenAI闭源，也无法阻止被别人赶超。"

梁文锋认为："开源更像一个文化行为，而非商业行为。给予其实是一种额外的荣誉。一个公司这么做也会有文化的吸引力。"Meta首席人工智能科学家杨立昆（Yann LeCun）也在社交媒体表示，DeepSeek成功的最大收获不是来自中国竞争对手的加剧威胁，而是保持人工智能模型开源的价值，以便任何人都能受益。

"他们有了新的想法，并在其他人的工作基础上加以实现。由于他们的工作成果已发表并开源，因此每个人都可以从中受益。"杨立昆表示，"这就是开放研究和开源的力量。"

DeepSeek成立于2023年5月，其背后是国内对冲基金巨头幻方量化。

2023年11月2日，DeeSeek推出首个模型DeepSeek Coder，该模型免费供商业使用且完全开源。2023年11月29日，DeepSeek LLM上线，其参数规模达到67B，性能接近GPT-4，同时还发布了该模型的聊天版本DeepSeek Chat。

真正让Deepseek在AI界出圈的，是其在2024年5月开源的第二代MoE大模型DeepSeek-V2。该模型在性能上比肩GPT-4 Turbo，价格却只有GPT-4的百分之一，DeepSeek由此被称作"价格屠夫"、"AI界的拼多多"。

随后的2024年下半年，这家公司还先后发布了DeepSeek R1-lite-preview和DeepSeek-V3。

到了2025年推出的R1模型，在数学能力测试中，该模型在MATH基准测试上达到了77.5%的准确率，与OpenAI的o1不相上下；在编程领域，R1在Codeforces评测中达到了2441分的水平，高于96.3%的人类参与者。

而这一切，是在不到600万美元的投入和2048块低性能的H800芯片的条件下完成的，训练时间仅用两个月。这种"四两拨千斤"的模式，颠覆了人们对OpenAI"大力出奇迹"式的固有认知，结果令全球侧目。

幻方量化和DeepSeek创始人梁文锋，毕业于浙江大学信息与通信工程专业。业内口碑称，这是一位极致的80后技术理想主义者。创立幻方，梁文锋就在幕后潜心钻研技术，在DeepSeek时代，其依旧延续着低调作风，和一线研究员一样，每天"看论文，写代码，参与小组讨论"。

据证券时报报道，一名人工智能行业资深业内人士向记者分析称，DeepSeek以200人左右的小团队，且不依靠外部融资，做出了一个有性价比并被全球主流AI界人士所认可的大模型。"一是他们在早期就买了很多算力卡，投入了很多资源做研究；二是他们是做量化的，不像大厂有其他各种各样的盈利需求，也跟他们不构成竞争关系，能更专注于模型开发。"该业内人士表示。

超越ChatGPT！DeepSeek登顶苹果美区免费下载榜(3)