DeepSeek之所以被科技圈关注,在于DeepSeek-V3的出现极大地降低了大模型训练和应用的成本,DeepSeek-V3训练成本仅557.6万美元,而OpenAI训练ChatGPT-4o所花费的成本高达7800万美元甚至是1亿美元,双方的成本至少是10倍的差距。
在性能上,DeepSeek-V3在数学、代码能力和中文知识问答方面还超过了ChatGPT-4o,行业震惊于这一性价比,DeepSeek-V3 开源给全世界的技术开发团队。"AI界的拼多多"的称号也由此而来。
在团队配置上, DeepSeek团队只有139名研发人员,对比ChatGPT的OpenAI团队则有1200名研究人员,团队规模是DeepSeek的近乎9倍之多。近期热门话题"雷军千万年薪挖95后天才AI少女",这位AI少女就是DeepSeek团队的研发人员。
就在1月20日,深度求索(DeepSeek)正式发布DeepSeek-R1模型。
该模型在数学、代码、自然语言推理等任务上,性能比肩OpenAI o1正式版。DeepSeek称,R1在后训练阶段大规模使用了强化学习技术,在仅有极少标注数据的情况下,极大提升了模型推理能力。DeepSeek不仅将R1训练技术全部公开,还蒸馏了6个小模型开源给社区,允许用户借此训练其他模型。
根据此前资料显示,DeepSeek暂时没有商业化的考虑。
对于国产大模型公司在列总理座谈会,被业内解读为国家对科技的重视。值得注意的是,这次座谈会上,李强强调,要以科技创新推动新旧动能转换,集中力量突破关键核心技术和前沿技术,加快推进科技成果产业化,努力培育更多经济新增长点。