英伟达等美国芯片巨头连夜适配千问3

2025-04-29 17:00  观察者网

4月29日,观察者网获悉,阿里巴巴千问3开源后,上下游供应链连夜进行适配和调用,英伟达、高通、联发科、AMD等多家头部芯片厂商已成功适配千问3,在不同硬件平台和软件栈上的推理效率均显著提升,可满足移动终端和数据中心场景的AI推理需求。

据介绍,在AIME、LiveCodeBench等权威数学和代码评测集上,刚刚开源的千问3全面超越DeepSeek-R1、OpenAl-o1等国内外领先模型。千问3还是国内首个混合推理模型,简单任务可低算力"秒回",面对复杂问题则可多步骤"深度思考",大幅节省算力消耗。

根据阿里云官方信息,此次开源包括两款MoE模型:Qwen3-235B-A22B(2350多亿总参数、 220多亿激活参数),以及Qwen3-30B-A3B(300亿总参数、30亿激活参数);以及六个Dense模型:Qwen3-32B、Qwen3-14B、Qwen3-8B、Qwen3-4B、Qwen3-1.7B和Qwen3-0.6B。

此外,在阿里千问3开源数小时后,华为官方宣布昇腾支持千问3全系列模型部署,开发者在MindSpeed和MindIE中开箱即用,实现千问3的0day适配。随后海光信息也表示,在"深算智能"战略引领下,海光DCU迅速完成对全部8款模型的无缝适配+调优,覆盖235B/32B/30B/14B/8B/4B/1.7B/0.6B,实现零报错、零兼容性问题的秒级部署。

早在2024年3月,智能手机芯片厂商联发科,已在天玑9300等旗舰芯片上部署通义千问18亿、40亿参数大模型,此次适配千问3是双方芯片级软硬适配的延续。去年10月,高通在在发布会上宣布了跟腾讯混元和智谱的合作,腾讯混元大模型7B和3B版本、智谱的GLM-4V端侧视觉大模型都会在搭载骁龙8 Elite的手机上落地。