马斯克刚刚在社交平台X上称,下周将向SuperGrok订阅者推出Grok 3.5,并将该条信息顶置。
据马斯克称,Grok 3.5是第一个能够准确回答有关火箭发动机或电化学技术问题的人工智能。同时,Grok可以从第一原理推理并得出互联网上根本不存在的答案。
Grok 3.5被马斯克旗下的xAI宣传为"全球首个人工智能能从第一性原理推理,生成网络上不存在的答案"。
而今年2月18日,xAI正式发布Grok 3,并在两天后把Grok 3免费向所有公众开放,超越ChatGPT,登顶苹果应用商店免费应用下载排行榜第一名。
马斯克曾称Grok 3为"地球上最聪明的人工智能"。
令人值得关注的是,马斯克"官宣下周推出Grok 3.5"的这一举动恰巧发生在阿里巴巴发布Qwen3(千问3)之后。
4月29日凌晨4点,阿里巴巴开源新一代通义千问模型Qwen3,参数量仅为DeepSeek-R1的1/3,成本大幅下降,性能全面超越R1、OpenAI-o1等全球顶尖模型,登顶全球最强开源模型。
据悉,Qwen3是国内首个"混合推理模型","快思考"与"慢思考"集成进同一个模型,对简单需求可低算力"秒回"答案,对复杂问题可多步骤"深度思考",大大节省算力消耗。
作为Qwen系列全新一代的混合推理模型,Qwen3在GPQA、AIME24/25、LiveCodeBench等多个权威评测中表现出极具竞争力的结果。
在奥数水平的AIME25测评中,Qwen3斩获81.5分,刷新开源纪录。
在考察代码能力的LiveCodeBench评测中,Qwen3突破70分大关,表现甚至超过Grok3。
在评估模型人类偏好对齐的ArenaHard测评中,Qwen3以95.6分超越OpenAI-o1及DeepSeek-R1。
性能大幅提升的同时,Qwen3的部署成本还大幅下降,仅需4张H20即可部署Qwen3满血版,显存占用仅为性能相近模型的三分之一。