唯一手游网2025-03-02
在AI领域的浩瀚星空中,一场由DeepSeek R1点燃的推理模型大战正愈演愈烈,吸引了众多科技巨头的加入,战况愈演愈烈。
仅一日之内,战场便迎来了四位重量级选手:阿里巴巴率先亮剑,发布了推理模型QwQ-Max-Preview的预览版;紧接着,Anthropic推出了全球首个“混合推理”模型Claude 3.7 Sonnet;随后,字节跳动也被曝出其自研的深度思考型推理模型豆包正进行小范围测试。与此同时,DeepSeek亦不甘示弱,据路透社报道,其正加速推进R2模型的发布,原计划于五月初面世,现有望提前亮相。
香港科技大学校董会**、美国国家工程院外籍院士沈向洋近期指出,大模型的研究焦点已从GPT模式转向Reasoner模式,标志着一种新的学习范式。DeepSeek R1无疑成为了这场范式转变的焦点,引发了一系列连锁反应。腾讯推出了自研的深度思考模型“混元T1”,百度文小言增设了深度搜索功能,马斯克的xAI也发布了具备深度思考能力的Grok 3新模型。就连OpenAI,也在DeepSeek的压力下,进一步开放了自家推理模型o1和o3-mini的思维链。
DeepSeek R1这颗投向推理侧的大模型技术迭代“石子”,其涟漪效应正波及整个行业,重现了2023年科技大厂竞相追逐ChatGPT的盛况。彼时,百度、阿里等大厂纷纷发布自家大模型,王慧文携巨资入局,掀起了一场席卷全行业的大模型创业热潮,杨植麟、王小川、李开复等接连创办明星大模型公司,争分夺秒抢占市场融资,发布产品。
然而,在ChatGPT时代稍显落后的字节跳动,在追赶DeepSeek的征程上似乎又慢了半拍。国内其他科技大厂已相继展示深度思考能力,而字节的自研推理大模型才刚刚步入灰度测试阶段。DeepSeek R2可能提前发布的消息,无疑给字节增添了更多压力。
值得注意的是,那些抢在字节前面发布推理模型的同行们,也未能松一口气。马斯克的Grok 3和阿里的QwQ-Max-Preview均非最终版,前者为半成品,后者仅为预览版。在LiveCodeBench编程测试中,QwQ-Max-Preview仅小幅超越OpenAI o1中档推理模型及DeepSeek R1预览版。阿里官方透露,QwQ-Max正式版将择机推出。
QwQ-Max基于阿里的旗舰模型Qwen2.5-Max,后者于1月29日发布,是一款MoE稠密模型,据称在公开基准测试中性能超越DeepSeek V3。而Anthropic的Claude 3.7 Sonnet则是完整体,官方公布了多项评测指标对比,在传统基准测试中,其在指令遵循、通用推理、多模态能力及智能体编码方面均超越OpenAI o1和DeepSeek R1。
无论是马斯克还是阿里,在模型尚未完备之际便急于推出,除了展示技术实力外,更重要的是抢在DeepSeek之前,趁其多模态尚不完善之际,打造产品的差异化竞争优势。腾讯便利用DeepSeek R1的多模态短板,上线了图生文功能,借助自研模型的多模态能力,让DeepSeek也能理解图片内容。马斯克同样预告了Grok 3的语音模式,Neuralink高管希冯·齐利斯对与Grok 3的语音对话赞不绝口。
坚持推出自家推理模型,实则是各家大模型厂商对用户的新一轮争夺。DeepSeek的崛起,再次激发了大厂对AI to C的重视。阿里在发布QwQ-Max-Preview的同时,透露将推出Qwen Chat APP,或独立于通义APP,优先考虑实时响应能力与流行生产力工具的集成,服务全球受众。
面对DeepSeek的挑战,腾讯、百度选择接入DeepSeek来争夺C端用户,但潜在风险不容忽视。一旦DeepSeek解决服务卡顿问题,这些用户可能再次流失。而阿里则计划重起炉灶,腾讯、百度、字节亦在推动旗下垂类模型陆续开源,以吸引开发者生态。
DeepSeek亦不甘示弱,相继开源了FlashMLA代码库、DeepEP通信库及FP8计算库DeepGEMM,将低成本高性能的训练秘密公之于众。同时,官方API充值服务也已恢复正常,并提示开发者在凌晨0:30至上午8:30相对空闲时段调用API,以获得更流畅的体验。
路透社曝光的DeepSeek R2新模型提速发布消息,成为其应对这轮推理模型竞赛的新武器。目前,唯一未对外大范围提供推理模型服务的科技大厂,仅剩字节跳动。对大模型技术演进路线的判断失误,或许是字节未能及时跟进推出新模型的原因之一。梁汝波在内部会议上反思,DeepSeek R1的长链思考模式并非首创,字节虽意识到技术变化,但未立即行动,错失先机。
在ChatGPT爆火后,字节亦曾错失大模型研发的先机,内部一度将AI重心转向AI for Science,导致大模型推出时间落后百度、阿里。随着大模型技术迭代趋缓,字节在过去一年奋力追赶,豆包大模型一度成为国内月活用户最多的AI应用,性能和多模态布局亦赶上国内头部厂商。
然而,DeepSeek R1引发的推理模型热潮,再次将追赶压力推到了字节面前。不仅如此,随着DeepSeek R2模型的提前到来,一众科技大厂都笼罩在DeepSeek对比的紧张气氛之中。
相关推荐