在人工智能技术快速发展的当下,越来越多的人开始将AI工具融入日常工作与生活。大学教师刘茹便是其中一员,她每天都会使用豆包App解答问题,尤其是在国外参观博物馆时,通过视频通话让AI实时讲解展品信息。她还利用智能体开发平台搭建科研助手,辅助生成研究方案。近期,她的工具库再次更新,谷歌推出的Nano Banana Pro能生成高质量视觉信息图,阿里巴巴的千问App擅长撰写办公材料,蚂蚁集团的灵光App则可根据文字描述快速生成小型应用或游戏。
全球大模型领域的竞争愈发激烈。北京时间11月18日,埃隆·马斯克旗下xAI发布Grok 4.1,次日凌晨谷歌便推出Gemini 3 Pro。12月初,DeepSeek发布的DeepSeek-V3.2在推理类基准测试中达到GPT-5水平,仅略逊于Gemini 3 Pro。这场技术竞赛不仅体现在模型性能上,更延伸至应用场景的拓展。谷歌将Gemini 3 Pro集成至搜索和企业平台,阿里则通过千问App全面进军消费级市场,上线一周下载量突破千万,远超同类产品初期表现。
谷歌与阿里的突破性进展标志着行业格局的转变。谷歌发布的Gemini 3系列在核心基准测试中全面领先,其图像生成模型Nano Banana Pro和视频生成模型Veo 3.1分别占据相关榜单首位。阿里则通过千问App的密集更新强化功能,新增拍照答疑、作业批改等场景,并细化AI写作功能,提供论文、诗句等30余种场景选择。蚂蚁集团的灵光App主打低门槛创意生产,用户输入一句话即可在30秒内生成应用或游戏,上线两周累计生成330万个作品。
中国大模型在国际舞台上的表现愈发亮眼。据AI评测机构数据,今年1月仅有1个中国模型进入全球综合排名前15,而11月已有5个中国模型入围。在开源生态中,中国模型的优势更为突出。研究显示,自年中以来,全球开源生态结束DeepSeek垄断局面,中国模型词元使用量占比达71.1%,简体中文成为第二大交互语言。亚马逊、爱彼迎等科技巨头纷纷采用中国模型,前者以Qwen3.0为基础打造具身智能底座,后者在AI客服中大量使用Qwen模型以降低成本。
技术竞争的焦点正从语言模型转向多模态与智能体能力。北京智源人工智能研究院院长指出,语言模型发展趋于成熟,而图像、视频等海量多模态数据尚未充分开发。谷歌的Nano Banana Pro和Veo 3.1在文生图、视频生成领域领跑,阿里、字节等中国企业的模型紧随其后。智能体能力成为新战场,其主动规划、调用工具的特性使AI从问答助手升级为执行伙伴。灵光App展示的饮食监督应用开发过程,体现了智能体在任务拆解、逻辑验证等方面的进步。
行业洗牌加速进行,领先者地位随时可能被颠覆。谷歌月活跃用户从7月4.5亿增至10月6.5亿,单次使用时长首次超越ChatGPT,迫使OpenAI宣布进入紧急状态,暂停非核心项目聚焦模型升级。创业公司则面临更大挑战,零一万物和百川智能相继退出通用大模型竞争,转向垂直领域或企业服务。资金压力、技术壁垒缺失和同质化竞争成为主要困境,多数AIGC应用仍处于亏损状态。行业分析显示,全球498家AI独角兽中,大部分尚未实现正向现金流。
大厂与创业公司的竞争策略形成鲜明对比。阿里巴巴通过生态整合构建竞争优势,千问App计划接入地图、外卖、办公等生活场景,实现跨业务任务执行。这种生态之争依赖于企业在电商、支付等领域的长期积累。创业公司则需在基础模型研发与应用创新间寻找平衡,MiniMax通过纠正技术驱动方向,重新聚焦模型竞争力提升。专家预测,中国基座大模型市场最终可能收敛至少数具备持续投入能力和人才密度的企业。








