ITBear旗下自媒体矩阵:

云知声U2入局国产大模型第一梯队:不卷参数卷效能,开启AI新范式

   时间:2026-06-09 16:55:05 来源:互联网编辑:快讯 IP:北京 发表评论无障碍通道
 

国产通用大模型领域迎来一位不走寻常路的新玩家——港股AGI第一股云知声,其推出的新一代基座模型U2以独特路径闯入第一梯队,引发行业高度关注。与传统大模型依赖“堆参数、堆算力”提升性能的做法不同,U2另辟蹊径,聚焦“智能密度×Token价值”双核心,在降低推理成本的同时实现性能突破。

过去几年,大模型行业遵循“大力出奇迹”法则,通过增加参数规模和算力投入提升模型能力,但这一路径导致企业运营成本激增,普通用户也面临Token消耗过快、使用成本高昂的困境。尤其在进入推理时代和Agent时代后,传统方法让模型思考链条逐Token展开,导致Token消耗呈指数级增长,行业陷入“规模越大、亏损越重”的怪圈。

云知声U2的破局之道在于重新定义模型价值标准。其设计理念将“智能密度”与“Token价值”相乘,要求每一单位算力投入和Token消耗都必须产生直接商业价值。通过数据精筛、语义压缩和幻觉抑制技术,U2将单位参数的知识密度提升数倍,同时减少无效Token输出。在架构层面,稀疏MoE结构配合知识蒸馏技术,使模型以2660亿参数实现1.2万亿参数模型的性能,参数效率达到行业平均水平的5倍。

实测数据显示,U2在多项关键指标上表现优异:在IFBench指令遵循、Claw系列Agent评测等任务中进入第一梯队,复杂任务交互轮次减少30%;GPQA硬核推理测试中,以极低激活参数达到超大模型效果;思考阶段Token消耗量较传统模型降低25%,推理成本显著低于同规模模型。这些突破使得U2在保持性能的同时,将复杂任务的部署成本压缩至行业平均水平的1/10。

技术实现层面,U2通过两大创新降低推理成本:一是精简推理路径,砍除冗余推导步骤;二是引入隐式思考机制,在隐藏层完成解题方向预判后再输出结果。这种“先想后说”的模式使模型在保持多路径探索能力的同时,减少25%的思考阶段Token消耗。原生Agent能力与Harness Engineering的闭环训练,使模型具备自主优化能力,复杂任务交互轮次减少40%,上下文长度缩短35%。

云知声的差异化路线源于其独特的技术积淀。作为2012年成立的AI企业,公司早期聚焦语音识别技术,逐步拓展至智能交互领域,最终形成“强基模+深应用”的发展模式。在智慧医疗、智慧生活等场景的长期深耕,使其积累了海量真实数据和需求反馈,倒逼出“高智能密度、低推理成本”的技术路线。这种积累在Agent时代转化为显著优势,其兽牙智能体平台已连接医疗、交通等产业场景,形成完整的价值闭环。

财务数据印证了技术路线的商业价值。最新财报显示,云知声年营收突破10亿元,大模型相关收入同比增长超10倍。特别值得关注的是Token业务表现:5月调用收入ARR环比增长600%,6月预计保持高速增长。这种增长模式表明,公司收入与客户AI价值创造直接挂钩,形成“模型能力提升-场景落地增加-Token消耗增长-收入规模扩大”的正向循环。

U2的推出标志着大模型竞争进入新阶段。当行业从“参数竞赛”转向“价值创造”,模型评价标准正从规模大小转向单位资源产出效率。云知声通过重构成本结构,使许多原本因算力成本过高而无法落地的AI场景获得商业化可能。这种转变不仅验证了“智能密度”路线的可行性,更为行业提供了新的发展范式——在资源约束条件下,通过技术创新实现性能与成本的双重突破。

 
 
更多>同类资讯
全站最新
热门内容
网站首页  |  关于我们  |  联系方式  |  版权声明  |  争议稿件处理  |  English Version