生成式人工智能正在加速从“只会聊天”的问答工具,演变为能够卷起袖子干活的“超级数字员工”。6月8日,云知声(9678.HK)正式发布了新一代通用大语言模型——U2。作为一款面向个人、开发者以及企业组织量身打造的原生智能体(Agent)大模型,U2彻底告别了传统大模型重依赖单轮对话的局限,将技术主线死死锚定在“高智能密度”与“高Token价值”的交付能力上。
在实际业务场景中,传统模型往往只能处理短链路的文本生成,一旦面对庞杂的系统工程便无能为力。而U2核心强化了面向真实任务的连续执行闭环。在复杂办公、软件工程、深度研究以及多工具协同等高难度场景下,它能够像人类专家一样,将一个宏观的抽象任务自主拆解并连续推进超过100步的复杂工作流,实现了从“被动响应”到“主动执行”的跨越。
伴随着新模型的发布,一系列国内外权威能力评测的最新结果也同步出炉,U2在多个关键维度上直插主流大模型的第一梯队。在极其考验硬核知识与复杂逻辑推理能力的 GPQA Diamond 评测中,U2斩获了87.9的高分,这一成绩一举超越了 GLM-5.1、Hy3preview、DeepSeek-V4-Flash(High)以及 MiniMax M2.7等众多业内强劲对手,证明了其在面对高难度专业问题时拥有极强的稳定性。
除了死磕逻辑推理,U2在落地到日常白领工作时的交付质量同样表现惊艳。在面向真实办公与知识工作交付能力的 GDPval 评测中,该模型取得了72.5的优异成绩。不同于常规的死记硬背式评测,GDPval 更侧重于检验模型在企业生产环境中的实操产出。测试结果表明,U2已经能够成熟地独立搞定海量资料分析、专业报告撰写、复杂表格处理、图表动态生成以及高质感幻灯片制作等一系列典型的高价值办公任务。随着原生智能体大模型的常态化落地,AI 赋能产业的下半场正朝着更深的水域挺进。










