滚动资讯

当前位置：首页 > 资讯 > 业界动态 > 正文内容

中国信通院推出“方升”3.0基准测试，助力AI评测升级与行业创新发展

时间：2025-10-10 00:31:34 来源：互联网编辑：快讯 IP：北京 发表评论无障碍通道

中国信息通信研究院（以下简称“信通院”）近日宣布，其自主研发的“方升”人工智能基准测试体系已完成3.0版本升级，标志着我国AI评测能力迈入新阶段。此次升级不仅扩展了基础测试维度，更首次将全模态理解、长期记忆等十项高级智能能力纳入评测范围，为工业制造、金融科技、基础研究等领域提供了更具针对性的评估框架。

据介绍，3.0版本在原有评测体系基础上新增了模型底层特征评估模块，涵盖参数规模、推理效率等核心指标。针对未来AI发展方向，体系特别设计了高级智能测试单元，重点考察模型在复杂场景下的多模态交互、自主决策等能力。信通院相关负责人表示，这种分层设计既能反映当前技术水平，又能为前沿研究提供方向指引。

为保障评测结果的权威性，信通院同步推进了三大基础设施建设项目。首先是测试数据资源扩容，计划新增300万条涵盖多语言、多任务的标准化数据，以满足不同场景下的评测需求。其次是测试方法创新，重点攻关高质量数据合成、动态质量评估等关键技术。第三是构建智能评测基座，通过引入多智能体交互仿真环境，实现对复杂系统协同能力的精准评估。

在最新完成的季度评测中，141个大模型和7个智能体接受了全面检验。测试覆盖基础认知、逻辑推理、代码生成、多模态理解四大维度。结果显示，OpenAI的GPT-5在综合性能上保持领先，但国内模型表现可圈可点——阿里巴巴的Qwen3-Max-Preview和月之暗面的Kimi K2在特定场景下已接近国际先进水平。值得注意的是，多模态模型在图像识别领域取得突破，但在需要多步骤推理的任务中仍存在提升空间。

代码应用能力专项测试暴露出行业共性问题。虽然参评模型在简单函数实现上表现优异，但在真实项目开发中的架构设计、错误处理等方面明显不足。专家指出，这反映出当前AI工具从实验室到产业应用的转化过程中，仍需突破工程化能力瓶颈。

随着评测体系持续完善，信通院已建立双月评测机制，定期发布技术分析报告。相关负责人透露，下一步将重点加强评测标准国际化建设，通过与全球研究机构合作，推动中国AI评测体系获得更广泛的国际认可，为技术创新和产业升级提供有力支撑。

更多>同类资讯

苹果2026全球开发者大会亮点前瞻：最强Siri、全局调控液态玻璃

03-18

百度集团：丁健辞任董事会独立董事

03-18

王兴兴谈具身智能：突破泛化瓶颈，视频生成或开启“ChatGPT时刻”

03-18

两周年感恩回馈！小米汽车为老车主献上专属勋章与定制冰箱贴

03-18

内存大涨价浪潮来袭，未来两三年性价比手机恐难再现低价

03-18

苹果备战2026年WWDC：开发者账号入驻B站领英，多平台同步发力

03-18

英伟达拟5月为中国市场推Groq AI芯片适配多系统非性能降级版

03-18

连亏七年后首盈利，B站“上岸”后迎AI挑战与社区生态保卫战

03-18

风雅西北湖春日启幕！樱花与艺术交融，江汉免费活动邀你共赴浪漫之约

现场参与活动的商户代表也倍感振奋：“赏樱季为我们带来了超高的人气，借着这股春日东风，相信商圈的消费活力会越来越旺，也能让更多人感受到江汉的文旅魅力和商业活力。” 雪松路赏樱美食季、武汉樱花手帐节、春日市集等…

03-18

苹果家居硬件高管布莱恩·林奇离职投身智能戒指商Oura 智能家居布局再添变数

03-18

英伟达CloudXR 6.0赋能苹果Vision Pro：解锁多领域4K沉浸新体验

03-18

T2 CEO泽尔尼克：AI可助力游戏素材创作，却难造《GTA》级爆款佳作

03-18

百度集团人事变动：丁健因个人工作安排变动辞任董事会独立董事及相关职务

03-18

2025年三季度全球手机畅销榜：iPhone霸榜，国产手机海外仍需发力

今年Q3季度手机单品销量排名与去年相差不大，唯一不同的是小米没有上榜，去年有一款入门手机红米13C上榜，也是挤进了前十，而今年却没有一款国产手机上榜前十，看来国产厂商还要努力，不过在全球市场份额中，国产手机…

03-18

马斯克点赞Kimi“注意力残差”研究，Kimi幽默回赞火箭技术引关注

【CNMO科技消息】近日，在特斯拉CEO埃隆·马斯克公开点赞中国AI公司Kimi的最新研究成果后，Kimi官方账号于3月17日以幽默口吻回应：“你的火箭造得也不错！” 据CNMO了解，事件的起因是3月16日，…

03-18

点击查看更多 +

全站最新

风雅西北湖春日启幕！樱花与艺术交融，江汉免费活动邀你共赴浪漫之约

理想汽车2025年业绩承压，2026年以三大支柱谋20%销量增长新局

国产新能源实力出圈！福特拆解比亚迪皮卡，直呼成本利润难理解

中汽中心新能源检验中心二期开工天津新能源汽车产业再添新动力

中车哈尔滨车辆公司数智化改造升级产能跃升迈向行业新高度

理想增程器开发逻辑大不同：NVH居首重塑用户核心需求新架构

热门内容

本栏最新

风雅西北湖春日启幕！樱花与艺术交融，江汉免费活动邀你共赴浪漫之约

小米九号平衡车：轻巧便携性能强，全家出行智能代步新伙伴

雷军力荐！新一代SU7首发小米蛟龙底盘驾控升级打造驾驶者之车

2026款小米SU7 3月19日上市！外观内饰升级，续航最长902Km引期待

小米汽车两周年献礼老车主：三枚勋章加定制冰箱贴，感恩一路相伴

新款小米SU7来袭！配置全面升级，或再掀车圈热潮，Model 3压力倍增

本网站LOGO小熊标志受版权保护，版权登记号：鲁作登字-2015-F-025467，未经ITBEAR比尔科技官方许可，严禁使用。
声明：本网站是公益性科普网站，为网友提供科技类资讯内容，无障碍技术由太阳湾捐增，为阅读障碍用户提供内容听读服务。如本站内容侵犯了您的权利，请通知我们及时删除。
中国（山东）自由贸易试验区鲁ICP备11015305号-1 联系入口
Copyright © 比尔科技 2007-2024 ITBEAR.COM.CN All rights reserved.