滚动资讯

当前位置：首页 > 资讯 > 业界动态 > 正文内容

Kimi重构大模型“基石”残差连接：相同算力下模型效率显著提升引关注

时间：2026-03-20 03:01:31 来源：互联网编辑：快讯 IP：北京 发表评论无障碍通道

在人工智能领域，模型性能的竞争从未停歇。当算力与数据条件相当，为何部分模型能脱颖而出？月之暗面（Moonshot AI）用一项颠覆性技术给出了答案——通过重构大模型底层架构，实现了训练效率与模型效果的双重突破。

3月16日，Kimi团队发布技术报告《Attention Residuals》，将自2015年沿用至今的残差连接（Residual Connections）进行彻底革新。实验数据显示，在相同算力条件下，采用新架构训练的模型性能，达到传统基线模型1.25倍算力训练的效果。这一成果引发硅谷AI圈高度关注，多位顶尖学者公开评价其为"深度学习范式升级的里程碑"。

Kimi团队的解决方案充满巧思：通过数学建模发现，深度网络的信息丢失与RNN的时间遗忘机制存在结构相似性。基于此，他们将横向处理序列的注意力机制"旋转"90度，应用于纵向的深度维度。新架构中，每个网络层通过动态查询向量，主动筛选前序层的关键信息，实现信息流动的精准控制。为解决大规模训练的内存瓶颈，团队还设计了Block AttnRes方案，将网络分块处理，在保持性能的同时将推理延迟增幅控制在2%以内。

实证效果令人瞩目：在GPQA-Diamond科学推理任务中，新架构使模型准确率提升7.5%；数学与代码生成任务分别获得3.6%和3.1%的性能增益。这种泛化能力的提升，源于底层架构对信息流动方式的根本性改变——每层网络都能根据任务需求，动态调整信息提取策略，形成更高效的知识表征。

该团队创始人在近期技术峰会上强调："当行业普遍聚焦模型规模扩张时，我们选择重构底层优化机制。这就像建造摩天大楼，与其不断增加楼层高度，不如重新设计承重结构。"这种"向下深耕"的技术路线，为突破当前AI发展的Scaling Law瓶颈提供了新思路。随着研究论文的公开，全球多个顶尖实验室已开始复现相关实验，一场关于模型底层架构的革新正在悄然兴起。

更多>同类资讯

扬州首条低空物流航线启航无人机助力配送效率提升开启低空经济新篇章

接下来，丰翼依托新城新开工建设的全空间无人体系应用中心，推动低空物流航线从“单线单点”向“连线成网”升级：一方面，将向扬州市区及顺丰中转场延伸多条市内航线；另一方面，跨城航线也已提上日程，未来将开通扬州至泰州…

04-27

小米投资者日展新款具身机器人：延续CyberOne设计，手部精细操作表现亮眼

4月27日消息，小米在投资者日活动上展示了新款具身机器人，延续 2022 年 CyberOne铁大人形设计方案，机身采用暗灰色面料并印有小米标志，整体科技感较强。从博主分享的视频来看，新款机器人手部动作流…

04-27

OpenAI跨界造手机：2028年量产，AI驱动交互范式变革在即

04-27

郭明錤爆料：OpenAI联合高通联发科研发芯片 2028年或开启手机新纪元

04-27

雷军透露小米玄戒O1芯片出货破百万自研芯片将拓展至汽车领域

04-27

出门问问战略升级：发布CodeBanana，以AI原生协作重塑超级组织未来

04-27

AI竞赛加速：OpenAI与Anthropic双雄争霸，奇点时代已拉开帷幕

04-27

AI风口新动向：资本热捧「中国版Anthropic」，企业生产力成估值新引擎

04-27

短剧界“王家卫”马厩：极致风格化之路，能否打破“边际效应递减”困局？

04-27

抖音播放量破6.8亿！AI土味短剧“骑牛嫁傻”如何引爆乡村题材热潮？

04-27

小米18 Pro打破小屏困局：大电池+快充，重新定义小屏旗舰新体验

今年有了硅碳电池技术的突破，本质是材料科学加封装工艺的双重成熟，但于我而言则就是LIPO工艺让边框窄到极致，省出内部空间；电池技术迭代，让能量密度跃升，所以小米18 Pro不是突然开窍，而是等技术风口到了，真…

04-27

iQOO与一加2nm旗舰新机蓄势待发骁龙8 Elite Gen6 Pro芯片引领性能新飞跃

4月27日消息，博主数码闲聊站爆料称 iQOO 和一加均已确定推进 2nm 旗舰新机，目前已有工程机方案，均搭载顶配 SM8975 骁龙 8Elite Gen6 Pro 处理器。一加旗下 2nm 新机已曝…

04-27

2026年全球手机直连卫星市场将爆发式增长，供应链各环节机遇凸显

TrendForce集邦咨询最新研究指出，全球卫星业者正积极从传统“卫星宽带服务”转向“手机直连卫星”，预估2026年全球手机直连卫星市场规模将成长至76亿美元，年成长率约49%。凭借多年深耕，集邦咨询致力于…

04-27

Redmi Book Pro 16 2026深度评测：大屏长续航，小米生态助力高效办公新体验

PCMark 10 Modern Office续航测试中，RedmiBook Pro 2026实现了16小时16分钟的连续办公续航，从100%电量降至2%，同时性能得分达8593，足以支撑一整天的无插电办公…

04-27

点灵智能：2026年以多协议兼容与本地部署引领智能家居新生态

基于Matter、WiFi、Zigbee、BLE等多种无线通信协议的智能家居硬件产品开源与本地部署：重塑数据主权与系统可靠性在隐私安全日益受到重视的背景下，点灵智能自主研发的物联网云平台提供了“完全开…

04-27

点击查看更多 +

全站最新

余承东直指享界S9麋鹿测试有黑幕：轮胎被动手脚公布真实数据正名

一图看懂百奥赛图2026年第一季度业绩报告

龙虎榜丨前沿生物20%涨停，五机构卖出4.57亿元

猎奇智能冲击创业板IPO，一边分红，一边上市募资补充流动资金

帝尔激光赴港IPO，专注于激光精密微纳加工设备，2025年净利润下滑

太火了！全线涨价

热门内容

本栏最新

追觅CEO前日炮轰小红书“烂平台” 小红书次日回应以AI治理主张

新一代小米SU7深度试驾：以卓越性能与精致设计，重塑运动轿车新标杆

小米汽车出海规划出炉：先稳国内再逐欧洲 2028年进军右舵市场拓展全球版图

雷军比亚迪展台遇王传福，互赠礼物共话车圈良性竞争新篇章

科大讯飞亮相中国翻译协会年会多语言AI翻译矩阵助力跨语言交流获AAAAA级认证

端侧AI崛起！面壁智能引领智能座舱新变革，让车载助手更“懂你”

本网站LOGO小熊标志受版权保护，版权登记号：鲁作登字-2015-F-025467，未经ITBEAR比尔科技官方许可，严禁使用。
声明：本网站是公益性科普网站，为网友提供科技类资讯内容，无障碍技术由太阳湾捐增，为阅读障碍用户提供内容听读服务。如本站内容侵犯了您的权利，请通知我们及时删除。
中国（山东）自由贸易试验区鲁ICP备11015305号-1 联系入口
Copyright © 比尔科技 2007-2024 ITBEAR.COM.CN All rights reserved.