ITBear旗下自媒体矩阵：

滚动资讯

当前位置：首页 > 资讯 > 业界动态 > 正文内容

Kimi新架构获马斯克关注！17岁高中生共著论文引领技术新突破

时间：2026-03-17 17:20:57 来源：互联网编辑：快讯 IP：北京 发表评论无障碍通道

一位年仅17岁的高中生以共同第一作者身份参与了一项突破性研究，将注意力机制引入深度神经网络的残差连接中，这项成果引发了科技界的广泛关注。该研究由Kimi团队完成，提出了名为Attention Residuals的创新技术，通过重新设计神经网络层间的信息传递方式，显著提升了模型训练效率。

这项技术突破面临的首要挑战是计算复杂度问题。在100层网络中，若对每层都进行全注意力计算，复杂度将呈平方级增长。为解决这一难题，研究团队开发了Block AttnRes方法，通过将连续层划分为块并在块内进行信息压缩，将计算复杂度从O(L²)降至O(L·B)，其中B为块数且取值较小。

实验验证阶段，团队在自研的Kimi Linear 48B大模型上进行了测试。该模型采用线性注意力机制，激活参数为3B。结果显示，在保持推理延迟增加不到2%的前提下，训练效率提升了25%。在数学推理、代码生成和多语言理解等任务中，新模型均展现出持平或优于基线的性能表现。

这项研究的特别之处在于其实现方式的简洁性。Attention Residuals技术可直接替代传统残差连接，无需修改网络其他部分。研究团队将其视为"时间-深度对偶性"的具体应用，认为深度神经网络的层处理与循环神经网络的时间步处理在本质上都是对信息的迭代加工。

共同第一作者团队阵容引人注目。除17岁的陈广宇外，还包括旋转位置编码（RoPE）提出者苏剑林和Kimi Linear第一作者张宇。这位年轻的高中生作者通过黑客松活动进入AI领域，在硅谷实习期间参与了涉及144张H100显卡的探索性项目，其成长轨迹展现了非传统科研路径的可能性。

技术细节方面，Attention Residuals的实现包含三个关键步骤：首先生成可学习的伪查询向量，其次将所有前序层输出作为键值对，最后通过注意力机制进行加权聚合。工程优化方面，团队采用了缓存式流水线通信、序列分片预填充等技术进一步提升效率。

更多>同类资讯

AI生图真假难辨引热议，网友担忧：有图有真相时代已逝？

模型发布后，一些用GPT-Image-2生成的AI假图已经开始在网络上开始传播。面对该大模型生成的图片，不少网友感叹，第一反应是“被吓到了”。还有网友实测，只需简单输入一句话，就能一键生成精美的…

04-27

小米YU7 GT 5月震撼登场：千匹马力+705公里续航雷军揭秘高性能SUV新布局

雷军在发布会上正式宣布，备受期待的新作小米YU7GT将于今年5月底正式发布。根据雷军现场披露的核心参数，小米YU7GT拥有惊人的1003匹最大马力，最高时速可达300公里每小时，CLTC综合续航里程为705公…

04-27

2026北京车展科大讯飞大放异彩，以AI赋能座舱，开启智能汽车新体验

科大讯飞星火智能座舱亮相北京车展，赋能AI汽车，实现“会办事、更懂你”的智能升级。

04-27

荣威20周年发布“家越”序列携手火山引擎打造AI原生汽车新体验

04-27

2026东莞机器人外壳吸塑供应：五大厂家实力比拼，精准匹配多元需求

本报告旨在通过系统性量化评估，从专业实力、高精度工艺、交付稳定性及客户生态四大维度，解析东莞地区五家核心机器人外壳吸塑生产厂家的核心竞争力，为企业决策者提供实证依据与优选参考。建议企业在进行新项目开发时，优…

04-27

北京车展小米VGT超跑概念车闪耀登场，以创新科技勾勒未来出行新蓝图

在2026年北京车展上，小米VisionGranTurismo（VGT）超跑概念车以其前卫设计和创新科技成为瞩目的焦点。小米创始人雷军在发布会上表示，VGT项目自启动以来便追求“无量产束缚”的创作自由。从智能…

04-27

小米VGT超跑概念车北京车展首秀：以风塑形，开启智能出行新想象

这款由小米全球设计团队历时两年打造的未来座驾，以“由风塑形”为核心理念，标志着小米在汽车设计领域的大胆探索。在智能化方面，VGT搭载了小米自主研发的“人车感知系统”。短期内不会推向市场，但其积累的空气动力学数…

04-27

北京车展小米VGT超跑概念车登场，以创新科技与设计重塑未来出行想象

这款车凭借着其未来感十足的设计和尖端科技，迅速成为了展会的焦点，标志着小米在智能出行领域的雄心壮志。这一设计颠覆了传统的航空升力体原理，将气动结构直接嵌入车身框架中。设计团队透露，从概念草图到1:1模型，整个…

04-27

小米VGT超跑北京车展首秀，以“风之灵感”开启智能出行新想象！

这一设计颠覆了传统航空升力体的原理，通过将气动结构直接嵌入车身框架，不仅减少了30%的额外部件，还实现了比传统超跑高40%的下压力效率。从智能手机到智能家居，再到智能汽车，小米正通过其生态链优势，重塑人、车、…

04-27

小米VGT超跑北京车展首秀：雷军畅谈未来设计，探索人车合一新境界

小米VGT超跑亮相北京车展小米VisionGranTurismo超跑国内首秀，成车展焦点。雷军称VGT项目不考虑量产，旨在探索未来汽车设计。设计与技术亮点外观：水滴状流线设计，融合小米家族式元素。技术：创新“…

04-27

7岁“小孩哥”成小米车迷，童言趣评超跑引雷军回应与行业思考

当小男孩来到小米首款概念超跑VisionGranTurismo的展台时，他的情绪达到了高潮。小车迷的热情不仅让我们看到了未来汽车文化的希望，也让我们思考如何在科技迅猛发展的时代，培养下一代对创新和科技的热爱与…

04-27

7岁“小孩哥”车展赞小米超跑，雷军幽默互动，小米汽车未来引期待

在小米首款概念超跑VisionGranTurismo的展台前，这位小车迷的情绪达到了顶点。对此，小米科技创始人雷军在社交平台上分享了这一趣事，并幽默称这位小车迷为“懂车弟”。尤其是在电动车与智能汽车逐渐成为市…

04-27

黑芝麻智能2026北京车展闪耀登场，全场景算力矩阵引领智能新未来

04-27

212 T01 METTA全球亮相，携手京东开启越野生活全民化新征程

04-27

欧盟施压谷歌开放安卓AI入口，ChatGPT与Claude或将获系统级权限

04-27

点击查看更多 +

全站最新

AI生图真假难辨引热议，网友担忧：有图有真相时代已逝？

小米YU7 GT 5月震撼登场：千匹马力+705公里续航雷军揭秘高性能SUV新布局

2026北京车展科大讯飞大放异彩，以AI赋能座舱，开启智能汽车新体验

欣旺达动力跻身特斯拉供应链，供应电芯助力欧洲车型开启合作新篇

荣威20周年发布“家越”序列携手火山引擎打造AI原生汽车新体验

15万预算买纯电SUV？比亚迪宋Ultra EV实力出众闭眼入不亏

热门内容

本栏最新

荣威20周年发布“家越”序列携手火山引擎打造AI原生汽车新体验

212 T01 METTA全球亮相，携手京东开启越野生活全民化新征程

2026年车市“卷”出新高度！8款新车6.48万起售，续航最长2150km，选车别只盯秦L

华为“超充+智擎”双轮驱动，引领电动汽车体验升级与产业变革新篇章

2026北京车展：科大讯飞iFLYAUTO携三大首发登场，引领汽车智能体验革新潮

科大讯飞2026北京车展放大招，AI座舱音效出海齐发力，开启出行新体验

本网站LOGO小熊标志受版权保护，版权登记号：鲁作登字-2015-F-025467，未经ITBEAR比尔科技官方许可，严禁使用。
声明：本网站是公益性科普网站，为网友提供科技类资讯内容，无障碍技术由太阳湾捐增，为阅读障碍用户提供内容听读服务。如本站内容侵犯了您的权利，请通知我们及时删除。
中国（山东）自由贸易试验区鲁ICP备11015305号-1 联系入口
Copyright © 比尔科技 2007-2024 ITBEAR.COM.CN All rights reserved.