滚动资讯

当前位置：首页 > 资讯 > 人工智能 > 正文内容

上海AI实验室再突破：万亿参数科学模型Intern-S1-Pro引领AI新方向

时间：2026-04-04 23:14:50 来源：互联网编辑：快讯 IP：北京 发表评论无障碍通道

上海AI实验室主导的突破性研究近日引发科学界广泛关注，研究团队成功构建了全球首个万亿参数规模的科学多模态基础模型Intern-S1-Pro。该模型不仅在通用能力上达到业界顶尖水平，更在化学、材料科学、生命科学和地球科学等关键领域展现出前所未有的深度理解能力，为人工智能在专业领域的应用开辟了新路径。

传统人工智能系统往往专注于单一领域，而科学研究需要跨学科的综合能力。研究团队发现，处理多个科学领域的AI模型需要比单一领域模型大90倍的参数量。这一发现促使他们将模型规模扩展至万亿参数级别，使Intern-S1-Pro成为首个达到此规模的科学多模态基础模型。该系统能够理解和生成自然语言文本，处理科学图像，解析时间序列数据，甚至具备自主规划和执行复杂科学工作流程的能力。

构建如此庞大的模型面临诸多技术挑战。研究团队创新性地采用"分组路由"机制，将专家均匀分配到不同组别，确保每个组都有顶尖专家参与任务处理。这种方法类似于餐厅合理分配厨师资源，既保证了服务质量，又避免了计算资源的浪费。实验表明，这种设计使模型性能略微超越扩展前基准，而传统方法则会导致性能下降超过20个百分点。

为解决稀疏模型训练中未激活专家的学习问题，团队引入了"直通估计器"技术。这项创新使所有专家都能在训练过程中获得反馈信号，确保系统持续改进。模型还采用了原生分辨率图像处理方式，能够根据输入图像的实际分辨率进行调整，保留高分辨率图像中的精细信息，这对科学应用尤为重要。

在位置编码技术方面，Intern-S1-Pro引入了傅里叶位置编码（FoPE），使AI能够理解物理世界的连续性。传统位置编码如同给每个位置分配固定门牌号，而FoPE则像为每个位置分配完整的频谱"指纹"。这项创新显著提高了模型处理不同长度序列的能力，就像学会一首歌的旋律后，即使延长演奏时间也不会走调。

针对科学研究中常见的时间序列数据，团队开发了专门的处理模块。该模块采用自适应子采样策略，根据信号特征动态确定分块策略，既保证重要信息不被遗漏，又将数据量控制在可处理范围内。这一模块能够处理从100个到100万个数据点的序列，覆盖了绝大多数科学应用场景，并在天文学、神经科学和地球科学等领域展现出强大能力。

高质量训练数据的获取是另一个重大挑战。研究团队从科学论文PDF文档中挖掘知识宝藏，开发了一套完整的处理流水线。该系统能够精确识别文档中的图片、表格、公式和正文等元素，去除重复内容，并为科学图像生成详细的专业描述。最终，团队处理了涵盖多个科学领域的大规模语料库，产生了约270亿token的高质量科学图文配对数据。

将科学数据与通用数据融合训练面临"分布偏移"和"负迁移"等问题。研究团队通过结构化科学数据转换、科学数据多样化和系统提示隔离三大策略解决了这一挑战。这些方法确保模型能够同时处理严谨的科学问题和灵活的通用任务，就像一个人既能成为优秀的科学家，又能是出色的文学家。

在万亿参数规模下进行强化学习训练需要解决复杂的内存管理和计算分配问题。团队采用FP8量化技术，并实施了综合性的稳定化框架，包括算子级别对比、推理路由重放和定制混合精度策略等。这些创新使FP8混合精度强化学习在实践中达到与BF16训练相当的效果，为大规模模型训练开辟了可行路径。

性能评估显示，Intern-S1-Pro在多个科学基准测试中表现优异。在SciReasoner科学推理基准上获得55.5分，远超其他模型；在化学领域的SmolInstruct基准上取得74.8分的显著成绩；在材料科学的MatBench基准上获得72.8分。同时，该模型在通用任务上也保持强劲竞争力，在数学推理等高难度任务上表现出色。

有趣的是，实验结果表明更大规模的通用模型在专业任务上反而表现更优。与专门的生物学模型对比显示，Intern-S1-Pro在绝大多数生物学任务上显著超越专业模型，平均得分高出13.21分。这种现象表明，强大的通用推理能力能够帮助模型更好地理解和利用专业数据，为AI模型设计提供了新思路。

Intern-S1-Pro的技术创新具有广泛影响。分组路由机制为大规模模型训练提供了新的负载均衡解决方案；直通估计器技术解决了稀疏模型训练的根本性问题；傅里叶位置编码改进了位置编码方法；时间序列处理模块的自适应策略具有广泛适用性。这些创新不仅提升了当前模型性能，也为未来AI技术发展提供了重要参考。

更多>同类资讯

知乎新知大会聚焦AI时代：真实交流永不过时，创作者激励计划引关注

05-17

中国电气装备集团发布“电擎”大模型驱动输配电装备行业数智化升级

05-17

巡天千河“有戏”卫星成功发射首颗太空算力星开启星地互动新篇章

05-17

不换卡号畅连公海！“爱达·花城号”5G+卫星通信实现海上通信新突破

05-17

量子计算从实验室走向生产线！天开园如何助力首台产融级光量子计算机落地？

05-17

探秘中科院自动化所：在科学嘉年华中解锁智能未来新体验

05-17

荣耀官宣萨维任全球首席跑步官，期待其与“闪电”未来赛道同竞技

05-17

树图区块链探索“AI+Web3”融合路径为智能体交易构建可信生态

05-17

荣耀Robot Phone即将登场：携自研云台系统亮相戛纳国内上市在望

05-17

昊铂S600开启预售！18.89万起享轿跑SUV，智能配置拉满

05-17

我宣布：Codex比ChatGPT还好用

05-17

美国最大电网电价一年间近乎翻倍，数据中心成罪魁祸首

05-17

AMD游戏引擎专利曝光：画个草图AI就能帮你做游戏

05-17

荣耀AI首席科学家黄非：AI正迈向AgenticOS时代定义行业新演进

05-17

荣耀AI首席科学家黄非：AI正从工具进化为操作系统，AgenticOS时代将至

05-17

点击查看更多 +

全站最新

比亚迪闪充站建设提速：一周新增55座，覆盖312城年底将达2万座

特斯拉FSD V14.3.3更新：智能召唤提速，系统性能与舒适度双提升

乐道两年跨越培育期：精准布局纯电赛道，以实力开启跃升新篇

爱跑103号赛级燃油亮相！打破进口依赖，国产高性能燃油填补空白

绿意川蜀邂逅硬核江铃大道成都上市会解锁皮卡多元生活新可能

特斯拉得州新测试跑道渐露真容，新车型Roadster亮相时间再引猜测

热门内容

本栏最新

昊铂S600开启预售！18.89万起享轿跑SUV，智能配置拉满

昊铂S600预售开启，双动力选择，豪华配置加持，性能与舒适兼得

理想汽车全新L9正式登场自研马赫M100芯片引领智能驾驶新体验

MG 07双动力轿跑首发亮相：以创新设计科技配置重塑新能源轿跑新格局

2026新能源线束加工设备怎么选？广东银钢智能凭硬核实力成行业优选

百城节油赛南昌首启，吉利中国星i-HEV智擎混动以实力书写节油新篇

本网站LOGO小熊标志受版权保护，版权登记号：鲁作登字-2015-F-025467，未经ITBEAR比尔科技官方许可，严禁使用。
声明：本网站是公益性科普网站，为网友提供科技类资讯内容，无障碍技术由太阳湾捐增，为阅读障碍用户提供内容听读服务。如本站内容侵犯了您的权利，请通知我们及时删除。
中国（山东）自由贸易试验区鲁ICP备11015305号-1 联系入口
Copyright © 比尔科技 2007-2024 ITBEAR.COM.CN All rights reserved.