字节Seed团队开源推理大模型，Seed-OSS系列在7项基准测试中夺冠

时间：2025-08-21 19:48:44 来源：智东西编辑：快讯团队 IP：北京 发表评论无障碍通道

字节跳动旗下的Seed团队近日宣布了一项重大开源举措，正式推出了Seed-OSS系列模型。这一系列模型专为处理长上下文、推理任务、Agent行为及通用场景设计，其上下文窗口扩展至前所未有的512k，这一数字是业界常规上下文窗口（128k）的四倍，甚至超越了GPT-5的两倍，相当于能够一次性处理约1600页文本的内容。

Seed-OSS系列模型特别针对推理任务进行了优化，并赋予用户调节思维预算的灵活性，以满足不同应用场景的需求。此次开源包含了三个版本：基础模型Seed-OSS-36B-Base、无合成数据基础模型Seed-OSS-36B-Base-woSyn，以及经过指令微调的Seed-OSS-36B-Instruct。

在多个基准测试中，经过指令微调的Seed-OSS-36B-Instruct展现了出色的性能，在通用知识、Agent行为、编程及长上下文等领域取得了7项开源模型中的最佳表现（SOTA）。其整体能力超越了Qwen3-32B、Gemma3-27B及gpt-oss-20B等模型，与Qwen3-30B-A3B-Thinking-2507在多数领域不相伯仲。

Seed-OSS系列模型遵循宽松的Apache2.0开源协议，并计划在未来发布详细的技术报告。这些模型采用了12万亿个token的预训练数据，基于当前主流的因果语言模型架构，即预测下一个token的模型类型，且全部为稠密模型，未采用MoE等复杂架构。

在技术创新方面，Seed-OSS系列结合了多项关键技术，包括RoPE（旋转位置编码）、GQA注意力机制、RMSNorm归一化及SwiGLU激活函数等，这些组件的组合旨在提升训练稳定性和推理性能。尤为Seed-OSS的512k上下文窗口并非后续扩展，而是原生训练的结果。

模型还引入了思考预算功能，帮助开发者控制推理成本并优化使用体验。根据Seed团队的分享，对于简单任务，随着思维预算的增加，模型分数波动不大；而对于复杂任务，分数则会随着思维预算的增加而提升。在默认模式下，模型没有思考长度限制，但若指定思维预算，建议优先考虑512的整数倍值。

Seed-OSS系列模型一经发布，便获得了开发者社区的广泛认可。Hugging Face的工程师Tiezhen Wang评价称，这一系列模型非常适合进行消融研究，能够以较低成本探索不同组件对大模型性能的影响。社区成员也纷纷表示，如此规模的基础模型在开源界较为罕见，且长上下文能力对实际应用具有重要意义。

近期，字节跳动Seed团队频繁开源多款模型，除了Seed-OSS系列外，还包括多语言翻译模型Seed-X、智能体模型Tar系列及图像编辑模型Vincie等。这一系列举措表明，开源正逐渐成为模型发布的重要选择，甚至像OpenAI这样原本坚持闭源的厂商也开始逐步开源其模型。字节跳动此次将核心语言模型贡献给社区，无疑为开源研究提供了更多基础模型的选择。

中关村科金构建了极具竞争力的技术产品体系，依托自研的人工智能、大模型、智能音视频、区块链等前沿技术，锻造出以得助大模型平台为核心，覆盖智能客服、智能营销、智能运营、智能办公的全场景产品矩阵，以及服务海外市场…

采访时陶建辉不时很高兴地和我分享，有谁评论说从“拉”到“推”很有意义、CCF 杜小勇老师点评“陶总做了一件很大的事情”，对于评论里有多个留言提到了“数据目录、数据标准化和数据情景化”，陶建辉深觉对方真正看懂了…

京东物流12项科技创新及应用成果获得科技进步奖和科技发明奖，其中一等奖1个，二等奖4个，三等奖7个，2位专家获得科技创新青年奖，再次位居物流行业第一，这也是京东物流连续第9年获得该奖项。同时，依托业内首个一站…

TBD Lab，负责人是 Alexandr WangFAIR (Fundamental AI Research)，基础 AI研究Products and Applied Research, 产品和应用研究…

拿实际算过的单子举例，大客户采购ECS、RDS、安全类产品时，通过阿里云一级代理通常能比官网公价再便宜个6%到12%，有些时候还有“企业专享”追加礼包，比如工单免排队、专属技术顾问等。我的建议是两点：一是认…

老方说马斯克的策略比乔布斯明智，就在于马斯克非常理性，他崇尚物理领域的第一性原理，他的商业决策堪称冷酷，他对于身体和感情方面也是如此，所以他哪怕堪称工作狂，但他乐此不疲，身体也没有大的问题。对于AI，乔布斯…

娱乐圈人士进军小宇宙在 2025年早已不是新闻，它们能带来流量也不是新闻，但是看到「娱乐与群聊闲谈」成为「收听量十万以上」内容占比最高的类型，我还是有点意外，这个比例略高于 30%，远高于排在其后的「对话…

【综合报道】8月17日消息，据彭博社报道，OpenAI首席执行官山姆・奥特曼对外宣布，公司计划在“不太遥远的未来”投入数万亿美元用于人工智能基础设施建设，以满足人工智能服务不断增长的算力需求。据介…

（1）在智能出行场景中，基于思必驰DFM大模型的天琴语音助手可为用户提供智能出行规划、路书分享、美食地图、大模型日程提醒等内容，实现出行场景大串联。（2）在家居场景中，基于思必驰DFM大模型的全屋智能语音…

甚至林昊直呼其目前公司的目标就是让每家公司可以拥有N个不同的“多隆”，足以看出林昊对于蔡景现加入的重视。当然了能做到阿里P10，林昊也绝非泛泛之辈，其在阿里期间主导开发了阿里的分布式RPC服务架构HSF，…

真实情况是——TikTok的算法并不是完全的黑箱，也绝不是你能随意操控的“白箱”，它更像是一个**“灰箱”**：部分规则可控，部分逻辑随机。你能做的，是在可控项里最大化优化，同时用科学的测试去对冲不可控因素…

8月18日，武汉金山软件园开园仪式上，金山集团董事长、小米集团创始人兼CEO雷军表示，目前在汉小米加金山总人数已达9500人，预计今年底将基本实现万人规模，未来3至5年金山、小米将分别过万人。（全…

阿里云弹性块存储（DBFS）作为一款云端分布式文件系统，专为云上数据库和工作负载设计，旨在彻底革新传统文件系统的管理方式，为用户带来前所未有的便捷与性能。它通过将繁琐的基础设施管理抽象化，赋予用户弹性的扩展能…

“充电桩是浪潮智能终端布局零碳业务的最重要抓手”，闫亮亮向介绍，今年浪潮智能终端的充电桩业务重点布局两大场景。浪潮集团旗下二级单位为浪潮充电模块专门打造了碳化硅芯片，浪潮充电桩所使用的板卡等辅材也…

在第二季度，百度AI智能云收入同比增长27%，达到了65亿元人民币。在电话会中，百度集团执行副总裁沈抖讲道，企业云的增速始终高于整体的AI智能云业务增速、是云业务的主要增长动力。具体而言，在企业云中，订阅…

本网站LOGO小熊标志受版权保护，版权登记号：鲁作登字-2015-F-025467，未经ITBEAR官方许可，严禁使用。
声明：本网站是公益性科普网站，为网友提供科技类资讯内容，无障碍技术由太阳湾捐增，为阅读障碍用户提供内容听读服务。如本站内容侵犯了您的权利，请通知我们及时删除。
中国（山东）自由贸易试验区鲁ICP备11015305号-1 商业合作入口
Copyright © 小熊科技资讯 2007-2024 ITBEAR.COM.CN All rights reserved.