DeepSeek-V3.1重磅发布：混合推理架构引领AI新潮流，适配国产芯片

时间：2025-08-22 04:46:41 来源：ITBEAR编辑：快讯 IP：北京 发表评论无障碍通道

DeepSeek公司近日震撼发布其最新一代大语言模型——DeepSeek-V3.1，此举标志着全球AI市场竞争的进一步白热化。此次更新通过引入创新的混合推理架构和显著增强的智能体能力，为AI领域带来了革命性的变化。

DeepSeek-V3.1的核心亮点在于其革命性的混合推理架构，这一架构使模型能够在同一框架下灵活切换“思考”与“非思考”两种模式。据官方公告，新版本经过深度训练和优化，在工具使用、编程、搜索等智能体任务上的表现实现了质的飞跃。尤为V3.1采用了针对下一代国产芯片设计的UE8M0 FP8 Scale参数精度。

社区测试数据揭示了新模型的卓越性能。在Aider多语言编程基准测试中，DeepSeek-V3.1的得分超越了Anthropic的Claude 4 Opus，并且在成本控制上展现出显著优势。这一成绩迅速在开发者社区中引发了热烈反响，模型在Hugging Face平台上的关注度飙升。

为了提升用户体验，DeepSeek同步升级了API接口，不仅将上下文窗口扩展至128K，还新增了对Anthropic API格式的支持，极大简化了迁移过程。更为关键的是，公司宣布将于2025年9月6日起实施新的API定价方案，并取消夜间优惠，这一举措被视为其在服务能力大幅提升后加速商业化进程的重要一步。

混合推理架构的引入，标志着DeepSeek正迈向智能体时代的新篇章。据DeepSeek官网介绍，此次升级带来了多项重大变化：混合推理架构让模型同时支持思考模式与非思考模式，思考效率显著提升，相比前代模型，DeepSeek-V3.1-Think能在更短时间内给出答案。通过Post-Training优化，新模型在工具使用和智能体任务中的表现得到了大幅提升。

在效率方面，新的思考模式经过思维链压缩训练，相比上一代模型，在任务表现相当的情况下，token消耗量减少了20%至50%。这一改进不仅提升了模型的性能，还降低了运行成本，增强了其在商业场景中的竞争力。

新模型在编程和搜索等智能体能力方面实现了显著增强。DeepSeek公布的数据显示，V3.1在代码修复和命令行终端任务测试中，性能相较于公司以往模型有了明显提高。在复杂搜索测试中，模型同样表现出色，大幅领先于竞争对手。社区进行的第三方测试进一步证实了V3.1在编程能力上的跃升，其在Aider编程基准上取得了71.6%的高分，超越了多个知名模型，且成本效益显著。

在开源与API更新方面，DeepSeek继续其开放策略，将V3.1的Base模型和后训练模型发布在Hugging Face与魔搭社区上。此次发布的模型参数量为685B，Base模型在V3基础上进行了额外的840B token训练。公司提醒开发者注意，新模型采用了新的参数精度，且分词器和聊天模板有所调整，部署时需参考最新文档。

API服务也迎来了全面升级。除了扩展上下文长度外，DeepSeek还为开发者提供了更强大的工具调用功能，如支持strict模式的Function Calling，以确保输出格式的规范性。为降低生态迁移成本，API增加了对Anthropic API格式的兼容支持，方便使用Claude Code框架的开发者接入DeepSeek模型。

在技术与产品更新的同时，DeepSeek也迈出了坚定的商业化步伐。公司宣布将于2025年9月6日起调整API接口调用价格，并取消夜间时段优惠。这一调整旨在更好地满足用户调用需求，并伴随着API服务资源的扩容。

美国企业家埃隆·马斯克旗下的太空探索技术公司（SpaceX）日前向美联邦通信委员会提交申请，拟在近地轨道部署由多达100万颗卫星组成的系统，构建轨道数据中心网络，以支持人工智能（AI）等高性能计算需求。 Sp…

除马斯克之外，OpenAI的CEO奥尔特曼，去年也想过筹资收购或合作一家火箭公司；谷歌推出“阳光捕手”计划，打算发射搭载自研AI芯片的太阳能卫星，2027年进行演示；初创公司Starcloud更直接，去年发…

和超市款不同，唯品会的吸引力在于，它并不是“没牌子”，而是把大牌拉回到合理价格区间。对已经算清账的中产来说，这是笔非常划算的交易：同样是品牌、同样的面料和工艺，只是换了购买渠道，就能省一大笔钱。当山姆羽绒…

从2025年初至今，人形机器人租赁市场价格经历“大幅下跌”，不少从业者选择离场，但坚持下来的人仍对行业前景抱有信心：“技术日新月异，还有很大的市场值得被挖掘。” 一位入驻了擎天租的租赁商告诉贝壳财经记者，目…

越疆机器人称，在 ATOM 的量产进程中，将大脑、身体与场景深度融合，作为贯穿始终的三大关键能力。按 2023 年的出货量计算，越疆科技在全球协作机器人行业中排名前二，并在中国所有协作机器人公司中排名第一，…

这就是小原子诞生的底层逻辑——并不是等技术完美再出发，而是先把“懂你”的种子种下，让它陪伴你和你的家人一起生长。小原子不是最高的、不是最快的、不是自由度最多的，但它可能是第一个被设计成“和你一起长大”的机…

2月4日上海马戏城文旅商融合发展新春演出媒体通气会上，智元创新（上海）科技股份有限公司合伙人、高级副总裁，通用业务部总裁王闯这样回忆“机器人成流量明星”的起源。王闯期待机器人达到《精灵宝盒的秘密》（上图）表…

不愧是高通目前最强的处理器，在新机市场上，搭载率越来越高，而且覆盖到不同机型上，比如游戏手机、旗舰机、折叠屏等，均为高端机及以上机型。影像是新机的核心之一，先是采用隐藏式两段钛合金机械臂云台，而且是航天级材…

在此次采访中，陈亦伦爆出了猛料：自己在2020年主导华为ADS时就已经实现端到端自动驾驶技术突破，比特斯拉还要早。陈亦伦在访谈中提及，2020年其团队在华为启动端到端自动驾驶技术研发。为解决该问题，他与团队尝…

据在场的阿里员工在社交媒体上分享，与马云的相遇令人惊喜：“一抬头竟然看到马老师来了，太意外了！这不仅是今年春节大厂AI大战中投入最高的福利金额，也是阿里历史上春节活动中投入最大的一次，瞬间引爆AI大战氛围。…

来源：新浪科技新浪科技讯 2月4日晚间消息，社交媒体有消息称，今日马云现身位于杭州阿里总部的千问春节项目组，疑似是给千问加油打气来的。有阿里员工分享表示：“太意外了，一抬头竟然看到马老师来了！”“戴着帽子…

本网站LOGO小熊标志受版权保护，版权登记号：鲁作登字-2015-F-025467，未经ITBEAR比尔科技官方许可，严禁使用。
声明：本网站是公益性科普网站，为网友提供科技类资讯内容，无障碍技术由太阳湾捐增，为阅读障碍用户提供内容听读服务。如本站内容侵犯了您的权利，请通知我们及时删除。
中国（山东）自由贸易试验区鲁ICP备11015305号-1 联系入口
Copyright © 比尔科技 2007-2024 ITBEAR.COM.CN All rights reserved.