滚动资讯

当前位置：首页 > 资讯 > 业界动态 > 正文内容

DeepSeek-V3.1发布：混合推理架构升级，专为国产芯片设计

时间：2025-08-22 07:34:50 来源：ITBEAR编辑：快讯团队 IP：北京 发表评论无障碍通道

近日，DeepSeek公司震撼发布其最新一代大语言模型——DeepSeek-V3.1，凭借创新的混合推理架构和显著增强的智能体能力，再次掀起了全球AI市场的技术狂澜。

DeepSeek-V3.1的核心竞争力在于其独特的混合推理架构，这一设计使得模型能够在同一框架内无缝切换“思考”与“非思考”两种模式。据官方介绍，通过精心训练与优化，新版本在工具使用、编程以及搜索等智能体任务上的表现均有显著提升。尤为该模型采用了针对下一代国产芯片设计的UE8M0 FP8 Scale参数精度。

社区测试数据揭示了DeepSeek-V3.1的强大实力：在Aider多语言编程基准测试中，其得分力压Anthropic的Claude 4 Opus，同时展现出显著的成本优势。这一卓越表现迅速吸引了开发者社区的广泛关注，模型在Hugging Face平台上的热度持续攀升。

为了进一步提升用户体验，DeepSeek同步升级了API接口，不仅将上下文窗口扩展至128K，还新增了对Anthropic API格式的支持，极大地简化了迁移过程。更为关键的是，公司宣布将于2025年9月6日起实施新的API定价方案，并取消夜间优惠，这标志着DeepSeek在服务能力扩容后，正加速推进商业化进程。

混合推理架构的引入，标志着DeepSeek正迈向一个全新的Agent时代。相较于上一代模型DeepSeek-R1-0528，DeepSeek-V3.1-Think能够在更短的时间内给出答案，思考效率显著提升。同时，通过Post-Training优化，新模型在工具使用与智能体任务中的表现也取得了质的飞跃。

在编程和搜索等Agent能力方面，DeepSeek-V3.1同样表现出色。在代码修复（SWE）和命令行终端任务（Terminal-Bench）测试中，其性能相较于公司以往模型有了显著提高。在复杂搜索测试（browsecomp）中，该模型也展现出了强大的多步推理能力，遥遥领先。

第三方测试进一步验证了DeepSeek-V3.1在编程领域的卓越表现。在Aider编程基准上，该模型取得了71.6%的高分，超越了包括Claude 4 Opus在内的多个知名模型。同时，其成本效益也极为显著，完成一次编程任务的成本仅为1.01美元，远低于部分专有闭源模型。这些性能指标的提升，无疑增强了DeepSeek在自动化编程和复杂信息处理等商业场景中的竞争力。

在开源与API更新方面，DeepSeek继续秉持开放策略，将V3.1的Base模型和后训练模型发布在Hugging Face与魔搭社区上。此次发布的模型参数量为685B，Base模型在V3基础上额外进行了840B token的训练。公司特别提醒开发者注意，新模型采用了新的参数精度，且分词器和聊天模板有较大调整，在部署时需参考最新文档。

DeepSeek的API服务也迎来了全面升级。除了扩展上下文长度至128K外，还为开发者提供了更强大的工具调用功能，如支持strict模式的Function Calling，以确保输出格式的规范性。同时，为降低生态迁移成本，API还增加了对Anthropic API格式的兼容支持，方便使用Claude Code框架的开发者接入DeepSeek模型。

在技术与产品不断更新的同时，DeepSeek也迈出了坚定的商业化步伐。公司宣布，将从2025年9月6日起对开放平台的API接口调用价格进行调整，并同步取消夜间时段优惠。此举旨在更好地满足用户调用需求，并透露已对API服务资源进行了扩容。

举报 0 收藏 0 打赏 0评论 0

更多>同类资讯

智元机器人启动“A计划”，助力50+高潜力项目，共筑千亿级具身智能产业生态

为扶持早期创新力量，智元机器人启动首个专注具身智能产业链的创业加速计划——“智元A计划”。智元机器人将为参与计划的伙伴提供技术支持、融资赋能、场景开放、创业孵化等丰富权益。彭志辉还发布了灵犀X2-W——专…

08-22

百度AI搜索转型阵痛：广告收入缩水，变现挑战重重

李彦宏在财报会上强调了AI给百度带来的积极影响，他透露，二季度百度搜索中有50%的内容是由AI生成，环比提升15个百分点，截至7月，有64%的百度搜索页面包含AI生成内容。在财报电话会上，7月初从金山云加…

08-22

科创板成长ETF开盘微涨，重仓科技股多数上扬

来源：新浪基金∞工作室 8月21日，科创板成长ETF（588070）开盘涨0.08%，报1.326元。科创板成长ETF（588070）重仓股方面，海光信息开盘涨0.72%，澜起科技涨0.02%，寒武纪涨0.6…

08-22

石头科技8月20日融资净买入超千万，融券余额处低位

截至6月30日，石头科技股东户数1.75万，较上期减少4.99%；人均流通股14806股，较上期增加47.43%。机构持仓方面，截止2025年6月30日，石头科技十大流通股东中，华夏上证科创板50成份ET…

08-22

机器人ETF嘉实微涨开盘，重仓股表现各异，汇川技术、科大讯飞领涨

来源：新浪基金∞工作室 8月21日，机器人ETF嘉实（159526）开盘涨0.00%，报1.459元。机器人ETF嘉实（159526）重仓股方面，汇川技术开盘涨0.46%，科大讯飞涨0.34%，石头科技涨0.…

08-22

中国载人登月倒计时：2030年前稳扎稳打，美国阿尔忒弥斯计划再陷困境

软着陆器加上月球车“玉兔”，第一次完成了中国航天器的“落月+巡视”，这一步意义大，说明登月的技术路线开始逐步走实。 2020年底，嫦娥五号把月壤带回来了，17克，不多，却是靠自主采样、自动升空、绕月对接、返…

08-22

小米充电宝全解析：15款精选，快充技术引领便捷充电新体验

汇总小米充电宝电池容量对比图，可以了解到，小米充电宝电池容量主要为5000、10000、20000mAh容量档位，拥有二合一、自带线系列及磁吸系列等类型产品，其中小米充电宝25000 容量达25000mA…

08-22

Windows11 Copilot新功能亮相：AI助力智能检索文件与图片体验升级

08-22

ChatExcel近千万天使轮融资成功，加速AI数据智能平台全球化布局

08-22

通义APP上线知识库：融合官方与个人资料，打造高效信息管理平台

08-22

DeepSeek-V3.1重磅发布：混合推理架构引领AI新潮流，适配国产芯片

08-22

智元机器人启动“A计划”，目标三年打造千亿级具身智能产业生态

08-22

DeepSeek-V3.1升级发布：强化Agent能力，API调用价格即将调整

08-22

快手Q2财报亮点：净利润增20%，日活用户突破4亿再创新高

08-22

百度蒸汽机2.0音视频模型升级：多人有声版上线，视频创作新突破

08-22

点击查看更多 +

全站最新

科创板成长ETF开盘微涨，重仓科技股多数上扬

机器人ETF嘉实微涨开盘，重仓股表现各异，汇川技术、科大讯飞领涨

中国载人登月倒计时：2030年前稳扎稳打，美国阿尔忒弥斯计划再陷困境

吉利AI座舱：让汽车变身“智慧管家”，重构人车交互新体验

广濑电机全球首推：高电流抗振“FX31”板对板连接器，引领车载电子革新

百度蒸汽机2.0音视频一体化模型升级，终结AIGC视频“无声时代”

热门内容

本栏最新

中国载人登月倒计时：2030年前稳扎稳打，美国阿尔忒弥斯计划再陷困境

小米充电宝全解析：15款精选，快充技术引领便捷充电新体验

DeepSeek-V3.1重磅发布：混合推理架构引领AI新潮流，适配国产芯片

智元机器人启动“A计划”，目标三年打造千亿级具身智能产业生态

华为芜湖新设信息技术公司，注册资本高达2000万！

斯达半导沪上布局新动作，集成电路公司注册资本高达5000万

本网站LOGO小熊标志受版权保护，版权登记号：鲁作登字-2015-F-025467，未经ITBEAR官方许可，严禁使用。
声明：本网站是公益性科普网站，为网友提供科技类资讯内容，无障碍技术由太阳湾捐增，为阅读障碍用户提供内容听读服务。如本站内容侵犯了您的权利，请通知我们及时删除。
中国（山东）自由贸易试验区鲁ICP备11015305号-1 商业合作入口
Copyright © 小熊科技资讯 2007-2024 ITBEAR.COM.CN All rights reserved.