滚动资讯

当前位置：首页 > 资讯 > 人工智能 > 正文内容

DeepSeek-V3.1-Terminus更新登场！修复关键Bug，Agent能力跃升，V4还会远吗？

时间：2025-09-23 03:27:00 来源：小AI编辑：快讯 IP：北京 发表评论无障碍通道

人工智能领域迎来重要进展，DeepSeek团队宣布推出新一代模型DeepSeek-V3.1-Terminus。该版本在继承前代优势的基础上，针对用户反馈的核心问题展开专项优化，特别是在编程场景下的输出稳定性方面取得突破性进展。

此次升级最受关注的改进是解决了此前版本中随机插入"极"字的异常现象。测试显示，在涉及time.Second等关键编程元素的输出中，新模型能够准确保持代码结构完整性，未出现字符异常替换的情况。这项修复直接回应了开发者社区对模型实用性的核心诉求，为代码生成等场景扫清了关键障碍。

在语言处理能力方面，研发团队通过算法优化显著降低了中英文混杂出现的频率。对比测试表明，新版本在专业文档生成场景下的语言一致性提升达47%，特别是在技术文档、学术论文等需要精准表达的领域表现突出。不过开发团队坦言，完全消除语言混合现象仍是长期技术挑战。

智能体（Agent）能力成为本次升级的另一大亮点。在工具调用测试中，BrowseComp指标从30.0提升至38.5，SimpleQA准确率达到96.8%，均创下同类模型新高。特别在多语言软件工程基准测试（SWE-bench Multilingual）中，57.8分的成绩较前代提升3.3个百分点，展现出更强的跨语言开发支持能力。

基准测试数据显示，新模型在Humanity's Last Exam评测中取得36.48%的显著提升，这项针对复杂推理能力的考核结果，直接反映了模型在逻辑链条构建方面的进步。值得注意的是，LiveCodeBench实时编码测试显示，新版本在算法实现效率上已超越Gemini 2.5 Pro等竞品。

虽然部分专项测试出现小幅波动，如Codeforces竞赛级编程测试下降1.2%，但整体性能曲线呈现明确上升趋势。开发团队特别强调，Terminal-bench终端操作测试35.7分的成绩，证明模型在系统级交互方面的可靠性得到实质性增强。

技术社区对版本命名展开热烈讨论，"Terminus"在计算机术语中特指终端设备，暗示模型在交互末端的技术突破。有开发者推测，这可能预示着更高级的智能体架构正在研发中，甚至可能与传闻中的DeepSeek-V4存在技术关联。

目前用户可通过Hugging Face和ModelScope平台获取开源版本，官方App及API服务也已完成同步更新。测试反馈显示，新模型在金融分析、科研文献处理等垂直领域的表现获得专业用户认可，代码审查等场景的误报率降低至前代的63%。

开发团队在技术文档中透露，本次升级采用动态注意力优化机制，通过强化特定场景下的参数调整效率实现性能跃升。这种技术路径的选择，既保持了模型架构的稳定性，又为后续功能扩展预留了技术空间。

随着新版模型投入实际应用，开发者社区开始期待下一代产品的技术突破。有分析人士指出，从版本迭代节奏判断，DeepSeek团队可能正在筹备具有划时代意义的重大升级，智能体技术的商业化应用或将迎来关键转折点。

更多>同类资讯

11.98万起售！第三代蓝电E5 PLUS预售，全时四驱+长续航成家庭出行新宠

11-02

第三代蓝电E5 PLUS预售开启！11.98万享230km续航与全时四驱新体验

11-02

马斯克预言2030年传统智能手机退场，AI终端将开启人机交互新篇章

【环球网科技综合报道】11月2日消息，据外媒zamin报道称，埃隆·马斯克在与记者乔·罗根的对话中大胆预测：到2030年，传统智能手机将走向终结，取而代之的是基于人工智能的新一代终端设备。这一言论迅速引发科技…

11-02

马斯克预言手机五年后“退场”？技术变革下投资机会如何把握？

老铁们，帮主今早刷到个猛料——马斯克又在乔·罗根播客里放话了，说五年后手机和App都得消失！马斯克说，未来手机不再是现在这玩意儿，而是一个“AI推理边缘节点”。你想订机票，不用打开App，直接对AI说一句，…

11-02

AI赋能黑土地保护：从“CT式”分析到全流程智能化升级

中新网长春11月2日电 (记者郭佳)记者2日从在吉林长春举行的第三届黑土地耕地质量监测评价研讨会上获悉，来自中国30家科研机构的近百位专家形成共识：人工智能(AI)正成为黑土地保护和治理的新“农具”。他透露…

11-02

集邦咨询预测：2026年AI服务器出货与HBM需求均呈强劲增长态势

11-02

英特尔拟50亿美元收购SambaNova 加速AI布局缩小与英伟达差距

11-02

马斯克预言2030年：AI终端将取代智能手机，开启人机交互新纪元

11-02

马斯克预测未来手机变革：无应用操作系统，AI主导数字内容生成

11-02

亚马逊AI基础设施里程碑：产能扩张、芯片升级，开启增长加速周期

11-02

慕思携手MIT实验室：以智能纤维开启睡眠科技新篇，共筑健康睡眠生态

11-02

五家中国科技企业硬核突破：从关键技术到生态规则的跨越式发展

11-02

谷歌Q3营收首破千亿：全栈AI战略显威，生态护城河持续加固未来可期

本月推出的企业AI门户Gemini Enterprise，已在700家公司中获得超200万订阅者，基于谷歌生成式AI模型的产品收入同比增长超200%。从TPU算力的规模化变现到Gemini模型的持续迭代，从…

11-02

OpenAI生态拓展新动向：为上海IT外包生态上下游带来哪些发展启示？

以个性化AI服务为例，上海的IT外包公司可以关注人工智能、机器学习等前沿技术，通过与相关领域的初创公司合作，为客户提供更加个性化、智能化的解决方案。上海的IT外包公司及其生态上下游企业应该从中吸取经验，聚焦核…

11-02

广交会科技纺织受热捧：光伏夹克、吸湿蚕丝成境外客商“心头好”

科技赋能的中国纺织服装“新品”，吸引众多境外采购商前来问货，洽谈订单。许永祝介绍说，公司在本届广交会带来用再生面料生产的瑜伽服、泳装等产品，绿色环保，设计时尚，受到境外采购商的青睐。作为中国纺织服装的品牌…

11-02

点击查看更多 +

全站最新

Lumin宝藏版焕新登场，4.79万起解锁都市代步安全、空间与智能新体验

武汉见证！比亚迪汉智驾版焕新登场，百万热爱开启电驱新征程

深蓝L06预售开启：磁流变悬架+智能科技，为年轻群体打造纯电新选择

雷克萨斯Sport Concept来袭！电气化超跑欲挑战法拉利保时捷江湖地位

捷途山海T1四驱版将至，三电机真四驱解锁城市与野外的全能出行

电动超跑新标杆？AMG GT XX与仰望U9 Xtreme各展极致性能魅力

热门内容

本栏最新

11.98万起售！第三代蓝电E5 PLUS预售，全时四驱+长续航成家庭出行新宠

第三代蓝电E5 PLUS预售开启！11.98万享230km续航与全时四驱新体验

第五代瑞虎8 11月3日预售来袭！双前脸设计大空间智能座舱亮点十足

腾势N8L上市：以技术破局重新定义30万级大六座SUV新标准

北京现代EO羿欧上市：E-GMP平台加持，11.98万起售续航最长722公里

吉利银河星耀6上市：三大最省成本+四大越级满配，重塑国民家轿新标杆

本网站LOGO小熊标志受版权保护，版权登记号：鲁作登字-2015-F-025467，未经ITBEAR官方许可，严禁使用。
声明：本网站是公益性科普网站，为网友提供科技类资讯内容，无障碍技术由太阳湾捐增，为阅读障碍用户提供内容听读服务。如本站内容侵犯了您的权利，请通知我们及时删除。
中国（山东）自由贸易试验区鲁ICP备11015305号-1 联系入口
Copyright © 小熊科技资讯 2007-2024 ITBEAR.COM.CN All rights reserved.