滚动资讯

当前位置：首页 > 资讯 > 信息流 > 正文内容

DeepSeek V4还能更省！新工具缓存命中率高达99.82%，2折稳定到手

时间：2026-05-25 22:17:57 来源：量子位编辑：快讯 IP：北京 发表评论无障碍通道

我悟了，DeepSeek V4系列发布1个月，价格屠夫的本色这才刚刚发力啊！

官方这边，打折促销期还没过，折上折价格已官宣落定为永久降价。

就这样，开源社区仍不满足。您猜怎么着？缓存命中率直接给干到99.82%了！

什么概念？就是原本4亿+token、61美元（合人民币414元）的账单，能直降至12美元（合人民币81元），2折轻松到手。

老哥老姐们给这个名为Reasonix的项目点星都点疯了，状态be like：

具体来说，Reasonix是一款专为DeepSeek打造的终端coding harness，核心目的很简单，就是两个字：省钱——

长会话能把缓存命中保持在90%+，输入token成本降到1/5的那种。

DeepSeek原生编程Agent

Reasonix的实现思路也不复杂，最核心的一点是：基于字节稳定prefix-cache设计的append-only运行循环。

就是说，Reasonix的工作流程是专门为了DeepSeek的缓存机制设计的：旧的上下文固定不动，新消息只往后追加，尽量保证每一轮请求的前半部分完全一样，从而提高缓存命中率，降低长会话成本。

具体架构可以拆分成3个部分来看。

缓存优先循环（Cache-First Loop）

自动前缀缓存（prefix-cache）仅在当前请求的精确字节前缀和先前请求匹配时才会激活，想要提高缓存命中率，需要解决的是大多数智能体循环会在每次交互时重新排序、重写或注入新的时间戳的问题。

Reasonix的解决方案是把上下文划分为三个区域：

这样，前缀会被固定下来，在每个会话中仅计算一次；历史消息只追加不重写；而草稿区中的任何信息在归入日志前，均需通过Tool-Call Repair进行提炼。

工具调用修复（Tool-Call Repair）

DeepSeek比较容易遇到的问题包括：

工具调用JSON在内部已经生成，但在最终消息里却消失不见；

模型想调用工具，但参数写歪了，即JSON参数畸形；

同一工具被反复调用且参数完全相同，即重复调用风暴；

JSON被截断。

工具调用修复会通过4轮处理，让Reasonix在真正执行前，先尝试修复这些问题。

成本控制

首先，默认优先使用v4 flash，困难任务才会切pro。

其次，轮次结束自动压缩上下文。

用户要是觉得下一次任务比较难，就输入/pro，这样下一轮对话模型就会切换为v4 pro。跑完这一轮后Reasonix自动切回便宜模型，无需用户手动更改。

最后，失败信号会触发自动升级：失败次数到达警戒线后，当前轮次的剩余部分就会切到v4 pro上运行。

Reasonix在安装使用方面也比较简单。

两步即可运行，无需全局安装：

进入项目目录；输入：npx reasonix code，启动TUI会话。

不习惯用终端的话，Reasonix还提供了桌面版。

以及再次再次高亮一下来自Reasonix官方的提醒：

Reasonix只为DeepSeek打造，每一个抽象层级都基于DeepSeek的Feature构建，完全不通用，也“不会发布通用功能”。

One More Thing

省钱的事情，大家伙当然喜闻乐见，毕竟也不是每个人都能像龙虾之父Peter那样无限狂烧公司token。

于是关于Reasonix的讨论，是轻轻松松就盖了几百楼。

不少小伙伴已经摩拳擦掌跃跃欲试，但也有人提出疑问：

我们真的需要一个DeepSeek原生编程Agent吗？

有网友分享说，Ta写了一个微型桥接程序，在Codex中使用DeepSeek V4 Pro，同样实现了95%以上的高缓存命中。

并且Ta“没做任何特殊处理，只是将DeepSeek API的格式调整为Codex所需要的”。

anyway，harness和harness之间肯定是有区别的。就有网友分享说，在Claude Code里使用DeepSeek V4比在OpenCode上省钱。

甭管你用了哪一种方案，都欢迎在评论区分享分享心得体验。

大家省才是真的省（doge）。

更多>同类资讯

24日漫剧&AI真人剧日榜：《大魏极品摄政王》漫剧第一

05-25

币安创始人赵长鹏辟谣在迪拜冲浪失联

05-25

既非活着、也非死去！美国科学家搞出离体“缸中之脑”

05-25

长鑫科技董事长朱一明让渡7.68亿股激励给员工

05-25

新型全息3D打印技术效率提升70倍

05-25

生与死之间的人脑，正在用来测试新药

05-25

全球首台Cray T3D拍卖：当年1个亿、现在几十万

05-25

国产芯片重磅收购！紫光国微19亿拿下全球第一晶闸管

05-25

算力租赁人士：没有收到“新要求”大厂采购海外卡均有发票

05-25

宁德时代×地上铁达成合作，首个轻卡换电生态投运

05-25

X打击“内容搬运工”，确保曝光量、收益归原作者

05-25

“死了么”App升级更名为“在么在么”，新名称商标申请已在进行中

05-25

DeepSeek V4省钱新招！开源工具Reasonix让缓存命中飙至99.82%

05-25

5月24日漫剧与AI真人剧榜单揭晓《大魏极品摄政王》漫剧荣登榜首

05-25

币安创始人赵长鹏亲自回应：未在迪拜冲浪，所谓失联系谣言

05-25

点击查看更多 +

全站最新

联想百应AI主机成都发布：破局企业算力痛点，共启AI商用新篇章

小米SU7亮相西班牙塞维利亚疑似为欧洲市场上市做路测准备

户外消费新趋势：年轻人引领潮流，国货崛起折扣渠道成新宠

2026年淘宝自动发货软件升级转型：多款主流工具助力虚拟商户高效运营

小米SU7亮相西班牙塞维利亚疑似为进军欧洲市场开展路测验证

海博思创携手华为数字能源共探新型储能等领域合作新路径

热门内容

本栏最新

系统渗透检测：规范操作防风险，持续检测保安全

问卷制作太麻烦？问卷加加小程序来救场！一分钟搞定问卷发起与制作

AI Agents浪潮下：大厂受困传统思维，小微团队敏捷突围占先机

北京养老服务地图上线高德：一键查询养老机构，科技助力智慧养老新体验

北京养老服务再升级！民政局携手高德上线养老地图，一键导航享便捷服务

艾立罗电子携多款测试设备亮相2026上海CPSE展助力新能源发展

本网站LOGO小熊标志受版权保护，版权登记号：鲁作登字-2015-F-025467，未经ITBEAR比尔科技官方许可，严禁使用。
声明：本网站是公益性科普网站，为网友提供科技类资讯内容，无障碍技术由太阳湾捐增，为阅读障碍用户提供内容听读服务。如本站内容侵犯了您的权利，请通知我们及时删除。
中国（山东）自由贸易试验区鲁ICP备11015305号-1 联系入口
Copyright © 比尔科技 2007-2024 ITBEAR.COM.CN All rights reserved.