滚动资讯

当前位置：首页 > 资讯 > 人工智能 > 正文内容

DeepSeek策略揭秘：压缩推理成本，全力投入AGI内部研发

时间：2025-07-05 13:17:36 来源：ITBEAR编辑：快讯团队 IP：北京 发表评论无障碍通道

在AI大模型市场的风起云涌中，DeepSeek R1的横空出世无疑成为了一颗震撼弹，仅仅128天的时间，便深刻改变了行业的格局。

DeepSeek R1的问世，如同一把利剑，直接刺破了推理模型价格的高墙。OpenAI在六月更新的o3价格，相较于之前的o1，价格直接打了二折，这无疑为整个市场树立了新的价格标杆。

与此同时，第三方平台上DeepSeek模型的使用量呈现爆炸式增长，与刚发布时相比，增长了近20倍，这一趋势不仅推动了AI技术的普及，更为众多云计算厂商带来了前所未有的商业机遇。

然而，令人意外的是，尽管DeepSeek模型在第三方平台上大放异彩，但其自家的网站和API市场份额却出现了下滑，似乎未能跟上AI产品上半年持续增长的步伐。

据SemiAnalysis发布的一篇深度报告揭示，DeepSeek之所以能够迅速降低推理模型的价格，背后是其对服务质量的妥协。用户在使用DeepSeek官方平台时，往往需要等待数秒才能看到第一个字符的出现，这一首token延迟的问题，成为了制约其用户体验的关键因素。

相比之下，虽然其他平台的价格普遍更高，但其在响应速度上的优势却显而易见。例如，在Parasail或Friendli等平台，用户只需支付3-4美元，便可享受到几乎零延迟的100万token服务。而微软Azure平台，尽管价格是DeepSeek官方的2.5倍，但其延迟却减少了整整25秒。

DeepSeek在价格与性能之间的权衡也显而易见。在有限的推理计算资源下，DeepSeek只提供了64k的上下文窗口服务，这在主流模型提供商中堪称最小之一。对于需要读取整个代码库的编程场景而言，64k的上下文窗口显然不够用，因此用户更倾向于选择第三方平台。

值得注意的是，DeepSeek的这些降本策略并非偶然，而是其主动做出的决定。DeepSeek目前似乎并不太关注用户体验，也无意通过聊天应用或API服务向用户提供大量token，而是将更多的算力资源投入到内部研发中，以实现其AGI的宏伟目标。

DeepSeek的这一策略，不仅降低了推理服务的成本，还通过开源策略吸引了其他云服务托管其模型，从而赢得了更广泛的影响力并培养了生态。然而，这也使得DeepSeek在用户体验上有所欠缺，尤其是在响应速度和上下文窗口大小等方面。

在DeepSeek的影响下，其他大模型供应商也开始调整策略。例如，Claude为了缓解算力紧张的问题，降低了输出速度，但仍然在努力平衡用户体验。而Claude模型的设计也更加注重生成简洁的回复，以减少token的使用量。

这些迹象表明，大模型供应商正在从多个维度改进模型，不仅追求模型的智能上限，更注重提升每个token所能提供的智能。这一趋势无疑将推动AI技术的进一步发展，为用户带来更加高效、智能的服务。

举报 0 收藏 0 打赏 0评论 0

更多>同类资讯

2025外滩大会AI科创赛启航：探索AI智能硬件、金融与安全领域新应用

7月3日消息，2025 Inclusion•外滩大会科技智能创新赛（简称“外滩大会AI科创赛”）正式启动，本届大赛在上海市科学技术委员会指导下，聚焦AI智能硬件、金融智能、AI安全等领域创新应用，设置人工智能…

07-05

奇富科技Lumo AI合规助手：重塑合规管理，效率跃升新高度

07-04

苹果自研芯片布局云服务，或成亚马逊等巨头新挑战

07-04

抖音启动暑期未成年人保护行动：16岁以下禁播，强化青少年网络权益

07-04

ChatGPT命名幕后：从“Chat with GPT-3.5”到传奇的诞生

07-04

维信金科豆豆钱：科技引领，重塑金融科技服务新高度

维信金科作为金融科技领域的创新探索者之一，多年来开拓创新、精耕细作，持续构建数字科技核心推动力，不断健全金融科技创新体系，并通过多举措并举以及科技赋能，促进金融科技服务的智能化、高效率与高品质。维信金科在近…

07-04

浙江人形机器人创新中心新动作：智能机器人公司注册，资本达千万级

07-04

AI赋能安全，IDC预测中国安全智能体市场2028年将达16亿美元规模

本报告针对中国安全智能体市场的发展现状进行了调研，希望通过IDC对于中国市场中安全智能体产品的调研来帮助市场充分地了解安全智能体相关技术在过去的发展情况和未来的发展趋势，并给予技术买家采购和建设建议。 IDC…

07-04

Cluely推出新企业产品后年收入飙升，达700万美元，面临开源竞品挑战

07-04

庆阳数据中心集群万P算力上线，西部算力高地加速崛起

作为全国八大算力枢纽节点之一，庆阳数据中心集群自2021年启动建设以来，算力规模从2023年底的5000P飙升至2024年6月的1.2万P，并在年底前突破5万P，成为全国增速最快、增量最大的数据中心集群。以…

07-04

人工智能：塑造未来生活的新引擎与我们的应对策略

在两个月的讨论中，他们针对人工智能应该干什么、怎么干进行了一番讨论，列出了人工智能领域需要研究的自动计算机、编程语言、神经网络、计算规模理论等问题，并形成了一个比较前沿的报告，这被公认为是对人工智能一个比较完…

07-04

小米7月服务周来袭，AI百宝箱内测暂停，苹果生态再打通

涵盖手机服务、AI 工具和跨设备互联，每一项都直击用户痛点。近日，小米互联服务 App 近日升级至 1.7.2 版本，新增了「iPhone支持小米云相册」功能！这款 App 早在去年 10 月就登陆了…

07-04

微软全球大裁员：近9000人受影响，AI转型下的组织变革

此次裁员将影响多个部门，虽然公司未具体说明哪些部门，但Xbox游戏部门可能会受到较大影响。这是微软自2023年以来最大一波裁员，反映出公司在AI技术快速发展的背景下，对某些人力资源的需求可能会减少。需要…

07-04

脑机接口未来五年：彭雷展望医疗、感官与AI融合新纪元

07-04

荣耀Magic V5智能制造揭秘：AI引领中国手机制造新飞跃

07-04

点击查看更多 +

全站最新

蔚来李斌宣布：自研5纳米智驾芯片神玑NX9031成功应用，战略目标初达成

新车磨合那些事儿：现代技术下仍需注意的小细节

马云低调现身比利时布鲁塞尔，保镖随行引关注

抖音平台：非遗文化传播与消费的新引擎

数字时代新舞台：抖音引领非遗文化融入生活与消费潮流

人机协作新突破：48毫秒感知，为机器人装上“安全雷达”

热门内容

本栏最新

DeepSeek策略揭秘：压缩推理成本，全力投入AGI内部研发

2025外滩大会AI科创赛启航：探索AI智能硬件、金融与安全领域新应用

维信金科豆豆钱：科技引领，重塑金融科技服务新高度

浙江人形机器人创新中心新动作：智能机器人公司注册，资本达千万级

AI赋能安全，IDC预测中国安全智能体市场2028年将达16亿美元规模

庆阳数据中心集群万P算力上线，西部算力高地加速崛起

本网站LOGO小熊标志受版权保护，版权登记号：鲁作登字-2015-F-025467，未经ITBEAR官方许可，严禁使用。
声明：本网站是公益性科普网站，为网友提供科技类资讯内容，无障碍技术由太阳湾捐增，为阅读障碍用户提供内容听读服务。如本站内容侵犯了您的权利，请通知我们及时删除。
中国（山东）自由贸易试验区鲁ICP备11015305号-1 商业合作入口
Copyright © 小熊科技资讯 2007-2024 ITBEAR.COM.CN All rights reserved.