ITBear旗下自媒体矩阵:

梁文锋首轮融资估值达3400亿,DeepSeek破局人才算力双挑战

   时间:2026-05-10 08:47:29 来源:互联网编辑:快讯 IP:北京 发表评论无障碍通道
 

人工智能领域再起波澜,杭州深度求索创始人梁文锋首次面向战略投资者开放融资通道。据知情人士透露,其主导的DeepSeek项目即将完成首轮融资,投后估值达500亿美元,折合人民币约3400亿元。作为核心创始人,梁文锋持有84%的最终受益股份,个人投入资金或超200亿元,占募资总额的四成比例。

这家以技术驱动著称的机构,在融资前夕推出重磅产品。4月24日,DeepSeek-V4模型正式上线,距离前代V3版本发布间隔484天。这款被寄予厚望的产品,在长文本处理领域实现突破性进展,通过创新的注意力机制将计算资源需求降低40%,使百万级上下文处理成本大幅下降。技术文档显示,新模型包含Pro和Flash两个版本,分别对标顶级闭源模型的性能与经济性。

人才流失危机成为推动融资的关键因素。技术报告末尾的作者列表中,10个带星号的离职标注格外醒目。核心研发人员郭达雅的出走引发行业关注,这位参与过V3、R1等明星模型研发的技术骨干,被传以近亿元年薪加盟字节跳动。尽管公司为深度学习研究员开出150万元年薪,并提供弹性工作制等福利,但仍难以阻挡人才流动趋势。

算力瓶颈制约着技术突破的步伐。招聘平台显示,DeepSeek近期集中释放36个技术岗位,其中AI超算集群运维工程师等职位明确要求千卡级集群管理经验。公司早在2021年就储备了1万张英伟达A100显卡,并将部分算力开放给高校科研使用。技术报告透露,新模型已在华为昇腾NPU上完成验证,但受高端算力限制,Pro版本服务吞吐量仍不理想,预计下半年昇腾950超节点上市后才能实现价格下调。

在Agent智能体方向,DeepSeek展现出强烈进取心。新模型专门针对Claude Code、OpenClaw等主流产品进行优化,内部评测显示V4-Pro在代码生成任务中达到开源模型最佳水平。不过技术团队坦承,与GPT-5.4和Gemini-3.1-Pro等前沿模型相比,仍存在3至6个月的技术代差。这种直面差距的坦诚,体现在模型发布公告的结语中:"不诱于誉,不恐于诽,率道而行,端然正己"。

融资资金的使用方向透露出战略调整信号。知情人士称,本轮融资将重点投入计算资源升级和人才激励体系完善。在乌兰察布数据中心,高级运维工程师等岗位开出最高3万元月薪,显示出对基础设施建设的重视。这种技术理想与商业现实的平衡术,或将决定这家明星机构能否在AI竞赛中持续领跑。

 
 
更多>同类资讯
全站最新
热门内容
网站首页  |  关于我们  |  联系方式  |  版权声明  |  争议稿件处理  |  English Version