在当下AI技术狂飙突进的时代,大语言模型的智能程度备受瞩目,然而一个关键问题却常被忽视:若AI输入的数据质量低劣,其输出结果必然也难如人意。在B端企业里,超过80%的数据被困在PDF、扫描件、表格和演示文稿等非结构化文档中,传统OCR工具处理这些文件时,常出现布局混乱、表格破坏等问题,导致下游大语言模型产生“幻觉”,这在金融、医疗、法律等严肃场景中是无法接受的。
在硅谷,一家名为Reducto AI的初创企业有望解决这一难题。该公司成立仅18个月,在未进行任何营销的情况下,就成功融资1.08亿美元,约合人民币7.6亿元,如此快速的融资速度在火爆的AI热潮中也十分罕见。
嘉和资本CEO袁子恒指出,文档解析类产品,能做和做好的差别很大,B端客户对高精度要求极高,尤其是文档布局中的表格、复杂公式识别。Reducto AI能迅速脱颖而出,正是凭借这一优势。从产业链定位看,非结构化数据解析平台属于基础设施层,类似“卖铲人”。无论AI营销、客服、财务、研发、HR还是供应链等领域,都离不开底层结构化数据。全球市场规模超千亿美金,且以超过40%的速度高速增长,因为企业80%以上的数据是非结构化的,且还在持续增加,这些数据都需处理成高质量、结构化且可供AI使用的数据。同时,数据未达到AI可用状态,是目前国内外企业落地AI和构建自有知识库的最大阻碍,痛点十分迫切。
Reducto AI于2023年1月创立,起初只是两人团队。2024年起,其凭借API优先的文档AI平台吸引全球顶级投资机构目光。顶级风投机构在极短时间内接力领投,反映出他们对这家“品类定义者”公司的极度担忧错过(FOMO)。其A轮(2025年4月)和B轮(2025年10月)融资间隔仅5 - 6个月,还触发了B轮领投方a16z的“抢先下注”。First Round、Benchmark和a16z这三家风格顶尖的机构先后成为Reducto的“第一大外部股东”,到2025年10月,累计融资额达1.08亿美元。Reducto CEO Adit Abraham曾在播客采访中透露,公司仅两人团队时,Benchmark的Chetan Puttagunta就主动联系,建议进行A轮融资,这一“反向推销”现象充分体现了Reducto在硅谷的影响力。
Reducto的产品形态是一个API优先的文档AI平台,搭配名为“Reducto Studio”的交互式工作区,供团队构建、评估和部署数据管道。它并非单一工具,而是面向开发者的“工具箱”,核心API矩阵构成完整工作流,大致由四种API组成。Parse API作为基础,将复杂文档转换为包含文本、表格、图形及布局信息的结构化输出;Extract API基于Parse API,允许用户通过提供JSON Schema或自然语言提示,精确提取结构化字段;Split API将长文档智能拆分为语义上有意义的“块”,优化下游RAG应用上下文;Edit API是行业首个AI文档编辑API,允许AI“回写”或填写文档中的空白、复选框和表格。
Reducto凭借核心产品技术实现“闪电战”式增长。参加2024年初的YC W24批次期间,完成从“LLM记忆”到“文档AI”的关键转型。核心产品(Parse API)发布后6个月内,ARR从0增长到超100万美元。2025年10月播客采访中,CEO Adit Abraham分享了通过“创始人主导销售”实现ARR突破500万美元的经验。除ARR外,其他增长指标也十分亮眼。到2025年4月A轮融资时,已处理“数亿页”文档;2025年10月B轮融资时,累计处理量超“10亿页”,A轮到B轮短短5 - 6个月内,月处理量增长6倍。Reducto资本效率极高,CEO Adit Abraham多次强调,筹集1.08亿美元后,到2025年10月仅“烧掉”100万美元,表明产品市场契合度极强,团队精干。这笔资金将用于在AI人才战中招募顶尖博士,并应对与AWS、Google等云巨头的长期消耗战。
Reducto AI的两位创始人经验丰富、性格互补,顺利走过硅谷经典创业历程。公司由两位MIT毕业生Adit Abraham(CEO)和Raunak Chowdhuri(CTO)共同创建。Adit毕业于麻省理工学院,获计算机科学与工程学士学位,曾在Google担任产品经理,负责YouTube搜索,领导过收入颇高的项目发布,还在MIT Media Lab和BlinkAI从事机器学习研究,是具备深厚技术背景的“产品型CEO”,深谙技术商业化和规模化关键。Raunak同样毕业于MIT,获计算机科学学士学位,主攻AI与机器人方向,高中毕业前就在计算机视觉领域发表学术论文,获超100次引用,在MIT期间曾在MIT Driverless的感知团队和MIT林肯实验室担任机器学习研究员,创办Reducto前,还创办过计算化学咨询公司并实现20万美元ARR,是Reducto的技术核心,在计算机视觉领域有近十年“科班”经验。两人最初在MIT一门研究生机器学习课程上结识。
Reducto的诞生并非一帆风顺,经历了产品转型。最初,Adit和Raunak申请YC的项目名为“Remembrall”,是“LLM的长期记忆API”,在Twitter上引起关注并收到数百个试用注册。但Adit与早期用户交流后发现,用户虽觉得想法有趣,却无真正需求,客户只愿每月支付10 - 20美元,该项目只是“弱信号”的“维生素”产品,而非解决“止痛药”类问题。深入与客户对话后,他们发现客户反复抱怨的“若能管理聊天记录,能否管理用户上传的PDF文件”才是“强信号”,几乎所有AI团队都面临“处理PDF的准确性”问题。于是,他们用一个周末用Streamlit构建简单PDF解析工具原型并在YC论坛发布,得到截然不同反馈,用户纷纷表示比从AWS得到的结果还好并询问是否有API。这一反馈让他们意识到找到真正痛点,立即放弃原有项目,专注于文档智能,Reducto AI由此诞生。在YC期间,他们凭借新方向和出色产品原型,在仍是两人创业公司时就签下一家《财富》10强企业客户,验证了产品市场契合度。
Adit在业内形象鲜明,极端专注、反直觉、客户至上,重视“拒绝”的艺术。Reducto早期,他果断“解雇”一个价值5000美元的合同,因客户需求会分散团队精力,还拒绝了价值“数百万美元”的建筑文件合同,因其不符合对核心产品精度的专注。他推崇“工程师每周只有一个优先事项”的工作模式,确保团队在一个方向上做到极致。作为技术背景的创始人,他亲自负责销售,直到ARR突破500万美元,其销售理念是“关怀胜于销售技巧”,强调与早期客户建立深度关系。
Reducto所处的“智能文档处理”(IDP)市场,正以20% - 30%的高复合年增长率高速扩张。该赛道看似是充斥三类玩家的“红海”,云巨头如Amazon Textract、Google document AI是云平台“捆绑”服务,价格低廉且与云生态深度集成;老牌企业软件如ABBYY是为“业务人员”设计的“低代码”RPA工具,品牌历史悠久;还有一堆开源工具如Unstructured.io,免费且可自托管。然而,Reducto正在其中开辟新“蓝海”。它是在正确时间(VLM与RAG爆发的技术周期)、由正确的人(“产品CEO” Adit与“技术天才CTO” Raunak)、执行正确战略(从YC的“市场拉力”转型和“极端专注”)的“三重奏”公司。它未投身“淘金热”制造LLM,而是选择成为关键“卖铲人”。云巨头工具“大而全”,但在需要极致准确性的“长尾”复杂文档上表现不佳,Reducto在基准测试中“最高领先AWS、Google和Azure 20%”,在金融或医疗领域,这20%的准确性至关重要。例如,AI原生TPA(第三方管理人)Elysian使用Reducto处理保险索赔文件,审查速度提高16倍;医疗公司Anterior使用Reducto处理医疗记录,实现99%以上准确率,将决策时间从几天缩短到几秒。
不过,Reducto也面临诸多竞争和挑战。袁子恒正在陪跑一家中国出海的文档解析创业企业,该企业精度超过Reducto,成本更低、速度更快,开发了自有多模态数据解析引擎和多个自研模型,主要面向海外市场,已获取美国知名大学、金融机构和欧洲企业等海外客户,在解析精度、千页价格、支持格式种类上超过欧洲大力扶持的大模型厂商Mistral的OCR。同时,大厂也带来挑战,AWS和Google正将文档处理能力与VLM(如Gemini)和AI平台(如Bedrock)深度“捆绑”销售,可能以“更低”甚至“免费”价格提供“足够好”的解析能力。行业还面临“GPT - 5是否会免费解决这一切”的长期威胁,随着基础模型视觉理解能力飞跃,Reducto的“准确性”优势可能被削弱。不过,袁子恒表示,巨头切入的市场可能与Reducto不同,DeepSeek今年10月发布的Deepseek - OCR,虽看起来和Reducto相似,但从目标、要解决的问题和面向的市场来看,完全不同。另外,CEO Adit Abraham的“极端专注”哲学虽助力公司实现从0到500万ARR的奇迹,但被认为难以将公司从500万ARR带到1亿美元ARR。










