法律人工智能领域迎来新变局,备受关注的Harvey公司近期宣布了一项重大战略调整。这一变动意味着,Harvey将不再仅仅依赖OpenAI的技术,而是将整合Anthropic与谷歌的先进基础模型,为其服务增添新的动力。
作为OpenAI初创基金的昔日明星项目,Harvey曾深受该基金的青睐。该基金由OpenAI首席执行官Sam Altman掌舵,旨在推动基于AI技术,特别是OpenAI自研技术的公司发展。自2022年12月被列为首批支持的四家初创公司之一以来,Harvey迅速崛起,估值已飙升至30亿美元。今年2月,红杉资本领投的3亿美元D轮融资更是为其发展注入了强劲动力,Coatue、Kleiner Perkins及OpenAI基金等多家知名机构也纷纷跟投。
然而,值得注意的是,Harvey此次战略调整中,虽然并未完全摒弃OpenAI,但显然已向其他技术供应商敞开了大门。事实上,早在2024年7月,谷歌的风险投资部门GV就已领投了Harvey的1亿美元C轮融资,OpenAI基金也参与其中。尽管当时谷歌已成为Harvey的股东,但Harvey并未立即采用谷歌的AI模型。
促使Harvey做出这一战略转变的关键,是其内部开发的BigLaw基准测试。该测试结果显示,各种基础模型在法律任务上的表现日益精进,且不同模型在特定任务上展现出各自的优势。Harvey认为,相较于投入巨资自行训练模型,采用来自其他供应商的高性能推理基础模型,并针对法律市场进行微调,将更为高效。使用多样化的模型也有助于Harvey构建更为强大的AI系统。
Harvey在官方博客中透露,短短不到一年的时间里,已有七个模型(包括三个非OpenAI模型)在BigLaw Bench上的表现超越了最初的基准系统。这些测试不仅揭示了不同模型在特定法律任务上的优势,还为Harvey提供了宝贵的性能数据。
例如,谷歌的Gemini2.5Pro在法律文件起草方面表现出众,但在处理审前任务,如撰写口头辩论时则略显不足,因其对复杂的证据规则理解有限。相比之下,OpenAI的o3在此类任务中表现良好,而Anthropic的Claude3.7Sonnet也紧随其后。这些数据为Harvey在选择和微调模型时提供了重要参考。
未来,Harvey还将加入日益扩大的模型基准性能公开排行榜,对主流推理模型在法律任务中的表现进行排名。不仅如此,该公司还将分享顶级律师对模型性能的深入见解,这些见解是单一分数基准所无法捕捉的。这一举措无疑将进一步提升Harvey在法律AI领域的竞争力。
Harvey首席执行官温斯顿·温伯格在声明中表示:“我们非常感激OpenAI作为我们的投资者和关键合作伙伴所给予的支持。我们将继续致力于满足全球客户的需求,并为客户提供更多选择。”这一声明不仅体现了Harvey对OpenAI的尊重,也彰显了其开放合作、追求卓越的决心。