在生物实验领域,一项突破性成果引发关注。恩和科技于知名预印本平台《bioRxiv》发布了Biology Protocol Language(BPL)及其配套生成管线BPL-COGEN,为生物实验协议构建起一套形式化语言体系,为Physical AI进入物理世界搭建起标准接口。
BPL是专为生物实验协议量身打造的可编译、可验证形式化语言。而BPL-COGEN则能将自然语言协议自动转化为BPL程序,它由一个经过300亿参数微调的大语言模型与确定性编译器组成,形成“生成—验证—修复”的闭环系统。
在基于300篇《Nature Protocols》论文的基准测试中,BPL-COGEN展现出卓越性能。首轮一致性达到95.1%,经过2轮编译 - 仿真闭环后,正确率提升至98.6%。目前,相关代码已在GitLab以MIT License完全开源。
当前,AI在数字世界表现活跃,能生成假设、设计实验,材料科学领域已出现自主驱动的Self-driving Lab。然而在生物学领域,AI的输出最终要转化为物理操作,这一过程长期依赖自然语言文本,成为限制AI驱动实验设计与可复现物理执行的瓶颈。
这一问题在半导体和软件行业多年前就已解决。半导体设计通过Verilog和VHDL实现从自然语言到硬件描述语言的转变,软件工程借助类型化语言确立可验证的稳定性。但生物学一直缺乏具备编译器验证能力的底层语言,导致实验可复现性差。《Nature》2016年对1576名研究者的调查显示,超70%的人无法复现他人实验,超半数人无法复现自己的实验。恩和团队进一步将问题归纳为协议精确度、协议验证、跨平台可迁移性三个维度。协议精确度方面,典型指令中常隐藏浓度、时间、体积等多处未明分支点,叠加后使实验可复现性依赖人员经验;协议验证上,自然语言缺乏执行前模拟物理一致性的机制,内部逻辑错误难以提前察觉;跨平台可迁移性方面,一项跨四个实验室的合成生物学研究发现,名义一致的协议在不同实验室转化效率差异超两倍,根源在于执行上下文的隐性差别。
BPL用形式化规范消除自然语言的歧义。在其类型系统下,所有隐性参数必须显式声明,违反物理规律的操作在编译阶段就会被拦截,避免错误流入真实实验台。为配合BPL,团队构建了BPL-COGEN自动化编译器,将大语言模型与确定性编译器耦合在“生成—验证—修复”闭环中。自然语言SOP被归一化转换为BPL,根据编译器诊断反复修正,直至满足所有物理、量纲、状态约束,大语言模型负责理解科学家意图,编译器负责验证物理世界约束。
团队从多个层面对BPL-COGEN进行系统性验证。在大规模文本评测中,基于300篇Nature Protocols论文,BPL-COGEN取得上述优异成绩。在分子生物学验证中,同一份BPL源码同时编译至手动操作与自动化设备两种执行上下文,均产生可复现的实验结果,证明协议在执行模态上的可迁移性。在分析化学迁移验证中,不同设备上下文之间迁移后,类胡萝卜素的表征获得可比分析结果,验证了协议的设备无关可迁移性。这三项验证表明,BPL与BPL-COGEN解决了协议精确度、可验证性、跨平台可迁移性三大核心难题。
BPL在恩和SAION物理AI平台中扮演重要角色,它是“认知—控制—执行”三层架构中执行层的标准接口。向下,它向生物铸造厂的自动化设备与人类操作员下发指令;向上,它回流结构化实验执行数据,驱动认知层与控制层持续进化。结合此前SAION AI平台在文献阅读到质粒设计与湿实验组装的100%正确率、质粒构建90%成功率,BPL的引入使物理AI闭环的执行层具备可验证、可迁移的标准协议基础。
在生物制造领域,AI技术的核心价值在于推动经济效益的兑现。当AI真正驱动产业链、产品、订单产生经济价值时,才在产业中站稳脚跟。BPL的提出,是恩和将“AI兑现产业价值”落实到执行层的具体举措。据相关机构预测,至2035年全球生物制造市场规模将达约6万亿美元。纵观工业史,制造业从“作坊”走向“工业化”的关键在于形式化协议标准的建立。作为首个具备“编译时物理验证 + 跨平台可迁移”双能力的工程级方案,BPL为这一万亿级赛道的标准化推进提供了关键基础设施,为生物领域物理具身AI提供了关键基础,重新定义了生物制造的工程边界。











