滚动资讯

当前位置：首页 > 资讯 > 人工智能 > 正文内容

OpenAI推出GeneBench-Pro基准测试：助力AI模型攻克复杂生物数据分析难题

时间：2026-07-02 09:37:48 来源：互联网编辑：快讯 IP：北京 发表评论无障碍通道

随着生物科技领域数据量的爆炸式增长，如何让AI模型高效处理复杂的生物信息成为科研界关注的焦点。OpenAI近期推出的GeneBench-Pro基准测试，为评估人工智能在生命科学中的实际应用能力提供了全新框架。该测试突破传统评估模式，通过模拟真实科研场景中的数据挑战，重点考察模型在信息缺失、噪声干扰等复杂条件下的分析决策水平。

与传统基准测试强调记忆能力或标准化流程不同，GeneBench-Pro构建了包含模糊数据、缺失字段和干扰项的测试环境。研发团队特别设计了129道覆盖基因组学、蛋白质组学、转化医学等领域的题目，每道题目均提供接近真实研究的实验数据集。模型需要基于简短的实验描述自主选择分析方法，并在动态调整策略后给出科学结论，这种设计更贴近科研人员的实际工作模式。

在测试内容设计上，该基准覆盖了统计遗传学、功能基因组学等九个细分方向。例如某道关于罕见病基因的题目，会故意提供存在30%缺失值的测序数据；另一道蛋白质结构预测题则混入15%的错误标注数据。这种设计迫使模型必须建立数据清洗、异常检测和结果验证的完整分析链条，而非单纯依赖数据记忆或模式匹配。

为确保评估的客观性，OpenAI采用合成数据生成技术构建测试集。通过算法控制数据分布特征和干扰模式，既保证了题目难度的一致性，又避免了真实数据可能存在的偏差。这种技术路线使得模型得分更能反映其核心理解能力，而非通过统计捷径或数据泄露获得的虚假提升。

目前该基准已在Hugging Face平台开放10道交互式示例题，研究人员可实时观察模型处理生物数据的完整过程。后续将有50道题目交由第三方机构Artificial Analysis进行盲测，通过多模型对比验证评估体系的可靠性。这种开放协作的评估模式，有望推动生命科学领域AI工具的标准化发展。

更多>同类资讯

宁德时代在厦再投百亿，“零碳科技城”建设迈入实质性新阶段

自去年12月签约共建零碳科技城以来，项目推进密集：今年5月，厦门党政主要领导与宁德时代董事长曾毓群会谈推进建设；5月底，全球规模最大的储能检测实证平台在厦启动，总投资约30亿元；6月初，建发股份与宁德时代签…

07-02

博雷顿“算电双驱”战略发布智驾大模型引领矿山智能化协同新变革

业内人士表示，智驾大模型的发布，意味着博雷顿正在推动矿山无人驾驶从规则驱动走向模型驱动，从单车智能走向车队协同，从人工经验走向数据决策，从局部优化走向全局优化。业内人士认为，这场发布会标志着博雷顿正在把多…

07-02

获28亿美元融资，Wayve以“端到端”技术加速自动驾驶商业化布局

07-02

地平线HSD V2.0开启最大规模OTA升级以双引擎驱动端到端智驾新进化

07-02

特斯拉23年：从电动跑车到AI现实，业务版图持续拓展未来可期

07-02

安波福慕尼黑上海电子展发力：发布创新技术，赋能汽车与多元工业新未来

07-02

OpenAI发布GeneBench-Pro基准测试：聚焦AI真实科研场景下的生物学计算能力评估

07-02

古尔曼爆料：苹果2027年春季将推新款iPad Pro，聚焦内部升级或搭载M6或M7芯片

07-02

Figure03机器人入驻宝马美国工厂，执行真实物流工作

07-02

DeepSeek新招DSpark：不拼模型拼速度，推理成本优化新路径来了

07-02

OpenAI发布GeneBench-Pro基准测试：聚焦AI真实科研场景下的生物学计算评估

07-02

2026WAIC“AI创新者思享汇”：从共生到协同，共绘人机关系新蓝图

07-02

孙周兴复旦演讲：探寻AI无法触及之地，不可数字化哥德尔信息成关键

07-02

国产算力新突破！海光信息携手同济大学，AI4E千卡集群助力工程智能升级

【环球网科技报道记者李文瑶】6月25日，上海同济大学，海光信息与同济大学正式签署战略合作协议，挂牌成立全国首个“高校海光算力优化中心”，共建国内首个国产千卡工科智算集群。此次千卡集群的落地，不仅填补了…

07-02

学而思2026旗舰点映会：AI家教新方案亮相，T6系列学习机引领教育新潮流

07-02

点击查看更多 +

全站最新

石头科技6月30日融资动态：融资净卖出82.43万元融券净卖出1100股

上汽智己LS9 Hyper 7月16日登场，全线控转向+3秒级加速重塑大SUV体验

7月6日上市！福特探险者年度改款，细节升级主打家庭实用风

鑫源向上V6涪陵上市：6.98万起破局市场赋能创业加速“渝车出海”

开车省油有妙招！合理调节车内设置，一年轻松省下几百油费

鑫源向上V6：小众品牌切入货运刚需市场，能否扛住大牌冲击？

热门内容

本栏最新

地平线HSD V2.0开启最大规模OTA升级以双引擎驱动端到端智驾新进化

特斯拉23年：从电动跑车到AI现实，业务版图持续拓展未来可期

安波福慕尼黑上海电子展发力：发布创新技术，赋能汽车与多元工业新未来

学而思2026旗舰点映会：AI家教新方案亮相，T6系列学习机引领教育新潮流

邬贺铨：智能体融入工业互联网，发展脉络、机遇挑战与应对全解析

岚图泰山X8纯电版7月交付，配置拉满，30万级SUV市场激战将启

本网站LOGO小熊标志受版权保护，版权登记号：鲁作登字-2015-F-025467，未经ITBEAR比尔科技官方许可，严禁使用。
声明：本网站是公益性科普网站，为网友提供科技类资讯内容，无障碍技术由太阳湾捐增，为阅读障碍用户提供内容听读服务。如本站内容侵犯了您的权利，请通知我们及时删除。
中国（山东）自由贸易试验区鲁ICP备11015305号-1 联系入口
Copyright © 比尔科技 2007-2024 ITBEAR.COM.CN All rights reserved.