滚动资讯

当前位置：首页 > 资讯 > 人工智能 > 正文内容

OpenAI发布GeneBench-Pro基准测试：聚焦AI真实科研场景下的生物学计算能力评估

时间：2026-07-02 07:38:15 来源：ITBEAR编辑：快讯 IP：北京 发表评论无障碍通道

OpenAI 近日正式发布了一项名为 GeneBench-Pro 的新型基准测试工具，旨在全面评估人工智能模型在生物学研究领域的实际应用能力。这一测试框架突破了传统评估方式对知识记忆和固定流程的依赖，转而聚焦于模型在复杂科研场景中的问题解决能力，特别是在面对不完整、模糊甚至存在干扰的数据时，能否独立完成分析并形成支持决策的研究结论。

该测试体系覆盖基因组学、定量生物学、转化医学等核心领域，通过129道精心设计的题目构建起多维评估矩阵。题目分布于10个主要研究方向和21个细分领域，涉及统计遗传学、蛋白质组学、功能基因组学等前沿方向。每道测试题均包含接近真实科研场景的数据集、简明的实验背景说明以及与决策相关的核心问题，要求模型自主完成数据探索、方法选择和策略调整的全流程研究。

为解决传统评估中存在的评分偏差问题，研发团队创新性地采用合成数据作为测试基础。这种设计使得研究人员能够完全掌控数据生成机制和底层因果关系，从而精准区分模型是真正理解问题本质，还是通过统计捷径获得正确答案。相较于使用历史真实数据时可能出现的多路径合理分析现象，合成数据方案显著提升了评估结果的可靠性。

目前，OpenAI已在Hugging Face平台开放10道代表性示例题，配备交互式操作界面供科研人员体验。后续将通过Artificial Analysis平台开放50道测试题进行第三方独立评估，全面验证不同AI模型在该基准测试中的实际表现。这项创新工具的推出，为评估AI在生命科学领域的研究潜力提供了新的量化标准。

07-02

Figure03机器人入驻宝马美国工厂，执行真实物流工作

07-02

DeepSeek新招DSpark：不拼模型拼速度，推理成本优化新路径来了

07-02

OpenAI发布GeneBench-Pro基准测试：聚焦AI真实科研场景下的生物学计算评估

07-02

2026WAIC“AI创新者思享汇”：从共生到协同，共绘人机关系新蓝图

07-02

孙周兴复旦演讲：探寻AI无法触及之地，不可数字化哥德尔信息成关键

07-02

国产算力新突破！海光信息携手同济大学，AI4E千卡集群助力工程智能升级

【环球网科技报道记者李文瑶】6月25日，上海同济大学，海光信息与同济大学正式签署战略合作协议，挂牌成立全国首个“高校海光算力优化中心”，共建国内首个国产千卡工科智算集群。此次千卡集群的落地，不仅填补了…

07-02

学而思2026旗舰点映会：AI家教新方案亮相，T6系列学习机引领教育新潮流

07-02

优必选CEO预测：未来机器人将主导工作，20余款超仿生人形机器人亮相

07-02

米哈游于上海新设舒俱科技公司注册资本千万聚焦多领域开发

07-02

松下押注AI领域！官宣5000亿日元投资，目标AI基建销售额达1.4万亿日元

07-02

Figure 03进驻宝马工厂：以创新技术解锁物流新场景，赋能汽车生产新未来

07-02

优必选发布全球首款全尺寸超仿生人形机器人U1系列盘中股价涨超17%

上证报中国证券网讯（记者何治民杨子晏）6月30日午后，优必选震荡拉升，截至14时22分，该股涨17.51%，报112.4港元/股。消息面上，6月30日下午，优必选发布全球首款全尺寸超仿生人形机器人U1系…

07-02

英伟达中国大规模招揽机器人人才，具身智能领域高薪“抢人”进行时

具身智能团队开放岗位最多，共6个职位；仿真方向开放4个岗位；部署方向同样设4个岗位；解决方案架构方向设2个岗位，负责向各行业输出英伟达技术方案。目标是打造机器人领域的安卓生态，覆盖工业机械臂、四足与人形机器…

07-02

超仿生人形机器人：99%的完美背后，那1%的人性为何无法复制？

跟进厂干活的工业级人形机器人不一样，它走的是情感陪伴赛道：但那时候，它就是个完美恋人了吗？机器人越像人，越暴露它永远缺的那1%。但它永远无法拥有鲜活的人性。现在的工业制造、AI 算法、精密加工，已经强大…

07-02

点击查看更多 +

全站最新

字节Seed团队新论文：DanceOPD破解AI生图多能力融合难题

97年复旦博士孙天祥加入百度任基础模型研发部负责人学术产业双契合

2026年三款AI智能降噪助听器深度测评：精准匹配需求，开启清晰聆听新体验

全新一代天工08预售开启！17.98万起，家庭高品质纯电生活轻松享

鑫源向上V6：小众品牌打造刚需神车，能否在巨头夹击中突围？

新款红旗天工08 670 Max预售开启限时优惠+多项权益智能豪华新选择

热门内容

本栏最新

学而思2026旗舰点映会：AI家教新方案亮相，T6系列学习机引领教育新潮流

邬贺铨：智能体融入工业互联网，发展脉络、机遇挑战与应对全解析

岚图泰山X8纯电版7月交付，配置拉满，30万级SUV市场激战将启

iCAR V27首轮大规模OTA升级来袭智能驾驶等140余项功能焕新升级

iCAR V27首轮大规模OTA升级来袭智能驾驶安全座舱全面焕新升级

缤果PRO上市月余车主反馈：好看好开又实用，城市代步新选择

本网站LOGO小熊标志受版权保护，版权登记号：鲁作登字-2015-F-025467，未经ITBEAR比尔科技官方许可，严禁使用。
声明：本网站是公益性科普网站，为网友提供科技类资讯内容，无障碍技术由太阳湾捐增，为阅读障碍用户提供内容听读服务。如本站内容侵犯了您的权利，请通知我们及时删除。
中国（山东）自由贸易试验区鲁ICP备11015305号-1 联系入口
Copyright © 比尔科技 2007-2024 ITBEAR.COM.CN All rights reserved.