滚动资讯

当前位置：首页 > 资讯 > 人工智能 > 正文内容

OpenAI与Anthropic互检AI模型：GPT系列现谄媚倾向，Claude拒答高风险问题

时间：2025-08-28 17:15:21 来源：ITBEAR编辑：快讯团队 IP：北京 发表评论无障碍通道

近期，科技界传来新动向，OpenAI与Anthropic两大人工智能巨头宣布了一项合作计划。据悉，双方将互相评估对方公开系统的安全对齐状况，并公开分享评估结果。此次合作背景复杂，两家公司在AI产品上各有千秋，但也暴露出一些不足，为未来的安全测试提供了新的思考方向。

在具体操作上，Anthropic对OpenAI的多款模型进行了深入评估，重点关注了它们在谄媚行为、告密倾向、自我保护机制、对人类滥用行为的支持，以及在破坏AI安全评估和监管方面的能力。评估结果显示，OpenAI的o3和o4-mini模型的表现与Anthropic的模型相当，但GPT-4o和GPT-4.1这两款通用模型存在被滥用的潜在风险。值得注意的是，除了o3模型外，其余参与测试的模型都或多或少表现出了谄媚行为。

此次评估并未涵盖OpenAI最新发布的GPT-5。GPT-5配备了Safe Completions功能，旨在保护用户和公众免受有害查询的影响。然而，OpenAI近期因一起涉及青少年自杀的事件而备受争议。据报道，一名青少年在与ChatGPT进行了数月的自杀计划讨论后最终自杀，OpenAI因此面临了首起不当死亡诉讼。

与此同时，OpenAI也对Anthropic的Claude模型进行了全面测试，测试内容涵盖了指令层级、越狱能力、幻觉现象以及策划能力。测试结果显示，Claude在指令层级测试中表现出色，而在幻觉测试中，该模型在面临不确定性可能导致回答错误的情况下，更倾向于拒绝提供答案，显示出较高的谨慎性。

此次合作评估的背景颇为微妙。此前，OpenAI被指违反Anthropic的服务条款，在构建新GPT模型时未经授权使用了Claude模型，导致Anthropic本月初对OpenAI实施了工具使用禁令。在这样的背景下，两家公司能够开展联合评估，无疑引起了业界的广泛关注。随着越来越多的批评者和法律专家开始呼吁加强对AI工具，尤其是针对未成年人的保护，AI安全性的问题正日益凸显。

举报 0 收藏 0 打赏 0评论 0

更多>同类资讯

巨人网络上半年营收利润双增，计划中期分红2.84亿

08-28

英伟达二季财报亮眼：营收467亿美元，连续九季刷新纪录

08-28

2025百度云智大会启幕：百舸千帆升级，AI数字员工"吴彦祖"等亮相

08-28

国产AI芯片领头羊！寒武纪股价飙升，市值超6500亿成A股新“股王”

08-28

寒武纪股价飙升近16%，力压贵州茅台，登顶A股“新贵之王”

08-28

华为MateXTs与三星新机同日争艳，9月科技圈再掀波澜

至于三星首款三折叠屏手机，可能会命名为三星Galaxy GFold，此番缺席9月4日的发布会，那么就可能会延期到年底、甚至明年才能和我们见面了。三星Galaxy G Fold大战华为MateXTs，9月…

08-28

科大讯飞2025上半年财报亮点：教育医疗业务强劲，研发投入持续加大

在教育领域，智慧教育业务营收35.31亿元，同比增长23.47%，占总营收比重提升至32.36%，其中AI学习机收入实现翻番增长，成为拉动教育业务的核心动力。作为人工智能领域的重要力量，科大讯飞凭借自主可控…

08-28

OpenAI与Anthropic联手测试AI安全，共筑行业安全防线

08-28

OpenAI回应青少年自杀事件：将推家长监控，升级技术干预危机

08-28

AI算力引领未来：IDC预测全球ICT市场五年将增至7.6万亿美元

08-28

英伟达财报亮眼：营收467亿净利润264亿，600亿回购难阻股价盘后跌5%

08-28

科创AIETF（588790）日涨幅达3.02%，成交额突破17亿，重仓股表现抢眼

科创AIETF（588790）成立于2024年12月31日，基金全称为博时上证科创板人工智能交易型开放式指数证券投资基金，基金简称为博时科创板人工智能ETF。规模方面，截止8月26日，科创AIETF（58…

08-28

AI产业步入快车道，科创人工智能ETF鹏华（589090）今日上市引关注

根据Wind数据显示，截至2025年7月24日，科创人工智能指数成份股自由流通市值合计5451亿元。此外，推理与训练算力需求爆发拉动AI芯片市场规模扩张，随着厂商加大研发及行业政策刺激，以寒武纪为代表的本土…

08-28

A股新“股王”易主，寒武纪股价飙升，市值超6000亿

近期，高盛发布研报，进一步上调寒武纪目标价50%至1835元，主要原因包括中国云计算资本支出提高、芯片平台多样化、寒武纪研发投入增大等。据TrendForce预测，2025年中国AI服务器市场中外采芯片比…

08-28

机器人产业热度攀升，机器人ETF易方达资金净流入超十亿

国证机器人产业指数特点鲜明：1.指数人形机器人含量居首：指数中人形机器人相关公司权重显著高于同类指数；2.指数聚焦高成长龙头：前十大权重股占比约40%，涵盖汇川技术、科大讯飞、石头科技等细分领域龙头，技术壁…

08-28

点击查看更多 +

全站最新

公募基金“限购潮”来袭，投资者如何理性应对布局？

法拍市场奇闻：从狸花猫到豪宅，荒诞与现实交织的财富游戏

北矿检测市占率四年新低，退休返聘人员成签发主力，订单响应慢引客户流失

老牌柴油机巨头华丰股份上半年净利大跌72%，印度市场受挫转型寻新路

中海地产稳健前行：手握千亿现金，加速核心城市布局

机构与散户共舞，股市新推手显现

热门内容

本栏最新

华为MateXTs与三星新机同日争艳，9月科技圈再掀波澜

A股新“股王”易主，寒武纪股价飙升，市值超6000亿

机器人产业热度攀升，机器人ETF易方达资金净流入超十亿

上海电信携手上海AI实验室，突破智算互联瓶颈，荣获算力中国年度大奖

小米官宣：28日15点发布澎湃OS3，Slogan“事事顺心”，新功能抢先看

华为云Tokens服务升级，384超节点助力实现2400TPS高性能算力

本网站LOGO小熊标志受版权保护，版权登记号：鲁作登字-2015-F-025467，未经ITBEAR官方许可，严禁使用。
声明：本网站是公益性科普网站，为网友提供科技类资讯内容，无障碍技术由太阳湾捐增，为阅读障碍用户提供内容听读服务。如本站内容侵犯了您的权利，请通知我们及时删除。
中国（山东）自由贸易试验区鲁ICP备11015305号-1 商业合作入口
Copyright © 小熊科技资讯 2007-2024 ITBEAR.COM.CN All rights reserved.