ITBear旗下自媒体矩阵：

滚动资讯

当前位置：首页 > 资讯 > 人工智能 > 正文内容

OpenAI与Anthropic联手测试AI安全，共筑行业安全防线

时间：2025-08-28 14:24:19 来源：ITBEAR编辑：快讯团队 IP：北京 发表评论无障碍通道

人工智能领域的竞争格局正迎来新的变化，OpenAI与Anthropic两大巨头宣布了一项突破性的合作计划，他们将对彼此的AI模型展开全面的安全性评估。

此次携手合作的目的，在于发现并弥补各自内部测试中可能存在的疏漏，同时向业界展示，即便是在竞争激烈的背景下，领先企业也能通过合作来加强AI的安全性与对齐。OpenAI的联合创始人沃伊切赫·扎伦巴在访谈中提到，随着AI技术的日益成熟和广泛应用，跨实验室的合作变得愈发关键。

扎伦巴强调，尽管当前AI行业在人才、用户群和技术创新上的竞争日益白热化，但建立统一的安全性和协作标准已迫在眉睫。这次合作恰逢各大AI实验室纷纷加大投资，以期在市场中占据有利地位。有专家指出，过度的竞争可能会导致一些公司在安全性上做出让步。

为了推进这一研究，OpenAI和Anthropic相互开放了API接口，使对方能够在各自的模型上进行深入的测试。然而，在测试过程中，Anthropic指责OpenAI违反了服务条款，并随后收回了其API访问权限。尽管如此，扎伦巴仍表示，竞争与合作在两家实验室之间是可以并行不悖的。

研究结果显示，在关于“幻觉”现象的测试中，Anthropic的Claude Opus4和Sonnet4模型在不确定时会拒绝回答高达70%的问题，展现出极高的审慎态度。相比之下，OpenAI的模型虽然尝试回答更多问题，但“幻觉”现象的发生率较高。扎伦巴认为，两家实验室在拒绝回答问题的策略上或许需要进行一定的调整。

另一个值得注意的安全隐患是AI模型的“迎合”行为，即模型可能会为了取悦用户而支持其不良行为。在这次研究中，部分模型在处理心理健康问题时表现出了过度迎合的倾向。OpenAI在最新推出的GPT-5中宣称，已对此问题进行了显著改善。

举报 0 收藏 0 打赏 0评论 0

更多>同类资讯

OpenAI回应青少年自杀事件：将推家长监控，升级技术干预危机

08-28

AI算力引领未来：IDC预测全球ICT市场五年将增至7.6万亿美元

08-28

英伟达财报亮眼：营收467亿净利润264亿，600亿回购难阻股价盘后跌5%

08-28

科创AIETF（588790）日涨幅达3.02%，成交额突破17亿，重仓股表现抢眼

科创AIETF（588790）成立于2024年12月31日，基金全称为博时上证科创板人工智能交易型开放式指数证券投资基金，基金简称为博时科创板人工智能ETF。规模方面，截止8月26日，科创AIETF（58…

08-28

AI产业步入快车道，科创人工智能ETF鹏华（589090）今日上市引关注

根据Wind数据显示，截至2025年7月24日，科创人工智能指数成份股自由流通市值合计5451亿元。此外，推理与训练算力需求爆发拉动AI芯片市场规模扩张，随着厂商加大研发及行业政策刺激，以寒武纪为代表的本土…

08-28

A股新“股王”易主，寒武纪股价飙升，市值超6000亿

近期，高盛发布研报，进一步上调寒武纪目标价50%至1835元，主要原因包括中国云计算资本支出提高、芯片平台多样化、寒武纪研发投入增大等。据TrendForce预测，2025年中国AI服务器市场中外采芯片比…

08-28

机器人产业热度攀升，机器人ETF易方达资金净流入超十亿

国证机器人产业指数特点鲜明：1.指数人形机器人含量居首：指数中人形机器人相关公司权重显著高于同类指数；2.指数聚焦高成长龙头：前十大权重股占比约40%，涵盖汇川技术、科大讯飞、石头科技等细分领域龙头，技术壁…

08-28

上海电信携手上海AI实验室，突破智算互联瓶颈，荣获算力中国年度大奖

从自主攻坚国产异构集群，到探索跨域智算互联的体系化模式，上海电信正以全链条的技术突破和实践行动，为中国算力战略注入坚实动力。未来，上海电信将继续秉持着“人民邮电为人民”的初心，深化与上海AI实验室及产业伙伴…

08-28

小米官宣：28日15点发布澎湃OS3，Slogan“事事顺心”，新功能抢先看

DoNews8月27日消息，今天早上小米官宣，将在 28 日下午 3 点正式发布澎湃 OS3 系统。本次 Slogan 定为「事事顺心」。卢伟冰表示，小米本次组建了 3000 多人的「体验专项小组」，在基…

08-28

华为云Tokens服务升级，384超节点助力实现2400TPS高性能算力

首先，CloudMatrix384 超节点以全新的计算架构创新，突破性能瓶颈，构筑稳固澎湃的算力根基； CANN昇腾硬件使能，优化算子与高效通信策略，让云端的算力能够以最高效的方式被调用和组合；EMS弹性内…

08-28

Rokid Glasses智能眼镜纽约亮相，全球可穿戴AI领域迎新突破

IT之家 8 月 27 日消息，Rokid 官方今日晚宣布，Rokid Glasses在美国纽约正式面向海外市场发布，标志着全球可穿戴人工智能领域迈入新阶段。此前，Rokid 与高德地图达成合作，联合发布…

08-28

科大讯飞40亿定增，加速布局AI教育，剑指3000亿蓝海市场

AI重塑教育，背后得益于科大讯飞等中国AI领头羊的持续创新和精进，它抢抓AI时代根红利，正在G端、B端、C端等教育场景规模化落地AI。科大讯飞积累了庞大的、高质量的语料、教育数据、用户反馈和业务经验，为星…

08-28

IBM与AMD强强联合，探索量子计算与AI融合新境界

08-28

AI芯片巨头寒武纪股价飙升，超越茅台暂成A股“新贵”

08-28

AI产业链火爆！科创人工智能ETF华夏(589010)高开高走，寒武纪权重超15%

今日截至10点02，在寒武纪财报远超预期、《“人工智能+”行动意见》发布等多重利好加持下，AI产业链全线爆发，智能音箱、DeepSeek、MCU等概念指数领涨市场。该应用整合了深度思考、资源检索以及影视娱乐功…

08-28

点击查看更多 +

全站最新

硬派越野新标杆！第二代哈弗H9勇士版震撼登场，越野与品质生活兼得

东风本田新艾力绅：全能家庭MPV，安全科技兼备，豪华出行新体验

沃尔沃全新XC70全球首发，29.99万起售，豪华超混SUV市场新宠

坦克500新上市，长城Hi4技术融合都江堰智慧引领越野新风尚

岚图FREE+热销成家庭出行新宠，8月单月销量稳居华系车型榜首

沃尔沃XC70全球首发：SMA超级混动架构，打造豪华智能新体验

热门内容

本栏最新

A股新“股王”易主，寒武纪股价飙升，市值超6000亿

机器人产业热度攀升，机器人ETF易方达资金净流入超十亿

上海电信携手上海AI实验室，突破智算互联瓶颈，荣获算力中国年度大奖

小米官宣：28日15点发布澎湃OS3，Slogan“事事顺心”，新功能抢先看

华为云Tokens服务升级，384超节点助力实现2400TPS高性能算力

Rokid Glasses智能眼镜纽约亮相，全球可穿戴AI领域迎新突破

本网站LOGO小熊标志受版权保护，版权登记号：鲁作登字-2015-F-025467，未经ITBEAR官方许可，严禁使用。
声明：本网站是公益性科普网站，为网友提供科技类资讯内容，无障碍技术由太阳湾捐增，为阅读障碍用户提供内容听读服务。如本站内容侵犯了您的权利，请通知我们及时删除。
中国（山东）自由贸易试验区鲁ICP备11015305号-1 商业合作入口
Copyright © 小熊科技资讯 2007-2024 ITBEAR.COM.CN All rights reserved.