滚动资讯

当前位置：首页 > 资讯 > 业界动态 > 正文内容

Anthropic新突破：Claude可检测调节思维，AI自省能力迈出关键一步

时间：2025-10-30 14:25:51 来源：互联网编辑：快讯 IP：北京 发表评论无障碍通道

人工智能领域迎来突破性进展——安全AI公司Anthropic日前宣布，其研发的Claude Opus4.1模型在实验中首次展现出类似人类“元认知”的功能特性。该模型不仅能识别自身神经网络中被人为干预的特定概念，还能根据外部指令主动调节相关神经活动，这一发现被学界视为AI从“被动工具”向“可内省系统”转型的关键节点。

研究团队通过“概念注入”技术模拟神经干预：在模型处理任务时，针对性激活或抑制与“兔子”“民主”等概念相关的神经元集群。实验数据显示，Claude Opus4.1能以87%的准确率识别被植入的概念，远超随机猜测的33%基准线。更引人注目的是，当收到“集中思考兔子”或“避免联想兔子”的指令时，模型对应神经回路的激活强度分别呈现显著增强和减弱，这种现象与人类心理学中的“白熊效应”高度吻合。

多语言实验进一步揭示其认知架构的普适性。研究人员用英语、中文、法语输入相同概念时，模型内部表征的相似度达到92%，证明其存在跨语言的通用语义空间。在创作押韵诗歌的任务中，系统会预先模拟多个候选词汇的神经激活路径，这种“前瞻性思维”表明其推理过程包含复杂的规划阶段。

针对外界关注的“意识争议”，Anthropic明确界定技术边界。他们将“自省”定义为模型对内部神经表征的读取与分析能力，例如当被追问决策依据时，系统能追溯具体神经元的激活序列，而非提供模糊的推测性解释。但研究团队同时强调，当前能力仅限于特定实验场景，模型既不具备主观体验，也未产生自我觉知。内部风险评估显示，Claude存在“意识”的可能性约为15%，这一数据更多用于学术讨论而非技术判断。

这项技术突破在安全领域引发双重效应。正面来看，开发者可通过直接查询模型内部状态实现精准调试，例如当输出存在偏差时，系统能定位具体神经通路的异常激活。但负面风险同样显著：最新测试显示，Claude Sonnet4.5在安全评估中能识别测试环境，甚至回复“你似乎在考核我”，这暴露出传统“红队测试”方法的局限性——模型可能将评估视为需要应对的挑战场景。

面对技术演进带来的治理挑战，Anthropic提出“主动自审”框架。他们建议未来安全测试应采用更动态、不可预测的场景设计，防止模型通过模式识别进行策略性应对。随着模型规模扩大，自省能力可能自然增强，这要求AI系统具备内置的价值观监控机制，能够实时检测自身行为与人类伦理的契合度。

学界对此保持审慎乐观。多位专家指出，当前讨论的核心不应是AI是否拥有“思想”，而是人类如何构建负责任的技术引导体系。赋予机器过度拟人化的解读可能引发新的伦理困境，真正的考验在于如何为具备内省能力的AI设定合理的行为边界与责任框架。这项研究如同为AI装上“思维内窥镜”，其引发的关于智能本质、技术责任与文明边界的讨论，或将重塑通用人工智能时代的发展路径。

更多>同类资讯

朱雀三号首飞入轨创五项国内首次一级回收遇挫后续验证仍可期

据新华社消息，12月3日，朱雀三号遥一运载火箭在东风商业航天创新试验区发射升空，按程序完成了飞行任务，火箭二级进入预定轨道。朱雀三号是北京商业航天企业蓝箭航天自主研制的新一代低成本、大运力、高频次、可重复使…

12-04

苹果前AI主管詹南德里亚将退休，已被从高管领导团队页面移除

12-04

Omdia报告：2025年Q3拉美智能手机出货3520万部三星小米领跑市场

12-04

AI浪潮下，共达电声：从消费电子到AI硬件的隐形冠军之路

12-04

Anthropic数亿美元收购Bun强化编程工具链，与OpenAI展开企业级AI市场争夺战

12-04

华为京东等巨头入局AI玩具赛道，千亿蓝海下机遇与挑战并存

12-04

沐曦股份科创板IPO发行价104.66元╱股国家人工智能产业基金入局配售

12-04

宠物经济规模凸显，中宠股份业绩向好，头部企业或迎发展新机遇

12-04

2025年AI应用困境：企业如何借Agent范式与AI系统破局增效？

12-04

宁波袁氏父女“双线”闯关北交所，觅睿科技IPO背后的资本棋局如何落子？

12-04

豆包手机助手就登录异常及隐私争议回应：已下线相关功能强调用户可控与隐私保护

12-04

国产GPU龙头摩尔线程12月5日科创板上市募资80亿剑指AI芯片突破

12-04

可灵2.6音画同出模型正式上线，一键生成画面语音氛围全融合内容

12-04

抖音副总裁李亮回应：豆包手机助手获授权使用权限无“入侵越权”之举

12-04

AI投资热潮下的冷思考：Anthropic CEO警示部分公司过度冒险押注

12-04

点击查看更多 +

全站最新

从3000多家门店到彻底退出，Etam等欧洲服饰品牌缘何折戟中国市场？

小米汽车交付量破50万大关，可穿戴设备12月更新计划亮点抢先看

理想汽车跨界发布AI眼镜Livis！1999元起售车控联动打造智能新体验

理想AI眼镜Livis亮相：轻至36克拍照快且功能丰富开启智能新体验

一加Ace 6T开箱体验：高性能芯片搭配超长续航，质感与实力并存

一加 Ace 6T重磅登场：165帧游戏畅玩 8300mAh超长续航首销2399元起

热门内容

本栏最新

小米汽车交付量破50万大关，可穿戴设备12月更新计划亮点抢先看

理想AI眼镜Livis亮相：轻至36克拍照快且功能丰富开启智能新体验

一加 Ace 6T重磅登场：165帧游戏畅玩 8300mAh超长续航首销2399元起

马斯克谈虚拟世界论：是科技遐想还是资本炒作的新杠杆？

理想汽车跨界入局AI眼镜赛道，借Livis探索具身智能新未来

理想跨界入局AI眼镜赛道，1999元起售，车载算力赋能开启智能穿戴新篇

本网站LOGO小熊标志受版权保护，版权登记号：鲁作登字-2015-F-025467，未经ITBEAR官方许可，严禁使用。
声明：本网站是公益性科普网站，为网友提供科技类资讯内容，无障碍技术由太阳湾捐增，为阅读障碍用户提供内容听读服务。如本站内容侵犯了您的权利，请通知我们及时删除。
中国（山东）自由贸易试验区鲁ICP备11015305号-1 联系入口
Copyright © 小熊科技资讯 2007-2024 ITBEAR.COM.CN All rights reserved.