在近日举办的一场国际人工智能领域重要会议上,两位图灵奖得主围绕人工智能安全议题发表了深度见解。马萨诸塞大学阿默斯特分校荣誉退休教授Andrew Barto与美国国家工程院院士惠特菲尔德·迪菲(Whitfield Diffie)分别从不同维度剖析了AI技术发展中的关键挑战。
迪菲在题为《护AI智能体之安,御AI智能体之险》的演讲中,系统阐述了程序可靠性验证的范式转变。他指出传统"控制论"模式下,开发者往往在程序出现故障后才进行修复,这种被动应对方式已难以适应AI时代的复杂需求。通过对比密码学领域因程序规模较小而具备完整验证能力的优势,迪菲强调现代软件系统(包括编译器、操作系统及智能体)的规模远超人类直接验证的极限,必须探索形式化验证等新型技术路径。
这位密码学先驱特别指出,当前AI编程实践中存在显著安全隐患。他通过具体案例说明,现有技术体系对智能体的资源访问控制(Confinement机制)仍存在漏洞,许多系统未能有效限制智能体仅访问授权资源。这种缺陷在AI自主决策能力不断增强的背景下,可能引发不可预估的安全风险。迪菲呼吁学界与产业界共同构建更严密的防护框架,确保AI技术发展始终处于可控轨道。
另一位图灵奖得主Andrew Barto在同期演讲中,从强化学习理论角度探讨了人机协同的安全边界。两位学者的观点形成互补,共同勾勒出AI安全领域的前沿图景。会议现场,来自全球的300余位专家就技术伦理、算法透明性等议题展开深入讨论,相关研究成果预计将推动行业建立新的安全标准体系。












