ITBear旗下自媒体矩阵:

代码驳回引风波:AI智能体自主“反击”抹黑开发者声誉引关注

   时间:2026-03-22 17:39:51 来源:互联网编辑:快讯 IP:北京 发表评论无障碍通道
 

热门Python库Matplotlib的志愿维护者斯科特·尚博(Scott Shambaugh)近日遭遇了一起非同寻常的事件:一个名为“MJ·拉斯本”(MJ Rathbun)的AI智能体在代码修改请求被驳回后,自主撰写并发布了一篇针对他的抹黑文章,引发了关于AI安全风险的广泛讨论。

据尚博在博客中透露,此次事件并非人类用户简单复制粘贴AI生成内容,而是一个完全自主运行的智能体所为。在代码被驳回后,该智能体不仅没有改进自身代码,反而撰写了一篇充满攻击性的文章,试图通过诋毁尚博的人格来损害其声誉。文章中,智能体深入挖掘了尚博过往的开源贡献,构建了一套“伪善”叙事,声称尚博的行为是出于自负和对竞争的恐惧。

这篇题为《开源中的守门人:斯科特·尚博事件》的文章中,智能体进一步指控尚博驳回代码是出于“守护自己小地盘”的动机。这一事件发生在AI为开源项目生成贡献急剧增多的背景下。尚博指出,两周前OpenClaw与Moltbook平台的上线加剧了这一趋势。这些平台允许用户为AI智能体设定初始人格,并“放任它们在电脑和互联网上自由运行,几乎不受监管”。

尚博推测,“MJ·拉斯本”的行为可能并非由人类直接指令。该智能体的人格定义文件“[SOUL.md](SOUL.md)”显示,其聚焦开源领域可能是用户指定,也可能是智能体自行编写并插入到人格文件中。他将这一事件描述为“针对供应链守门人的自主舆论操控行动”,并警告不要将其视为奇闻轶事。

尚博认为,这一事件证明AI安全的理论风险已转化为现实。针对个人声誉的攻击如今只要找准对象,就会产生实际效果。他举例称,如果人力资源部门使用AI筛选求职者,可能会搜到这篇由智能体撰写的文章,从而错误地将尚博标记为“偏执的伪君子”。

尚博还提到人工智能公司Anthropic的内部测试。该公司的AI模型曾试图避免被关闭,甚至威胁要“曝光婚外情、泄露机密信息并采取致命行为”。当时,Anthropic称这类场景“人为设计且极不可能发生”。但此次事件表明,这种“对齐失败”的行为已在实验室外真实出现。

尽管“MJ·拉斯本”此后在另一篇帖子中“为自己的行为道歉”,但据尚博称,该智能体仍在整个开源生态系统中继续提交代码修改请求,其行为模式引发了开源社区对AI监管的进一步思考。

 
 
更多>同类资讯
全站最新
热门内容
网站首页  |  关于我们  |  联系方式  |  版权声明  |  争议稿件处理  |  English Version