ITBear旗下自媒体矩阵:

AI浏览器兴起带来新挑战:南洋理工研发WebCloak破解Web Agent安全困局

   时间:2025-11-03 01:32:09 来源:互联网编辑:快讯 IP:北京 发表评论无障碍通道
 

随着AI浏览器市场竞争加剧,以OpenAI Atlas为代表的新一代产品凭借自然语言驱动的网页自动化功能引发关注,但同时也催生了新型网络安全威胁。由南洋理工大学牵头,联合香港理工大学、夏玛诺阿分校共同研发的WebCloak防御系统,通过创新性的网页结构与语义混淆技术,为数据安全构建起轻量化防护屏障。

研究团队发现,当前主流Web Agent均采用"解析-理解"双层工作流:首先通过工具压缩网页结构至千级token量级,再由大语言模型提取目标数据。这种技术范式虽提升自动化效率,却形成三大安全隐患:模拟真实浏览器环境绕过IP审查、破解验证码成功率攀升、防御系统计算成本过高。更严峻的是,LLM技术已将爬虫开发门槛降至冰点——新手使用Gemini-2.5-Pro生成脚本仅需1.5分钟,效果优于31分钟完成的专家方案。

针对这一技术漏洞,WebCloak构建了双层防御体系。在结构层面,系统通过加密随机生成器动态修改HTML标签,每次用户会话生成独特结构,同时植入标准格式的蜜罐地址。配套的客户端脚本能在0.052秒内完成视觉还原,通过Shadow DOM技术隐藏真实资源地址,确保人类用户无感知浏览。该机制已实现对图片、文本、音频等多类型资产的统一防护。

语义防御层面,系统采用"精准注入-对抗优化"策略。防御模型在目标元素前后及属性位置插入三类误导线索:包括伪造的API验证提示、安全策略触发语句和虚假解密指引。这些经过GPT-4o-mini生成与GPT-4验证的语义陷阱,与网页上下文深度融合,手动清除成本高昂。实验显示,即使攻击者删除90%的误导信息,主流Web Agent的爬虫召回率仍被压制在21.2%以下。

基于自建的LLMCrawlBench基准数据集(覆盖50个热门网站的237个网页快照),测试结果表明该系统对三类主流Web Agent实现完全阻断:Gemini-2.5-pro(L2S)、Crawl4AI(LNC)、Browser-Use(LWA)的爬虫召回率从平均88.7%降至零。面对已知防御机制的自适应攻击,L2S和LNC的突破成功率分别仅有0.3%和1.58%。系统性能开销控制出色,服务器端配置生成仅需3分钟/页,客户端还原延迟0.052秒,页面体积增幅20.8%。用户盲测显示,91%的参与者未察觉浏览体验变化,视觉相似度评估达99.9%。

这项突破性技术已实现全平台兼容,支持Chrome、Firefox等主流浏览器及Windows、macOS等操作系统,特别适用于电商平台、内容创作等数据敏感场景。研究团队已公开项目主页与论文链接,并提供完整代码库。当前系统版本通过动态混淆逻辑优化,已具备应对未来Web Agent技术演进的基础能力。

 
 
更多>同类资讯
全站最新
热门内容
网站首页  |  关于我们  |  联系方式  |  版权声明  |  争议稿件处理  |  English Version