针对生成式AI内容安全引发的外界讨论,哩布哩布AI于近日发布专项说明,表示已完成技术层面的全面排查与整改。此次自查重点针对复杂提示词交互场景,发现原有审核机制在极端组合情况下存在识别盲区,导致少量生成内容偏离平台规范标准。目前技术团队已修复相关漏洞,并通过算法优化将内容安全阈值提升至新水平。
据企业技术负责人透露,本次整改涉及多维度策略升级:一方面强化了提示词解析模型的语义理解能力,另一方面构建了动态风险评估体系,对可能触发违规内容的组合模式进行实时监测。经压力测试验证,新系统对边界场景的识别准确率提升至98.7%,较整改前提高23个百分点。
行业观察人士指出,随着AI生成技术的迭代,提示词工程已成为内容治理的关键战场。各平台正通过建立攻防演练机制、完善安全评估标准等方式构建防护体系,哩布哩布此次的技术升级具有行业示范意义。数据显示,近三个月该平台用户日均生成内容量突破2亿条,复杂交互场景的治理难度呈指数级增长。
在监管协作层面,企业已建立常态化沟通机制,定期向主管部门报送技术安全报告。合规部门负责人表示,将根据最新监管要求持续优化治理框架,在用户协议更新、年龄分级系统、内容溯源机制等方面推进落地,确保平台运营始终处于合规轨道。
尽管面临安全治理挑战,哩布哩布AI仍保持业务增长态势。最新运营数据显示,其核心产品月活跃用户数环比增长15%,创作者社区规模突破800万。企业宣布将年度研发投入的35%专项用于内容安全建设,通过引入多模态审核技术、建设用户举报快速响应通道等措施,构建技术防护与社区共治相结合的治理生态。









