近日,斯坦福大学研究团队在《Patterns》期刊发表了一项关于AI在书面文本中应用情况的研究报告。该研究对多个主流平台的英语文稿进行了系统性分析,发现大量文本存在AI生成的痕迹,表明大型语言模型已深度融入各类正式书面交流场景。
研究团队开发了一套名为“分布式LLM量化框架”的统计模型,通过分析语料库的语言特征分布,估算特定时间段内文本中AI生成内容的比例。不过,该模型目前仅适用于英语文本,因此研究结果仅反映英文材料中的AI特征占比,并不等同于整篇文章完全由AI创作。
在具体分析中,研究团队对去年68.7万条消费者投诉、53.7万篇企业新闻稿、3.04亿份招聘信息以及1.6万篇联合国新闻稿进行了详细考察。结果显示,约24%的企业新闻稿、18%的消费者投诉、14%的联合国新闻稿,以及近10%的招聘信息存在明显的AI生成或大幅改写痕迹。
进一步分析发现,AI在书面文本中的应用存在显著的地域和行业差异。在教育水平较低的地区,19.9%的投诉文本由AI撰写,高于教育水平较高地区的17.4%。在招聘信息方面,中小企业和初创公司更倾向于使用AI生成内容,约10%至15%的招聘公告包含明显的AI特征。
研究人员指出,随着生成式AI技术的持续发展,其文本风格与人类写作的差异越来越小,未来准确识别文本中AI的参与程度将面临更大挑战。这一趋势可能对文本创作的真实性和可信度产生深远影响。