根据斯坦福大学研究团队在 Cell Press 旗下期刊《Patterns》上发布的最新报告,大型语言模型(LLM)已在各类正式书面沟通场景中被广泛应用。该研究分析了 Newswire、PRWeb 和 PRNewswire 等各大平台的英文文稿,发现其中有大量文稿带有明显的 AI 痕迹


研究团队采用了一套名为“分布式 LLM 量化框架(Distributional LLM Quantification Framework)”的统计模型,通过分析语料整体的语言特征分布,估算出特定时间段内具备 AI 生成特征的文本比例。需要注意的是,该方法目前仅适用于英文语料,因此其结果反映的仅是英文文本中具备 AI 特征的比例,并不意味着整篇文章“完全由 AI 撰写”。

报告数据显示,研究团队分析了去年共计 68.7万条消费者投诉、53.7万篇企业新闻稿、3.04亿份招聘信息以及1.6万篇联合国新闻稿,结果令人关注:

  • 企业新闻稿: 约 24% 的文稿带有 AI 痕迹。

  • 消费者投诉: 约 18% 的投诉文本具备 AI 特征。

  • 联合国新闻稿: 约 14% 的内容被认定为“几乎由 AI 大模型直接生成,或经过大幅改写”。

  • 招聘信息: 接近 10% 的招聘内容带有 AI 痕迹。

研究人员指出,LLM 已深入渗透社会各领域的正式文本写作,并逐渐成为人们日常书面表达的重要辅助工具。在细分领域,研究发现 教育程度较低的地区使用 AI 撰写投诉的比例高达 19.9%,明显高于教育程度较高地区的17.4%。在招聘信息方面,中小型企业或初创公司更倾向于使用大模型生成内容,其中约有 10% 至15% 的招聘公告包含明显的 AI 痕迹。

研究人员同时强调,随着生成式 AI 技术的不断进步,其文风正日益接近人类。因此,未来要精确识别 AI 在文本创作中的参与程度将变得愈发困难。