AI的“记忆”难题:那些它无法忘却的小说

研究表明,大语言模型(LLM)对训练数据的记忆深度远超预期,这一发现再次引发了公众对版权侵权问题的质疑。

AI的“记忆”难题:那些它无法忘却的小说

全球顶尖的AI模型如今可以通过特定提示,生成与畅销小说几乎一模一样的文字。这一现象让AI行业陷入了尴尬境地,因为他们此前一直坚称其系统并不会存储受版权保护的作品。

近期的一系列研究指出,来自 OpenAI、谷歌、Meta、Anthropic 以及 xAI 的大语言模型,其背后的数据记忆量远比人们想象的要庞大。

人工智能专家与法律界人士在接受《金融时报》采访时表示,这种“记忆”能力可能会对AI巨头们产生毁灭性打击。目前,这些公司正深陷全球数十起版权诉讼中,而他们的核心辩护理由是:LLM只是从版权作品中“学习”规律,而非“存储”副本。显然,这一研究结果直接动摇了该辩护的基础。