商业

AI的“记忆”难题：那些它无法忘却的小说

研究表明，大语言模型（LLM）对训练数据的记忆深度远超预期，这一发现再次引发了公众对版权侵权问题的质疑。

2026年2月23日阅读时间：6分钟

全球顶尖的AI模型如今可以通过特定提示，生成与畅销小说几乎一模一样的文字。这一现象让AI行业陷入了尴尬境地，因为他们此前一直坚称其系统并不会存储受版权保护的作品。

近期的一系列研究指出，来自 OpenAI、谷歌、Meta、Anthropic 以及 xAI 的大语言模型，其背后的数据记忆量远比人们想象的要庞大。

人工智能专家与法律界人士在接受《金融时报》采访时表示，这种“记忆”能力可能会对AI巨头们产生毁灭性打击。目前，这些公司正深陷全球数十起版权诉讼中，而他们的核心辩护理由是：LLM只是从版权作品中“学习”规律，而非“存储”副本。显然，这一研究结果直接动摇了该辩护的基础。

相关阅读