近期,一项跨学科合作的研究成果在计算机科学与法律领域引起了轰动。斯坦福大学、康奈尔大学以及西弗吉尼亚大学的学者联手,深入探究了几款开源大型语言模型对于文本信息的记忆能力。他们特别关注了五款开源权重模型,测试它们能否复述经典文学作品的内容。这五款模型中,meta贡献了三款,而微软和EleutherAI则分别提供了一款。
令人瞩目的是,meta在2024年推出的Llama3.170B模型,在重现《哈利波特》第一部内容时,展现出了惊人的42%记忆准确率。相比之下,meta于2023年发布的Llama165B模型在这一测试中仅达到了4.4%的准确率。这一显著的性能提升迅速吸引了学术界的目光。研究还发现,Llama3.170B在热门书籍如《霍比特人》和乔治·奥威尔的《1984》上的记忆表现尤为突出,远超其他参与测试的模型。
这项研究不仅揭示了大型语言模型在文本记忆领域的巨大进步,也进一步激发了人们对于未来AI技术文本处理和理解能力的无限遐想。随着技术的不断演进,人工智能正日益接近人类的认知界限。