近期,中国科学技术大学团队提出了一种精准编辑大语言模型内知识的算法 AlphaEdit,为大模型的知识更新和管理提供了一种高效解决方案。
该算法的核心思想是在对模型进行知识更新时,将参数变化投影到原始知识的零空间上。这种方法理论上保证了在定向更新大模型内错误、过时和不安全知识时,模型的通用能力不会受到干扰。
值得关注的是,研究人员在主流编辑方法只加入一行代码,就实现了 Llama 3 在知识编辑任务表现性能提升 35%。
该方法具有普适性,可以应用于大多数常用的模型编辑算法,并且在论文中的测试结果中得到了验证。
审稿人之一对该论文评价称:“该研究有效解决了当前模型编辑中知识更新和保留间始终难以平衡的问题。”
图丨各类模型编辑方法在 Llama 3(8B)上的表现(来源:ICLR)
日前,相关论文以《AlphaEdit:基于零空间约束的语言模型知识编辑》(AlphaEdit: Null-Space Constrained Knowledge Editing for Language Models)为题发表在国际学习表征会议(ICLR 2025,International Conference on Learning Representations)上,并被遴选为 Oral Presentation(仅占投稿总数的 1.8%)。
中国科学技术大学博士生方俊峰和硕士生姜厚丞是共同第一作者,王翔教授和何向南教授担任共同通讯作者。
图丨相关论文(来源:ICLR)
该课题组发现,以往研究通常将“加入新知识”和“保留旧知识”这两个目标放在一起。目前,大多数研究范式通过调整优化目标中二者的参数来维持平衡。
但是,现有的平衡方式并不理想,往往会为了保证新知识的成功加入而牺牲一部分旧知识,进而影响模型的语言流畅性和逻辑性。这种权衡在频繁更新知识的情况下,容易导致模型崩溃。
图丨当前方法与 AlphaEdit 的范式对比(来源:ICLR)
为解决上述问题,他们大胆提出:是否可以打破这种限制,而是每一步只需要处理一件事呢?
研究人员在查阅大量数学文献和理论后,找到了经典数学概念——零空间。零空间理论能够在不破坏旧知识的情况下,完美地保留新知识,从而实现对模型的无损更新。
“虽然只加入一行代码听起来很简单,但它将原本算法目标的两部分简化为一部分,通过零空间投影矩阵将结果投影到原始知识的零空间中。这种简化使得它具有很强的泛化性,并且其适用于目前大部分基于定位的模型编辑算法。”方俊峰说。
图丨方俊峰(来源:方俊峰)
实验结果显示,AlphaEdit 在几乎所有指标和基础模型上都取得了优越的性能,特别是在效率和泛化能力上,与最佳基线方法相比,平均提升了 12.54% 和 16.78%。
此外,AlphaEdit 在文本生成的流畅性和连贯性方面也表现出显著的改进。在对编辑后的大模型进行的一般能力测试中,AlphaEdit 保持了模型的原始性能,在编辑了 3000 个样本后,平均保留了 98.48% 的模型一般能力。
值得关注的是,该方法对模型的语言输出流畅度几乎没有造成损害。方俊峰指出,“我们的方法是目前唯一能够在理论上彻底避免这种情况的解决方案。”
此外,研究人员还验证了该方法具有普适性,其在遗忘学习、持续学习、概念擦除、模型去偏和多模态安全等领域,都可实现简单且好用的效果。
图丨AlphaEdit 通过一行代码实现效果激增的过程(来源:ICLR)
模型编辑是大模型发展过程中非常重要的一环。随着模型架构的不断增大,其效果也在持续增强。未来随着算力的提升,可能会出现更大规模的模型架构。
然而,模型规模的增大也带来了新的挑战。尽管小模型可通过微调快速更新知识,但对大模型进行微调的难度将随着规模的增大而显著增加。因此,高效、精确的模型编辑在这种背景下显得尤为重要。
此外,在垂类大模型能力持续增强的发展趋势下,基础模型本身的迭代更新或被推迟,而模型编辑可以在官方更新缓慢的情况下,快速响应市场和用户的需求,保持模型的时效性和实用性。
尽管目前的模型编辑方法在理论方面不会对旧知识造成破坏,但实际操作中仍会存在一些近似误差,导致微小的破坏。
“此前,模型编辑由于破坏较为严重难以被工业界接受,可能几千次更新就会导致模型崩溃。但如今,我们已经将这种破坏降低了 1 个数量级,这使模型编辑的意义变得更加重大。”方俊峰说。
在接下来的研究阶段,该课题组首先计划将这项技术推广到更多国内外知名的大模型中,以验证其通用性和泛化性。
其次,他们计划探索将零空间应用于不同的垂直领域,例如安全防护或多模态生成,以在增强大模型安全性、提升特定能力的同时,确保原始存储知识的逻辑表达能力不受影响。
此外,研究人员还考虑利用零空间来增强大模型的某个特定能力,比如针对艺术、生化、数学等领域的模型,或定制化模型(如定制家教)。该团队认为,将这项技术应用于持续学习等深度学习领域,也是具有研究价值的方向之一。
参考资料:
1.https://openreview.net/forum?id=HvSytvg3Jh
2.https://github.com/jianghoucheng/AlphaEdit
运营/排版:何晨龙、刘雅坤