版权作品能否成为大模型的免费“养料”?从《纽约时报》诉OpenAI案到国内的四位画师状告小红书案,这个话题长期争论不休。但中国版权集体管理组织对此已给出明确否定的态度。
2月11日,中国音乐著作权协会(下称“音著协”)发表声明称,生成式AI训练数据资源库的著作权作品利用,不属于著作权法意义上的特定使用情形,不符合判断是否属于合理使用的“三步检验法”,不应归于合理使用范畴。
著作权法上,合理使用制度旨在平衡版权方和使用者的利益,若符合法定情形,使用者可以不经著作权人许可,不向其支付报酬。音著协提到的合理使用“三步检验法”指的是:不得影响原作品的正常使用;不得不合理地损害版权人的合法权益;不得构成新作品的实质或核心部分,不能对原作品构成实质性替代或竞争关系。
音著协表示,目前的生成式AI技术开发,基本上是商业公司的商业行为,而且生成式AI技术下可以迅速生产出大量的文字、音乐、图片等,这显然会挤占人类创作者作品的传播空间,对其著作权益甚至相关产业的健康发展会产生完全可预见的严重损害。
音著协强调,如果将生成式AI利用著作权作品进行训练的行为视为合理使用行为,对人类创作者而言,将面临“失权+失酬”的严峻情况,这是显失公平且无法容忍的。“绝不能出现‘吃著作权人的饭、砸著作权人的锅’的事情”。
为解决版权人与大模型公司的利益冲突,音著协将视线投向著作权集体管理制度。音著协承认,生成式AI训练数据资源库使用来自全球范围的海量著作权作品,其开发公司一方面难以一一联系相关著作权人获得使用授权,另一方面担心著作权人主张的许可使用费超出其支付能力。
但音著协认为,著作权集体管理是解决海量作品使用与海量著作权人授权之间各种复杂问题的最有效制度工具。
在许可使用费上,音著协反驳了“支付使用费会给AI产业发展带来严重阻碍”的观点。其建议,著作权使用费的收取标准,完全可以在国家著作权主管部门、相关产业主管部门的指导下,由著作权集体管理组织与AI行业组织、有关平台或主要开发公司等基于公平合理原则协商确定。
音著协呼吁,应该在现行法和制度框架下,积极推动生成式AI产业与著作权集体管理组织之间尽早建立对话协商机制,尽早达成合作。
2024年12月4日,中国文字著作权协会(下称“文著协”)发表的一份倡议书也提到,生成式AI语料库建设、大模型训练和应用,应确保数据来源合法。使用版权作品,应当以取得权利人、内容生产者或著作权集体管理组织的授权许可和付酬为前提;未经授权使用构成侵权的,应当承担法律责任。
去年12月中旬南都啄木鸟数据治理论坛上,文著协常务副会长兼总干事张洪波进一步表示,通过集体管理,文著协可以帮助作品的权利人统一授权,从而避免版权问题引发的纠纷。尤其在AI使用受版权保护的数据时,文著协能够提供合法授权渠道,确保技术开发者在合规框架内使用版权内容。
不过,学界和业界亦有诸多声音赞同将AI数据训练纳入合理使用。其依据在于,如果采用传统的版权许可模式,会因版权成本高昂、磋商交易繁杂而抑制大模型公司的创新,甚至会变相激励大模型公司游走版权保护灰色边缘,等版权人诉讼再被动应付;而版权法定许可模式的缺陷依然明显,对大模型公司而言,承担的成本仍然高昂,而且还要求版权管理组织在当中付出较高的法定许可费管理成本。
北京大学法学院教授易继明在近期《中国版权》期刊一篇论文中分析称,AI语料训练对人类作品的使用展现出非特定性和非竞争性的特点。
具体来说,非特定性是指AI模型在训练过程中并不针对特定的单个作品进行使用,而会从海量的作品中广泛提取特征和规律,避免了对单个作品的过度依赖或者对特定作品的过度挖掘;非竞争性则体现在AI生成内容并不会直接替代或削弱原作品的市场价值。其生成内容往往具有独特性和创新性,与原作品形成差异化竞争,不会对原作品的市场价值造成过分的损害。基于这两个特点,易继明认为AI训练使用版权作品对作者利益影响有限,符合合理使用的精神。
采写:南都记者 杨柳