殷某桢诉北京某智能科技公司等人格权纠纷案
——经人工智能技术处理的声音受声音权益保护的认定
入库编号2025-07-2-474-001
关键词 民事 人格权 声音保护 声音权益 AI生成声音 可识别性 利益衡量
基本案情
原告殷某桢系配音演员,2023年5月,殷某桢发现他人利用其配音制作的作品在多个知名APP广泛流传。经声音筛选和溯源,发现上述作品中的声音来自于被告一北京某智能科技公司运营平台中的文本转语音产品。法院经审理查明,2019年,殷某桢曾接受被告二某(北京)文化传媒公司(以下简称某文化公司)的委托录制录音制品,被告二某文化公司为录音制品的著作权人。2019年5月10日,被告二某文化公司与被告三某软件(中国)有限公司(以下简称某软件公司)签订《数据授权使用协议》,约定被告二某文化公司将包括殷某桢案涉录音制品在内的录音数据提供给被告三某软件公司,被告二某文化公司向被告三某软件公司提供了非由殷某桢本人签字的《数据授权书》。被告三某软件公司仅以殷某桢录制的一部录音制品作为素材,采用人工智能等技术进行处理,生成了案涉文本转语音产品,并在被告四上海某网络科技公司运营的云服务平台对外出售。被告一北京某智能科技公司与被告五北京某科技发展公司签订在线服务买卖合同,由被告五北京某科技发展公司向被告三某软件公司下单采购,其中包括了案涉文本转语音产品。被告一北京某智能科技公司采取应用程序接口形式,在未经技术处理的情况下,直接调取并生成文本转语音产品在其平台中使用。平台显示案涉声音播放量为3256728530次。
殷某桢诉称,被诉行为已经严重侵犯其声音权益,请求法院判令被告一北京某智能科技公司、被告三某软件公司立即停止侵权、赔礼道歉,五被告应当赔偿殷某桢经济损失人民币500000元(币种下同)、精神损失100000元。一审审理过程中,被告一北京某智能科技公司、被告三某软件公司下架了案涉文本转语音产品。
一审庭审中,经当庭勘验,现场使用案涉文本转语音产品进行文本转语音的操作,获得的AI声音与殷某桢的音色、语调、发音风格等具有高度一致性。
北京互联网法院于2024年4月23日作出(2023)京0491民初12142号民事判决:一、被告北京某智能科技有限公司、被告某软件(中国)有限公司自本判决生效之日起七日内,向原告殷某桢书面赔礼道歉;二、被告某(北京)文化传媒有限公司、被告某软件(中国)有限公司连带赔偿原告殷某桢经济损失人民币250000元;三、驳回原告殷某桢其他诉讼请求。宣判后,双方当事人未提出上诉,判决已发生法律效力。
裁判理由
本案争议焦点主要有三:一是殷某桢声音权益的保护范围是否包括经人工智能处理的声音;二是案涉对殷某桢声音的使用是否取得合法授权;三是被诉行为是否构成侵权,以及如构成侵权,应承担何种法律责任。
其一,殷某桢声音权益保护范围涵括由人工智能合成的声音。《中华人民共和国民法典》第一千零二十三条第二款规定:“对自然人声音的保护,参照适用肖像权保护的有关规定。”据此,对于声音权益的保护,参照肖像权保护的有关规定,以具有可识别性作为法律保护的前提条件。自然人声音的可识别性是指在他人反复多次或长期聆听的基础上,通过该声音特征能识别出特定自然人。而经人工智能技术处理后的声音是否落入自然人声音权益的保护范围,关键在于通过该声音是否仍能识别出该特定自然人。利用人工智能合成的声音,如果能使一般社会公众或者相关领域的公众根据其音色、语调和发音风格,关联到该自然人,则可以认定为具有可识别性。本案中,因被告三某软件公司系仅使用殷某桢个人声音开发案涉文本转语音产品,而且经当庭勘验,该AI声音与殷某桢的音色、语调、发音风格等具有高度一致性,能够引起一般人产生与殷某桢有关的思想或感情活动,能够将该声音联系到殷某桢本人,进而识别出殷某桢的主体身份。因此,案涉AI声音属于殷某桢声音权益的保护范围。
其二,案涉对殷某桢声音的使用是否取得合法授权。被告二某文化公司对录音制品享有著作权等权利,但不包括授权他人对殷某桢声音进行AI化使用的权利。根据已查明事实,《数据授权书》并非殷某桢本人签署,因此,被告二与被告三某软件公司签订协议,在未经殷某桢本人知情同意的情况下,授权被告三某软件公司AI化使用原告声音的行为无合法权利来源。因此,被告二、被告三的被诉使用行为未获得殷某桢的合法授权。
其三,五被告的被诉行为构成对殷某桢声音权益的侵害,应当承担相应的法律责任。被告二某文化公司、被告三某软件公司未经殷某桢许可AI化并使用了案涉声音,构成对殷某桢声音权益的侵犯,其侵权行为造成了殷某桢声音权益受损的后果,依法承担赔偿损失的法律责任。被告一北京某智能科技公司、被告四上海某网络科技公司、被告五北京某科技发展公司主观上不存在过错,不承担损害赔偿责任。对于殷某桢请求被告一北京某智能科技公司、被告三某软件公司书面赔礼道歉依法予以支持。此外,殷某桢并未举证证明被诉侵权行为给其精神利益造成严重损害,因此,对其精神损害赔偿请求不予支持。
裁判要旨
对于人工智能技术处理后的声音,一般社会公众或者一定范围内的公众根据音色、语调和发音风格,能够识别出特定自然人的,则该声音属于自然人声音权益的保护范围。未经自然人许可使用经人工智能技术处理的声音,构成对自然人声音权益的侵权。
关联索引
《中华人民共和国民法典》第995条、第1000条、第1019条、第1023条
一审:北京互联网法院(2023)京0491民初12142号民事判决书(2024年4月23日)
来源:人民法院报 ·8版
责任编辑:刘强|联系电话:(010)67550722丨电子信箱:zxzh@rmfyb.cn
新媒体编辑:逯璐