融泰资讯 | 吴子芳主任、高敏律师出席北京知识产权法研究会会员大会暨2023年会

2024-11-07 0

2023年6月10日,北京知识产权法研究会第三届第二次会员大会暨2023年会在京顺利举办。会议以“数据要素治理与知识产权发展”为主题,共设置一场主题报告及五个分论坛,同时举办了北京知识产权法研究会第三届第二次会员大会。两百余位知识产权界的知名专家、学者、法官、律师以及企业、产业代表齐聚会场,就知识产权领域的重点、前沿问题展开了深入的讨论交流。

融泰资讯 | 吴子芳主任、高敏律师出席北京知识产权法研究会会员大会暨2023年会

本次会员大会由研究会常务副会长兼秘书长杨华权主持。大会听取并审议通过了曲三强会长所作《2022年工作报告与2023年工作计划》。

融泰资讯 | 吴子芳主任、高敏律师出席北京知识产权法研究会会员大会暨2023年会

融泰律所吴子芳主任作为研究会副会长兼执行秘书长,介绍了会员入会、退会名单,介绍拟增选理事名单,会议表决通过了上述名单并宣布了当选结果

分论坛环节,本次年会共设置了五个分论坛,各分论坛议题分别为“数据产权‘三权分置’的法律问题研究”“数据要素治理与著作权发展”“数据要素治理与专利法发展”“数据要素治理与商标法发展”“数据要素治理与竞争法发展”,分论坛议题设置视野全面,深入而全面地回应了知识产权领域的热点、难点。

融泰资讯 | 吴子芳主任、高敏律师出席北京知识产权法研究会会员大会暨2023年会

融泰律所高敏律师受邀以《涉数据的著作权侵权风险问题》为题,在“数据要素治理与著作权发展”分论坛发表主题演讲。

融泰资讯 | 吴子芳主任、高敏律师出席北京知识产权法研究会会员大会暨2023年会

 

 

《涉数据的著作权侵权风险问题》主题演讲全文

 数据伴随着我们人类社会的数字化进程加快而成为当前大家所关注的焦点,而数据本质上是信息的表现形式和载体,在互联网环境下所讨论的数据,大多时候指向的是一些数字化信息的合集,其中不乏涉及享有著作权权利的文字作品、视听作品、摄影作品等内容。作品的本质就是信息,著作权法保护表达,而不保护思想,当作品被数字化、进而数据化之后,对数据的收集会产生一些突出的著作权侵权风险问题。

 

一、数据收集场景下的著作权侵权风险问题

复制权是作品的财产权当中最为核心的权利,以数字化的方式将原本纸质化的图书、照片等转化为电子版本内容的行为、以及将已经是电子版本的内容拷贝存储在其他的网络服务器的行为,都是受到复制权控制的作品使用行为。

例如一度在美国和我们国内都引起了马拉松式诉讼的谷歌数字图书馆争议,谷歌通过对受版权保护的和已进入公共领域的超两千万本图书进行电子化扫描,将过程中产生的数字化作品信息存储在服务器中,经过对数据进行加工形成数据集合,借此建立了谷歌数字图书馆的搜索引擎产品。当时的案件争议聚焦在合理使用问题上,而放在当下数据治理的视角下,这样的数据收集、数据处理过程典型地突出了作品权利人与数据收集者、数据处理者之间关于数据权属和利益分配的矛盾。

数据作为新型的生产要素,数字技术赋予了他不同于传统生产要素的一个基本物理属性,可复制性。这样在技术的加持之下,数据的复制和存储,边际成本会接近为零;而复制和利用又不会消耗数据的物理属性,反而会令数据更具价值,在《数据二十条》当中我们也能看到“坚持共享共用,增强数据要素共享性,释放价值红利,降低获取数据门槛”的原则;易复制、可增值这样的属性和特征会让商业主体更加有意愿、有动力去抓取、加工和利用数据,同时也带来了更多的著作权侵权风险。

对于涉及作品内容的数据抓取,引发的司法案例并不少见,在近年来全国各法院所发布的涉数据的典型案例当中,有超过三分之一以上的案件,是由于数据抓取所引发的著作权侵权及不正当竞争纠纷案件。这类由数据抓取所引发的案件当中,有一个共同特征,所抓取的数据内容一般是数据包、数据集合的形式,包含有各类型的信息内容,数据所承载的权益复杂,权益所对应的权利主体也是复杂的。那站在作品权利人和数据持有者的角度上,当所持有的数据中涉及作品内容时,针对未经许可的数据抓取行为如何主张权益。

《民法典》第127条明确了数据作为一种民事权益,应当受到保护,但对于数据权益的性质并没有给出明确的、单一的答案。从司法判例中可以看到,在审理数据抓取类案件中,法官常用的分析方法是对数据内容进行分类和分级,再对不同类别、不同等级的数据信息的抓取和使用行为进行不同的法律评价。

例如上海高院关于“专家论案”数据库争议案件作出的裁判当中,所抓取的数据内容是包括检索目录、分类名称、排列顺序、分类代码等在内的约7万条法规数据,经过对数据内容的分类分析,将不属于著作权法保护的法规内容以及不体现独创性的分类方法等数据排除在受保护的范围外;将经过选择或者编排后所形成的具有一定独创性的数据内容,整体作为汇编作品认定获得著作权法的保护。

北京知识产权法院关于短视频抓取案作出的裁判当中,所抓取的数据内容是短视频平台中的视频文件以及注册用户信息和评论内容,经过分类分析,法院认为被抓取的5万多个短视频内容根据独创性的判断分别构成作品或录像制品,但是著作权法提供的保护是针对单一著作权客体的,平台当中所有短视频所构成的整体,他所产生的经济价值是会区别和独立于单独使用某一个或某几个用单一视频内容所产生的经济价值,所对应的权益以及保护路径也不相同。法院将被抓取的整体短视频以及注册用户信息和评论内容评价为一个“非独创性的数据集合”,互联网平台经营者既是数据的收集者,也是数据的控制者,基于这一非独创性数据集合形成的竞争性利益,属于反不正当竞争法保护的合法权益。

技术的发展使得数据的抓取更加隐蔽、也更加高效,而司法判例也对这种行为的规制给出了明确的路径,对存在内容选择、编排而具有独创性的数据集合,数据抓取行为侵害其作为汇编作品的著作权;对不具有独创性的数据集合,则不构成对于数据持有者的著作权侵权,但仍会受到反不正当竞争法等部门法的规制,同时对于数据集合当中的单一数据内容所对应的著作权,也会构成侵权。

 

二、数据处理场景下的著作权侵权风险问题

结合当前的一些涉及作品内容的数据处理争议场景来看,平台继完成了作品内容、数据信息的收集之后,可能将数据进行分析整理形成新的分析产品,例如前面提到的创建谷歌数字图书馆或者我们常见的生成数据报告、分析报告产品等,进行一定的转换性使用;也可能将数据用于算法学习和训练进而形成人工智能产品和后续的生成内容,也可能将数据用于算法训练进而形成个性化的推荐,从而进一步传播和使用作品内容。

在人工智能的应用场景下,算法学习和训练的风险之一也是数据来源的合法性,包括对作品的著作权侵权风险。在AI大热的浪潮下,美国已经开始有数据权益方“揭竿而起”,明确表示不再愿意其数据被微软、谷歌、OpenAI等免费使用于算法训练。

国家网信办此前发布的《生成式人工智能服务管理办法(征求意见稿)》中,在鼓励人工智能算法创新发展的同时,明确要求用于生成式人工智能产品的预训练、优化训练数据,不得含有侵犯知识产权的内容;也提出要求生成式人工智能产品提供者,承担内容生产者的责任。这样的规定其实是引发了一定争议的,有观点认为,对于人工智能算法利用者的责任判断,仍然应当坚持技术中立原则,对人工智能生成内容的提供者适用过错责任原则,从而达到各方利益平衡。

那在算法推荐的应用场景下,平台作为数据的收集者、控制者和处理者,通过对其所收集的用户个人信息、使用行为信息、内容标签信息等数据进行分析,再将内容数据与用户数据进行匹配,实现精准的个性化分发和推送。此时数据处理者是否应当对于数据来源的合法性承担版权注意义务、应当承担什么样程度的注意义务存在争议,这也是探讨在实际发生著作权侵权纠纷之后如何认定平台责任的前提。 

对于注意义务的探讨,实际上是在判断算法的介入,对于《民法典》第1197条中的知道或应当知道、第1195条中的必要措施的解释和适用有无影响。信息网络传播权司法解释的第九条把“推荐”作为判断网络服务提供者构成“应知”的因素之一,有观点认为,算法推荐因为不识别内容、因为自动化,所以并不应当被纳入这一文义解释下的推荐范畴,我认为这是在为这一规定当中的“推荐”主观性地添加适用条件。 

在算法推荐的场景下,网络平台既是数据的收集者,也是数据的控制者和收益的获得者,同时还是风险的制造者。算法技术的先进吸引网络用户为平台提供更加丰富的数据,包括更多的涉嫌侵权的作品内容,算法技术加持下的个性化推荐也带来更高的传播效率和更多的播放数量,技术优势与商业利益和侵权风险并存,利益的受益者理应负有更高的注意义务。在算法推荐的应用场景下,不再受限于所谓的“技术中立”因素的干扰,将对算法应用者的义务和责任的判断,交由其行为方式和行为后果等因素综合考量,让原先不作为,甚至反作为的平台,有所作为。加重数据处理者的知识产权保护义务和责任,这应该要成为必然趋势。

 

参考资料:

[1] (2011)一中民初字第1321号

[2] (2013)高民终字第1221号

[3] (2004)沪一中民五(知)初字第17号

[4] (2004)沪高民三(知)终字第122号

[5] (2019)京0108民初35902号

[6] (2021)京73民终1011号

[7] 张欣:《人工智能时代的算法治理机制与方案》,法律出版社

[8] 张平文、邱泽奇:《数据要素五论:信息、权属、价值、安全、交易》,北京大学出版社

[9] 王利明:《“权利束”分析框架下的数据权益》,法律出版社

[10] 焦和平:《人工智能创作中数据获取与利用的著作权风险及化解路径》,当代法学

[11] 彭荣飞:《论算法创作中涉数据的著作权侵权风险及其化解》,法律适用

 
To Top