论大数据和人工智能的知识产权法律保护

摘要: 随着智能信息技术的不断发展，大数据产业为人类创造出了新的经济利益和商业价值，但也呈现出数据日益庞大、类型愈加复杂的趋势。2015年9月，国务院印发了《促进大数据发展行动纲要》，力图全面推进大数据的发展和应 ...

文 | 贵州省高级人民法院张德昌蒋炜

贵州省黔东南州中级人民法院刘万能章杰

随着智能信息技术的不断发展，大数据产业为人类创造出了新的经济利益和商业价值，但也呈现出数据日益庞大、类型愈加复杂的趋势。2015年9月，国务院印发了《促进大数据发展行动纲要》，力图全面推进大数据的发展和应用，将我国建设成为数据强国。目前，我国的大数据和人工智能在快速发展的同时，面临着一系列知识产权法律保护的问题。本文试图研究大数据和人工智能遇到的知识产权法律保护问题，并提出一些行之有效的措施和建议，以有效地保护大数据和人工智能的知识产权，促进大数据产业和人工智能更好更快地发展。

大数据和人工智能的内涵

（一）大数据的概念

“大数据”这个名词最早出现于《第三次浪潮》一书中，该书的作者阿尔文·托夫勒称之为“第三次浪潮的华彩乐章”。美国咨询公司麦肯锡全球研究所（MGI）在其报告中认为“大数据”是指无法在一定时间内用传统数据库软件工具对之进行抓取、管理和处理的数据集合。中国计算机学会大数据专家委员会委员赵国栋认为，大数据是在多样或者大量数据中迅速获取信息的能力。目前学界对大数据的概念莫衷一是，笔者倾向于《贵州省大数据发展应用促进条例》对大数据所下的定义，即“本条例所称大数据，是指以容量大、类型多、存取速度快、应用价值高为主要特征的数据集合，是对数量巨大、来源分散、格式多样的数据进行采集、存储和关联分析，发现新知识、创造新价值、提升新能力的新一代信息技术和服务业态”。

（二）人工智能的概念

“人工智能”一词由美国科学家麦卡锡在1956年首次提出后，国内外对人工智能的定义并未达成共识。人工智能促进协会将人工智能定义为“对思想和智能行为的基础机制的科学理解及其在机器中的体现”。计算机科学教授亚伦·所罗门认为，“人工智能是与科技和工程密切相关的跨学科领域，其科技部分试图给人类、动物、信息处理机器以及机器人提供各种各样的智能要求和可行的机制，其工程部分试图将这些知识应用于设计实用的新型机器，并帮助我们更有效地处理天然的智力活动”。笔者将人工智能定义为：研究人类智能活动的规律，模拟、扩展、延伸人的智能的科学技术。

大数据和人工智能的特征

（一）大数据的特征

体量大（Volume）。大数据的首要特征体现为大，即由许多数据汇集而成。随着科技的进步，数据的存储单位从过去的GB到TB，乃至现在的PB、EB级别。

多样性（Variety）。当今世界，数据的来源十分广泛，这决定了大数据的形式具有多样性，大数据的形式表现为视频、图片、网络日志、地理位置信息等。

价值性（Value）。大数据的核心特征是价值性。在现实生活中，有价值的数据比较少。大数据的价值在于从大量的数据中，挖掘出有价值的数据，并进行深度分析，从而发现一些新规律，获取一些新知识，并运用于各个领域，最终达到提升社会治理水平、提高生产力的效果。

高速性（Velocity）。与传统数据不同的是，大数据的产生和处理速度更快，难以用传统数据库的处理模式进行收集、管理、存储。大数据对处理速度的要求非常严格，服务器中大量的资源用于处理和计算数据，许多平台都需要做到实时分析。

（二）人工智能的特征

经过60多年的演进，在互联网、大数据等新理论新技术及经济社会发展强烈需求的共同驱动下，人工智能技术加速发展。笔者认为，人工智能具有以下几大特征：是一种大数据驱动的知识学习技术；能够实现跨媒体的认知、学习、推理；人机、脑机相互协同和融合；能够自主操控，无须人类操控；能进行智能的信息检索，获取人类无法获得的一些信息，并且将信息获取工作做到精细、优质。

大数据和人工智能知识产权保护的现状及挑战

（一）《中华人民共和国著作权法》（以下简称《著作权法》）对于大数据保护的现状

由于数据属于事实，故大数据本身不具有独创性，不受《著作权法》的保护。但是，对大数据的内容进行独创性的选择或编排后，形成具有独创性的数据库，即大数据汇编作品，则可以获得《著作权法》的保护。在一些国际条约中，明确规定对构成汇编作品的数据库给予保护。例如《世界知识产权组织版权条约》第五条明确规定：“数据的汇编，无论采用任何形式，只要其内容的选择或排列构成智力创作，即受到保护。这种保护不延及数据本身，也不损害汇编中的数据已存在的版权。”因此，具有独创性的数据汇编作品才能受到《著作权法》的保护。

根据《著作权法》的规定，《著作权法》保护的是大数据汇编作品所呈现的选择或编排方式，而不是保护其中的作品或者其他不构成作品的材料。但是，就大数据而言，大数据编排方式的商业价值并不高，真正具有商业价值的是大数据本身及对大数据进行选择或编排后形成的汇编作品。如今，许多行业对大数据的选择或编排趋于标准化，如果仅仅按照是否具有独创性来判断大数据汇编作品能否受到《著作权法》的保护，将导致具有重大商业价值的大数据本身无法得到该法的保护。

（二）《中华人民共和国反不正当竞争法》（以下简称《反不正当竞争法》）对于大数据保护的现状

从司法实践上看，对数据库的危害主要来自于对其内容的非法复制、制作及与其进行竞争的数据库的搭便车行为，即不正当竞争行为。《反不正当竞争法》对数据库进行了进一步的保护。对于不构成汇编作品的数据库，《反不正当竞争法》也可对智力投入进行保护。鉴于制作人对数据库投入了大量的物力和财力，只要竞争对手非法复制或窃取了该数据库中的有关数据，就可以认定竞争对手的行为违反了《反不正当竞争法》中公平、诚实信用原则，构成该法所称的“不正当竞争行为”。如果数据库符合商业秘密的特征，也可作为商业秘密予以保护。

但是，当经营者之间没有竞争关系时，即使一方直接提取大数据汇编作品中的数据去制作相同或者相近的数据，该大数据汇编作品的经营者便无法适用《反不正当竞争法》。且我国是以举例加概括的方式对不正当竞争行为进行界定，多数时候，通过原则性条款来界定不正当竞争行为会导致极大的不可预见性。法官大都根据个案予以解释和判断，这无疑让大数据汇编作品的作者很难预见自己的权利能否得到保护。故通过《反不正当竞争法》保护大数据汇编作品的实质内容具有较大的不确定性。

（三）《著作权法》对于人工智能保护的现状

人工智能的实质是“让机器从事需要人的智能工作”。在传统的观点中，往往认为人工智能的创造物不具有独创性，仅仅是再一次将计算机内所存储的内容进行汇编整理而已。随着人工智能的快速发展，机器人拥有的智能越来越强大，机器人与自然人的差别将会逐渐缩小。近年来，从事人工智能领域研究的一些专家在模拟人脑思维方面取得了重大进展，他们为机器人建设了大量的神经元，帮助机器人完成深度学习、模拟思考等行为，甚至表现出比人脑更强大的创造力。因此，机器人能否成为作者引发了学界的大讨论。目前各国的知识产权法，大都只对人类的智力成果予以保护。至于机器人所创作的作品，却不构成《著作权法》所称的“作品”，以至于无法受到《著作权法》的保护。

（四）《中华人民共和国专利法》（以下简称《专利法》）对于人工智能保护的现状

《专利法》没有规定对人工智能的创造物进行保护。《专利法》第二十六条规定：“申请发明或者实用新型专利的，应当提交请求书、说明书及其摘要和权利要求书等文件。请求书应当写明发明或者实用新型的名称，发明人的姓名，申请人姓名或者名称、地址，以及其他事项。”该条文中所说的发明人指的是自然人，独立享有民事权利和义务的法人也不能成为发明人。按照《专利法》的规定，人工智能的创造物不能受到《专利法》的保护。

大数据和人工智能法律保护的价值性判断

由于海量数据的存储和复制，人工智能的运用多借助于互联网的分发和获得。在此过程中，存在包括提供电信接入服务、支付服务、浏览器服务、内容服务和平台服务等多个环节。围绕不同时期和环节形成多维数据，企业间争夺产权将会形成争议，而且企业的商业模式和广告分成也将受到影响，甚至可能存在伪造数据的情况。对大数据和人工智能的知识产权法律保护，应当遵循如下原则：

（一）人本原则

法律是因人而生，因人而存的。大数据的发展和完善应当遵循保护人类基本的自由、平等、安全、尊严价值，促进社会的福祉发展。在数据采集和人工智能使用的过程中，对于涉及个人隐私、信息安全方面的数据应当采取一定的保护措施，必要时可以对大数据和人工智能行业进行立法规范，设置一定的行业准入门槛，防止数据采集和人工智能运用过程中损害个人的自由、尊严和隐私。

（二）慎重采集、隔离使用原则

大数据企业存在不同的样态，不同的主体对于数据的兴趣和癖好也不一样。初始采集过程中，企业对于原始数据收集往往是兼收并蓄，尽可能多地收集各类数据。但是，往往有些数据涉及敏感信息，如个人的账户、密码、身份信息等。如果这类数据被买卖，将会造成难以估量的后果。对于这类涉及敏感信息的数据，应当慎重采集，采集后还应对数据信息进行脱敏处理。采集和使用的环节应当进行隔离，在企业间、企业各个部门之间对信息进行必要的分离管理，采集和使用应当分开进行，这样有利于明确责任主体。建立慎重采集和隔离使用的原则，一方面有利于保护特定主体的隐私、商业秘密；另一方面能有效地预防犯罪，防止出现信息泄露等恶性事件。

（三）合理避让原则

大数据基本形成或存储于服务器或者云端上，有些企业的数据是原始状态存储的，有些企业则是采取模型式存储。因传输和存储环节存在不完善的地方，导致这些数据可以被其他企业所抓取。在互联网环境下，即便数据保护已经逐步完善，但由于分享和传播的需要，他人仍然可以接触并加以破解，从而导致数据外泄。在企业竞争过程中，这会形成对某一特定企业的恶意解读，损害企业的合法权益。即便这种解读是客观真实的，存在竞争的企业间也应当避免类似情形。企业之间通过网络开放协议，或者通过线下方式单独订立协议，对于加密或者开放的数据及数据统计结论，应当采取合理避让的方式，避免在竞争对手之间出现恶性竞争，防止利用大数据做出对竞争对手的侵权行为。

（四）利益平衡原则

对于大数据的保护应当遵守利益平衡的原则，特别是对于公共利益的保护，要使知识产权人的利益和社会公众的利益始终保持一种平衡。采集时，应当平衡用户利益和平台利益，数据采集者和用户之间是对立统一体，采集者也可以根据用户的癖好和习惯向用户推荐其关心的信息，方便用户快捷精准获得资源；加工时，应当平衡数据采集者和数据中介服务机构之间的利益，各方应遵循一定的规范，按照行业或者国家标准来进行；数据交易时，应当防止各种敏感数据，包括涉及商业秘密、个人隐私或其他涉及法律权益的数据在市面流通。

（五）法律伦理原则

人工智能容易引发伦理困境，在对于人工智能模仿人类的活动所产生的法律效果缺乏评估的情况下，应当慎重认定其法律责任。从本质上来说，人工智能所遵循的是设备预先内置的逻辑思维能力，也就意味着这种规则是由人类创作的，而人类使用人工智能进行二次学习的过程中会产生下一阶段的活动。但是，由于无法预先评估机器在学习后会具备哪些能力，如果不加以评估，将会导致产生法律问题。例如高速行驶的无人智能汽车，在极端情况下，可能要面临着杀死乘车人或行人的问题。如果通过事先预置的智能系统进行决策，将会导致灾难性后果，甚至开发者需承担刑事责任。但是，如果将这种情形下的决策权移交给驾驶者，就能相对缓解法律伦理困境。

完善大数据和人工智能的知识产权

法律保护机制

我国的大数据和人工智能产业的发展潜力很大，蕴含着巨大的经济价值。由于现有的知识产权法律保护机制不够完善，难以为大数据和人工智能产业的发展保驾护航。为了我国大数据和人工智能产业的快速健康发展，完善大数据和人工智能知识产权法律保护机制迫在眉睫。

（一）明确大数据汇编作品独创性标准

对大数据进行收集、选择或编排是对其进行分析利用的前提。虽然对大数据进行选择或编排后形成的作品不一定具有独创性，但是《著作权法》应当明确大数据汇编作品的独创性标准，以便更好地保护大数据汇编作品的著作权。衡量大数据汇编作品是否符合《著作权法》所要求的选择或编排的独创性要求，可以从以下内容考虑：如果大数据的获取、选择和编排是由汇编者独立完成，而非运用既定规则或规律的计算方法完成甚至抄袭完成，而且汇编者进行了主观上的权衡和判断，体现了汇编者的聪明才智，达到一定的智力创造高度，则这类汇编作品通常具有独创性。如果只是根据时间、字母排序等选择数据后汇编成作品，则不具有独创性，不能获得《著作权法》的保护。

（二）设立人工智能创作物著作权登记制度

人类作品自完成之时就享有著作权，自动受到《著作权法》的保护，但在现实生活中，对人工智能创作作品的独创性要求更高。笔者认为，人工智能创作的作品必须进行著作权登记。一方面，实行著作权登记制度可以有效保护人工智能创作物权利人的利益。如果人工智能作品不进行著作权登记，就会很容易被他人侵权。另一方面，通过著作权登记后，把原创性低的人工智能作品排除在外，以确保作品的质量。此外，人们可以通过购买一些人工智能作品的著作权，在其基础上进行第二次创作，从而创作出更高水平的作品，进一步促进文化市场的繁荣。

声明：转载此文是出于传递更多信息之目的。若有来源标注错误或侵犯了您的合法权益，请您与版权家联系，我们将及时更正、删除，谢谢。

上一篇：案例｜免费的图片真的可以“免费”使用吗？下一篇：人工智能生成内容是否享有著作权？

论大数据和人工智能的知识产权法律保护

相关阅读

相关分类

在线客服