版权家APP
扫描二维码
安装版权家客户端
微信小程序
扫描二维码
使用版权家小程序
百度小程序
扫描二维码
使用版权家小程序
版权家公众号
扫描二维码
进入版权家官方公众平台
版权家官微
扫描二维码
进入版权家官方微博
问题的提出 随着大数据、人工智能等技术的迅猛发展,利用文本挖掘技术对文本进行信息提取研究,用于分析药物对疾病的治疗规律,发现布局性的环境隐患和结构性的环境风险等应用场景,为新时代经济增长和社会进步提供助力。然而,文本挖掘存在侵犯著作权的法律风险。文本挖掘的对象可能是受著作权法保护的文字作品,也可能是不受著作权保护的时事新闻等。若是前者,文本挖掘可能侵犯文字作品的复制权、改编权、署名权等著作权。即使是为科学研究的文本挖掘行为,可能因为海量复制文字作品而不属于现行《著作权法》为科学研究“少量复制已经发表的作品”的情形,[4] 或《著作权法修正案草案(二次审议稿)》的为科学研究“翻译、改编、汇编、播放或者少量复制已经发表的作品”的情形。[5] 对此,有学者借鉴欧盟《数字化单一市场版权指令》提出科学研究的文本挖掘合理使用,[6] 但是没有对著作权许可和法定许可两种方式进行讨论和比较。本文将文本挖掘对象限于受著作权法保护的文字作品,讨论著作权许可、法定许可和合理使用三种可能路径,阐述不同路径的优缺点后,建议我国著作权法修改将文本挖掘行为纳入合理使用的情形。 著作权许可 正如著名民法学者王利明提出,在法律体系形成后,法治建设的重心不再是解决无法可依的问题,而是法律应当如何有效适用的问题。 面对新技术文本挖掘带来的著作权侵权风险的问题,本文首先检视现有著作权法框架下的可能路径,在现有法律确实无法解决问题时,再进行立法论上的探讨。 利用文本挖掘计算如何有效利用资源时,使用他人受著作权法保护的作品,首先应该考虑通过市场交易获得著作权许可的可能性。这既是著作权作为财产权的应有之义,亦是对作品创作进行经济性补偿以激励创作者积极性的主要途径。欧盟就文本挖掘的著作权问题组织著作权人出版商和使用者之间进行对话会,并以出版商承诺为非商业科学研究提供必要的著作权授权结束。根据我国著作权法,使用他人作品应当同著作权人订立许可使用合同,除非规定可以不经许可。[9] 文本挖掘可能全文复制他人文字作品进行信息挖掘,不属于明文规定的合理使用或法定许可的情形,因此挖掘前应当获得相关文字作品的著作权授权。欧盟对于非科学研究目的的文本挖掘的著作权限制可以通过合同另行约定。 诚然,著作权许可的路径有利于保障著作权人就其作品获得许可费用等经济回报,但是文本挖掘通常需要海量文本,可能因为交易成本过高而无法实现。英国最大的医学基金威尔康基金会曾以文本挖掘“疟疾”为例,发现英国自2000年至2011年间发布了15757篇文献,其中7759篇需获得著作权授权。[12] 经估算,为获得前述授权,需花费9个月左右时间和18630磅(约合人民币16.4万元)。这对于经济实力强劲的大型企业或科研机构而言,可能尚能承受。但是对于大部分小微企业而言,如此高昂的著作权交易成本可能足以让其望而却步。因此,通过相对人自行达成著作权许可,对于文本挖掘可能交易成本过高,不利于鼓励文本挖掘的广泛应用。 法定许可 文本挖掘需要使用海量作品,这一点与编写教科书汇编已经出版的作品或广播电视播放已经出版的录音制品 一些相似之处,或许可以考虑法定许可的路径。对于著作权人非常分散,而使用人又需要使用大量的作品时,为节约交易成本,法定许可允许使用人可以不经著作权人许可,按照规定支付报酬后使用作品,除非著作权人事先声明不许使用。欧盟对科学研究以外的文本挖掘为法定许可,并且此时文本挖掘行为主体不限于科研机构,但是可以通过合同排除适用。 对于文本挖掘而言,其若能作为法定许可的情形,行为人只需要按照规定支付一定的报酬(规定报酬通常比单独协商低),而不用担心事先获得著作权人授权,既能降低著作权交易成本,又一定程度上保障著作权人获得报酬。但是,前述理想可能因为著作权人事先声明不许使用而落空。相较于教科书使用作品能够带来知名度和社会认可,文字作品用于文本挖掘,其作者和作品名称等信息通常不会出现在最后的成果中,对于文字作品的著作权人可能激励不大。 同时,对于文本挖掘行为而言,法定许可带来的行政管理成本亦不应忽视。我国教科书法定许可制度的实施效果也并不理想,使用者没有履行向作者支付报酬的情况非常常见,通过集体管理组织转付也带来许可公示备案等问题。[17] 与此相似的是,美国版权法虽然规定音乐作品制作录音的法定许可和费用标准,但是大多数唱片公司认为法定许可规定的支付手续过于麻烦,仍然向音乐作品权利人的代理机构申请著作权许可。[18] 因此,通过将文本挖掘行为纳入法定许可的范围,可能面临作者或著作权人因为没有署名利益而事先声明不许使用而落空,也可能因为管理成本可能过高而收效甚微。 合理使用 若文本挖掘为合理使用情形,直接降低甚至免除著作权许可的费用和协商成本。我国现行《著作权法》第22条和《著作权法修正案草案(二次审议稿)》第24条规定了十余种情况下使用作品,可以不经著作权人许可,不向其支付报酬,但在指明作者姓名或者名称、作品名称后,直接使用作品。若文本挖掘为合理使用,那么文本挖掘主体在指明作者姓名和作品名称外,不需经著作权人许可或支付报酬。这对于文本挖掘行为而言具有明显的好处,即直接降低甚至免除著作权许可的费用和协商成本。 同时,文本挖掘行为不影响作品的阅读欣赏或者出版发行。现行《著作权法》和《著作权法修正案草案(二次审议稿)》明确规定为科学研究使用的作品,不得出版发行。因此,即使研究人员复制和存储海量的文字作品,其依照著作权法不得出版或发行,并不影响著作权人就其作品的正常的发行行为。而且,文本挖掘形成的作品,通常无法看出其作为数据来源的文字作品的身影,因此不会对原作品形成市场替代而严重损害著作权人合法利益,反而有利于促进经济增长和社会发展。 欧盟《数字化单一市场版权指令》对科学研究的文本挖掘规定为合理使用情形,但是限于非商业性的科学研究的文本挖掘行为。[19] 美国联邦第二巡回上诉法院曾判决谷歌图书馆项目为文本检索目的的全文复制构成合理使用。[20] 其中,谷歌图书馆项目和谷歌图书项目虽然未经版权人许可全文复制上千万册图书,向公众提供全文关键词检索,检索可以获得关键词的出处、上下文、频率等信息。[21] 法院认为,此种文本检索功能亦提供了新的研究手段,即文本挖掘和数据挖掘,属于转化性合理使用。 著作权人可能认为,文本挖掘行为已经“不合理地损害其合法利益”。尤其是掌握海量文字作品的数据库,对于文本挖掘行为可能无法容忍,且对于文本挖掘复制和存储的海量文字作品可能泄露后在市场上流通,严重损害其作为数据库的合法利益,感到担忧。例如,中国知网明确限制每台电脑每天限制下载300篇文献。诚然,数据库对作品的文本挖掘具有法律利益。但是,数据库对作品的控制,容易过度限制作品的传播与使用,可能阻碍新兴技术对作品的利用,最后损害社会公共利益。 结 论 对文本挖掘行为而言,著作权法上可能存在著作权市场交易、法定许可和合理使用三种路径。著作权交易保障了著作权人控制作品使用的利益,但可能因为交易成果过高而限制文本挖掘。法定许可在一定程度上保障著作权人获得报酬的利益,但可能因为作者事先声明不许使用而被排除。合理使用直接免除文本挖掘关于著作权许可的费用和协商成本,虽然可能一定程度上损害著作权人的利益,但是有利于新兴技术服务于经济增长和社会进步的公共利益。 声明:转载此文是出于传递更多信息之目的。若有来源标注错误或侵犯了您的合法权益,请作者持权属证明与版权家联系,我们将及时更正、删除,谢谢。 |