查找:                      转第 显示法宝之窗 隐藏相关资料 下载下载 收藏收藏 打印打印 转发转发 小字 小字 大字 大字
【期刊名称】 《财经法学》
网络爬虫行为对数据资产确权的影响
【作者】 李帅【作者单位】 北京外国语大学法学院{讲师}
【分类】 科技法学
【中文关键词】 网络爬虫;数据资产;不正当竞争;数据安全
【英文关键词】 web crawler; data assets; unfair competition; data security
【期刊年份】 2020年【期号】 1
【页码】 25
【摘要】

数字经济模式下,商业竞争手段日趋多样。通过爬虫行为获取同业经营者线上数据并作营利用途,除有不正当竞争之嫌外,还构成对传统市场机制的严峻挑战。依据不同标准,可将技术爬取的数据划分为多种类型。受到爬虫不当行为影响的权利在边界范围、主体身份以及法律属性等方面呈现复合特征。从本源看,受损事实的发生多是因相关数据性质不明,从而使其衍生权利的界定面临障碍。以“数据资产”概念的提出为基础,结合公私法域多维视角分析其“权利性”,并最终提出网络数据资产的确权建议,是通过法律途径规制不当数据爬取行为的关键一环。

【英文摘要】

In internet economy era, the means of commercial competition have become increasingly diverse. Obtaining online data from peer operators through the crawler program and using it for profit-making purposes, are largely suspected of unfair competition, meanwhile constitute a serious challenge to traditional market mechanisms. According to different standards, the content of technology crawling can be divided into raw data and processing data, text data and status data, core data and peripheral data, as well as merchant data and user data, etc., which makes the rights affected by crawler misconduct shows composited features in boundary scope dependent subject and legal attribute. From the root cause, the facts of damage happening are mostly due to the unclear nature of the corresponding data, which leads to the obstacles in the definition of derivative rights. Therefore, based on the concept of data assets, combined with the multi-dimensional perspective of public and private jurisdictions to analyze its rights' status, and finally put forward the recommendations for the determination of online data assets, is a key link to regulate improper data crawling behavior through legal channels.

【全文】法宝引证码CLI.A.1284549    
  

数字经济时代,数据作为一种新的生产要素,在预判市场走向、调控交易行为、影响各主体权利义务等方面发挥着重要作用。市场参与者特别是互联网企业,通过收集、存储、挖掘、加密、交易等一系列行为,充分发挥数据作为生产性资源的经济价值,更有企业直接将数据视为一种资产。与传统财产性资产不同,线上数据不具备明显的有体性,而以无形、可共享及可传输为主要特点,[1]这也就导致商业竞争向新的方向发展,并以争夺数据占有状态为主要形式。以下两则典型案例的核心内容均是一方主体通过线上行为获取另一方数据,但法院却作出截然不同的判决,其原因不仅关涉市场竞争与交易秩序的规范化,更与数据获取行为本身的合法性、数据的法律属性等问题密切相关。

案例一为hiQ vs. LinkedIn。2017年,同为职业类信息网站运营者的hiQ Labs公司(以下简称“hiQ”)将LinkedIn公司诉至法院,起因是后者通过后台程序阻止前者获取其客户数据。据调查,hiQ将其商业模式基本建立在对LinkedIn用户数据的分析上,所依托的技术也以数据的爬取和挖掘为主,直至LinkedIn采取反爬措施。对此,法院判决LinkedIn不得阻止hiQ进入、复制并使用其网站的公开信息,亦不得采用技术措施进行阻碍。[2]2019年9月,美国第九巡回上诉法院对该案作出二审判决,认定hiQ公司从LinkedIn上抓取公开数据的行为不构成违法。案例二为“酷米客”vs.“车来了”。2013年起,深圳市谷米科技有限公司(以下简称“谷米公司”)发布并运营一款名为“酷米客”的实时公交App,通过与公交集团协议安装的定位系统获取公交车辆的位置信息。2015至2016年间,武汉元光科技有限公司(以下简称“元光公司”)为提高其App“车来了”的信息查询准确度,利用爬虫软件获取“酷米客”服务器中的实时数据,日均达到300万至400万条。基于此,“酷米客”将“车来了”诉至法院,法庭经审理认为被告“车来了”运营方构成不正当竞争,应立即停止侵权行为并依法进行赔偿。[3]

两则案例相反的认定结果,除了因为不同经济体制下法律功能与目标的差异之外,最关键的原因还是爬虫行为在本质、细节等方面存在区别从而使行为外部性的实质不同。以此为背景探讨网络爬虫行为,分析其引发的权利义务变动,能够有效深入问题核心——网络数据的法律属性。

一、何为“网络爬虫行为”

网络爬虫是一种自动获取互联网信息的程序或脚本。可以说在大数据时代,除直接通过用户采集之外,另一大数据来源就是使用网络爬虫采集公开信息。常见的爬虫手段包括有构造合理的Http请求头、设置Cookie、使用代理等。作为一项互联网技术,爬虫行为本身并不违法,甚至很多信息类网站的基础技术就是爬虫程序。然而,当技术中立受到商业偏好的影响时,诸如“同业爬虫”等非正当行为则对存储在云空间中的各类数据形成安全性冲击。实践中,爬虫行为正当性的判定,要在企业竞争保护和数据权利保护的双重思想指导下展开,从而全面实现数据关联利益。

(一)两则案例中的爬虫行为定性

在案例一中,一方面,hiQ通过爬虫程序获取的数据为LinkedIn对外公开的内容,且大部分系由用户直接输入、未经平台加工,所以LinkedIn在本质上仅是数据收集者和占有者。此外,hiQ实施的数据访问行为与一般用户无异,仅在获取的数量上多于后者,但也不足以构成限制其爬虫行为的理由。另一方面,LinkedIn的主要经营业务是提供职业社交服务,为业内公认的绝对支配者,掌握丰富的职业关系信息;相比之下,hiQ从事的主要是企业员工行为测评工作,并依托员工职业生涯中的自评或他评信息为雇主及人力资源部门提供“员工离职风险分析”服务,在经营项目和目标群体上与LinkedIn均无冲突,不属于同业竞争者,所以除有正当理由外,不应限制hiQ作为市场活动参与者的正当数据行为。

在案例二中,“车来了”运营商爬取“酷米客”数据,虽然获取的也是后者实时公开的内容,但与案例一却有着本质上的区别。其一,两款手机App的运营商均为用户提供实时公交定位服务,商业模式基本相同,存在明显的竞争关系。本案中,元光公司爬取数据的目的就是得到更精准的信息,扩大市场占有份额,可以判定其实施了不正当竞争行为。其二,在数据性质方面,虽然公交车辆运行路线、运行时间等信息仅系客观事实,但经人工收集、分析、编辑与整合之后,就可为App的商业运行带来可观效益,所以实际上已具备无形财产的特征。谷米公司系“酷米客”App设计者,对相应数据除了享有这种特殊的所有权外还是其著作权权利人,因而对于软件所包含的核心数据,未经权利人同意不得私自爬取并用于经营行为。

(二)网络爬虫不当行为的判定标准

数字经济时代,爬虫行为的存在已是普遍现象。在不违背交易秩序和竞争规则的前提下,市场主体对爬虫基本持默许态度,亦有经营者之间通过内部协议允许互相爬取数据的先例。[4]此外,《电子商务法》31条规定平台经营者应当“记录、保存商品和服务信息、交易信息,并确保信息的完整性、保密性、可用性”,亦是通过强调“保密”与“可用”并不矛盾的精神,侧面反映出监管的目标既在于维护网络数据安全,又关注数据多维价值的实现。因此,以“爬虫行为正当性高度依赖数据价值属性”这一特征为基础,可将判定网络爬虫不当行为的考量因素总结为以下两个方面:

1.数据来源及目标用途

人丑就要多读书

基于商业目的,爬虫技术的应用不仅局限在获取已公开的数据,更多是为了得到对方未开放的内部数据或后台数据,在数字经济过程中则是爬取企业运营所依赖的基础信息。例如,金融爬虫重点获取用户的真实姓名、消费金额记录、信用借贷记录等既关涉个人隐私、又属于商业秘密的信息内容,这与搜索引擎爬取网站界面数据的行为完全不同,其负面性根源在于信息渠道的非正当。

但是,并非所有未涉及内部数据的爬虫行为都是正当的,亦即,合理来源要与合理用途相结合。具体到实践中,判断爬虫行为正当与否,应当考虑以下因素:第一,爬虫获取的数据被用于同业竞争还是非同业经营。实践案例除了前文提及的“酷米客”与“车来了”纠纷之外,还有商业银行信用卡中心之间、互联网现金贷App之间相互爬取后台数据,基于对方的放款额度或授信额度,确定本商业实体对自身用户的信贷金额,这些都属于利用同业经营者的数据资源从事相同经营活动,且客观上未履行自身作为金融机构对用户的资格审查职责,故应当被定性为爬虫不当行为。第二,爬虫行为的社会效果是利大于弊,还是弊大于利。当前,大量互联网抢票软件利用爬虫程序在铁路购票及航空购票网站持续点击,实时抢购平台余票。这一操作虽然可以实现加价抢票效果,但实际却影响到网站使用流畅度和所有消费者公平购票的权利,因而属于爬虫不当行为。

2.授权获取方式及数据使用范围

网络安全法》41条规定:“网络运营者收集、使用个人信息,应当遵循合法、正当、必要的原则,公开收集、使用规则,明示收集、使用信息的目的、方式和范围,并经被收集者同意。”基于法律对数据来源主体的权利保护规则,虽然网络爬虫并非直接从用户手中获取数据,但理论上同样应在事前取得授权。

当前共享经济与电子商务协同发展,互联网实时线上数据体量巨大,用户关注的重心往往与购买商品、享受服务以及获取资讯相关,而对平台上的消费者协议内容一带而过,并通过勾选的方式将“同意”与“授权”一次性作出。实践中,有网络运营商采用各种方式扩大用户信息的获取和使用范围,很大程度上侵害了用户个人信息安全。常规互联网平台在获取授权过程中尚如此,爬虫程序获取用户授权则更具“表述模糊性”与“方式隐蔽性”。例如在商业竞争中,有经营者希望获得更多同业商家持有的用户信息,则要求自己平台上的用户提供在其他同类平台注册时的用户名和密码,以便获得更好的服务。这种做法虽然得到了用户授权,但大部分授权人并不知晓实际获取信息的主体是爬虫程序,被爬数据的真实范围远大于用户知情范围,且数据的最终用途也与获取授权时告知的内容不符,这就使得数据来源主体的知情权和依托数据产生的其他权利受到严重侵害。

二、数据权利内涵新解及其与爬虫行为的相互关系

在网络爬虫行为中,线上数据作为一系列活动的标的,其所承载的内涵与传统数据相比实现了量级化突破。这种行为对象上的拓展,直接导致相应权利客体发生变化,受爬虫行为影响的权利种类和性质亦有一定改变。因此,对数据权利属性进行研究,既有利于厘清爬虫行为中受损的权利内容,为相关制度的完善提供依据,同时更是制定数据资源确权、开放、流通、交易相关制度的起点和基石,有利于完善数据产权保护制度。[5]

(一)以网络为媒介的数据种类界分

传统经济时代,数据的分类标准主要包括产生时间、涵盖范围、权利主体等,相应地,其类别有当前数据与历史数据、宏观数据与微观数据、个体数据与群体数据等。而现今,网络技术丰富了数据的产生、流转、利用与交易途径,数据分类方式和分类标准不再局限于二维层面,其复合属性日益明显。

首先,以数据的生成是否需要网络平台加工为标准,可以将线上数据分为用户个人信息、实时位置信息等原始数据,以及交易记录信息、活动轨迹信息等加工数据。其中,加工数据涉及多重主体的贡献迭代问题,与原始数据相比附加了更多的社会价值,因而利用规则也相对复杂。具体而言,实践中对加工数据的获取与应用,要额外考量数据处理的经济成本,并以加工主体的意愿为决定因素之一。

其次,以数据的存在形式为标准,可分为文本数据、状态数据与新模态数据。文本数据指的是可经记载、描摹或复制,将内容以有形形式存储的信息,包括但不限于各种文字、符号、图像及其组合。状态数据是以非文本形态生成并存储,具有较强时效性的信息,例如实时地理位置信息等。人工智能技术背景下,电子身份识别所需的指纹、瞳孔、声音等信息具备了高度代码化特征,可独立成类,即为新模态数据。实践中,数据的特殊形态常被用作不当获取行为的抗辩理由,其原因主要就是信息类型化的不甚完善。所以,扩展数据的传统认知范畴,能够有效划定爬虫行为的对象领域。

再次,以数据内容的重要性程度和生成环节为标准,可分为核心数据与周边数据。此分类标准下,数据子类包含的具体内容并不确定,需要结合实际情况,分析相关数据是否体现核心权利义务关系,以及该数据是否系数据生成、流转或存储行为的附属产物。具体言之,作为数据行为的目标产物,且蕴含社会、经济价值的数据通常被认定为核心数据,爬取时需要得到数据主体的知情同意和授权;除此之外,数据流通过程中产生的程序信息、档案信息或其他信息,不具有明确的使用价值或对行为人权益无实质性影响,通常在确认不涉密之后则可供爬取。

最后,以数据主体的身份差别为标准,可以分为用户数据与商家数据。前者系网络用户基于自愿,主动向平台提供的有关个人身份、行为习惯等方面的信息;后者为平台经营者实施商业运营行为产生的新信息,或者从事数据加工行为产生的增值信息等。因为与主体权益密切相关,所以规制此类数据时需要以主体身份的明确为前提,在此基础上深入分析权利种类,将主体与权利相匹配,最终为数据爬取行为的实施者提供意见征询对象及征询内容。

(二)数据权利内涵的时代性拓展

伴随数据形态和内容的丰富,依托其生成的数据权利也面临着因应性变革,主要趋势就是权利内涵的进一步充实,以及多种属性权利的并行存在。理论研究进程中,邻接权客体与财产权客体的争议至今尚存,[6]而蕴含着人格权内涵的“资产权客体说”作为新生理论,在网络社会中日益显现更适于保障数据主体权益的能力。

当前实践中,立法对数据权利的定性尚未明确,世界范围内亦不存在一部调整各类数据行为的法律规范,仅在个人信息或隐私保护的维度上有所突破。以2018年欧盟出台的《一般数据保护条例》(GDPR)为例,该法案以强化数据主体对个人数据控制为导向,但未能明确划分数据权利项下人格权与财产权的边界,一定程度上掣肘了立法目标的实现。因此有学者认为保护公民的隐私权益,应当更多采取公法风险规制与消费者法保护的框架,而不是寻求一种具有确定性边界的隐私权或个人信息权。[7]推及互联网背景下的所有数据范畴,这一理念同样具有其合理性:其一,大量互联网数据系从用户个人处收集所得,且主要来源于用户的消费行为,可界定为消费数据的组成部分,因而以消费者法的思路对相关信息进行保护具有客体的适格性。其二,存储在网络数据库中的信息并不局限于原始的用户信息,还有因流转和加工而不断充实的信息,所以坚持以一种确定的权利名称界定互联网数据,不论对权利属性的全面认知还是合法权利的有效保障而言,都缺乏科学合理的指导意义。

综上,选择具有综合意义的“资产权”概念诠释新时代的数据权利,赋予其人格、身份、财产乃至知识产权等多重内涵,将是数据时代规范爬虫行为的权利设定基础。正如龙卫球教授所言,一旦承认了用户具有数据财产权,那么就会迫使数据使用者主动与数据主体进行商议,如此则改变了用户在数据市场被忽视的境地


  ······
菊花碎了一地

法宝用户,请登录后查看全部内容。
还不是用户?点击单篇购买;单位用户可在线填写“申请试用表”申请试用或直接致电400-810-8266成为法宝付费用户。
【注释】                                                                                                     
©北大法宝:(www.pkulaw.cn)专业提供法律信息、法学知识和法律软件领域各类解决方案。北大法宝为您提供丰富的参考资料,正式引用法规条文时请与标准文本核对
欢迎查看所有产品和服务。法宝快讯:如何快速找到您需要的检索结果?    法宝V5有何新特色?
扫码阅读
本篇【法宝引证码CLI.A.1284549      关注法宝动态:  

法宝联想
【相似文献】
【作者其他文献】

热门视频更多