查找:                      转第 显示法宝之窗 隐藏相关资料 下载下载 收藏收藏 打印打印 转发转发 小字 小字 大字 大字
【期刊名称】 《科技与法律》
人工智能时代数据竞争行为的法律边界
【英文标题】 Legal Boundaries of Data Competition Behavior in the Era of Artificial Intelligence
【作者】 李安【作者单位】 中南财经政法大学知识产权研究中心
【分类】 人工智能
【中文关键词】 人工智能;数据要素;数据竞争;法律边界
【英文关键词】 artificial intelligence; factor market; data competition; behavior boundaries
【文章编码】 1003-9945(2019)01-0061-10【文献标识码】 A
【期刊年份】 2019年【期号】 1
【页码】 61
【摘要】

数据是人工智能时代的重要生产资料,围绕数据的市场竞争日趋激烈;相应地,数据竞争行为的竞争法规制需求日益迫切。人工智能时代数据行为的竞争法规制,需要明确数据的生产要素特征,兼顾数据控制方和数据使用方的利益诉求,均衡数据的产出激励效率和配置使用效率。为此,一方面要着力纠正数据使用方的不正当数据竞争行为,以维护公平的市场竞争秩序;另一方面要切实监管数据控制方的数据垄断行为,以维护自由的市场竞争机制。进而,为人工智能产业的发展营造一个公平自由的数据要素市场环境。

【英文摘要】

Data is an important production material in the era of artificial intelligence, and the market competition surrounding data is becoming increasingly fierce. Correspondingly, the regulation demand of competition law for data competition is becoming urgent over time. The regulation of competition law of data behavior needs to clarify the characteristics of the production factors of data, make every effort to balance the interests of data controllers and data users, and balance the output incentive efficiency and allocation and use efficiency of data. In addition, it is required to focus on correcting data users′ unfair competition behavior so as to maintain a regulated market competition order, and to focus on effectively supervising the data monopoly behaviors by data controllers to safeguard a free market competition mechanism. And then, a good data factor market environment is created for the development of the artifi-cial intelligence industry.

【全文】法宝引证码CLI.A.1256334    
  引言:信息的数据化与数据的资源化
  在“软件定义一切”{1}的智能时代中,无处不计算,万物皆互联,而计算和互联的基本要素是数据。数据在不同的语境中有不同的含义。在大数据语境中,数据指的是电子数据,即以二进制数字代码0和1组合而成的比特流,其可以在计算机中储存运算,在互联网中交换流通。人工智能时代,数据是“信息数据化”的产物,数据竞争是“数据资源化”的结果。
  所谓信息的数据化,指信息的数字化表达和数字化传播[1],也即人、事、物的相关信息以数字代码0和1的二进制组合形式,在计算机和互联网中予以呈现和流通。前互联网时代,人们的日常生活往往“事如春梦了无痕”[2],如今确是“处处行迹处处痕”:我们的出行与旅游(Mobike、携程)、社交与娱乐(微信、微博)、购物与消费(淘宝、支付宝)等信息都会以电子数据的形式在互联网平台上记录和储存。从互联网到移动互联网,再到物联网、万联网,信息数据呈现指数型增长。据IDC(国际数据公司)预测,到2025年全球的数据总量将达到163ZB(163万亿GB){2}。
  所谓数据的资源化,指数据的经济用途日渐拓展,数据的经济价值日益凸显,数据成为经济发展的战略性新资源。阿里巴巴2015年7月22日发布《数据保护倡议书》,声称“全球正在加速从IT(Informa-tion technology)走向DT(Data technology)。数据从沉睡中苏醒,开始流淌起来,成为新的基础能源”,“未来,一切社会和商业活动,互联网是基础设施,云计算是公共服务,数据是要素资源”[3]。鉴于数据技术的长足发展,更有评论者将数据作为新的生产要素,与资本和劳动并列{3}。数据经济价值的发现,激发了市场主体针对数据资源的经济寻租活动,从而不可避免地引发竞争纠纷。
  信息的数据化与数据的资源化,表明数据的本质是承载了数字信息的有价资源。换而言之,信息是数据的价值渊源,资源是数据的价值形式。在人工智能时代,深度学习算法和超强计算能力的进步,为海量数据提供了最完美的商业可能。可以预见,在人工智能时代,数据的经济价值将会被算法技术深度挖掘,被计算能力充分释放。然而,数据经济价值的凸显,也意味着市场主体围绕数据的封锁与获取、保护与使用的竞争纠纷将日趋激烈,市场主体对于数据的不正当竞争行为和垄断行为将不断涌现。近年来,国内的“新浪微博诉脉脉”案[4]、“大众点评诉百度”案[5];国外的“hiQ v. LinkedIn”案[6]、“Microsoft/LinkedIn”并购案[7]等数据竞争案例[8],引起了学界的广泛关注[9]。社会主义市场经济是法治经济,也即法律是现代经济生活中最为重要的行为规范。毫无疑问,人工智能时代数据的竞争行为理应以法律为边界,而如何在竞争法框架内界定数据竞争的行为边界,营造一个公平自由的市场竞争环境,是当前人工智能产业发展的一个重要议题。
  一、人工智能时代的数据竞争:竞争特点和规制要点
  数据,即数字形式的信息,首先是计算机、互联网等数字技术的产物,其次是人工智能技术实现的基础性资源。数据的经济价值在前人工智能时代就已经存在,如20世纪末的电子数据库产品等。随着人工智能技术的进步,数据的经济价值被进一步挖掘和释放,数据的经济价值形式也发生了重大转变。相比于前人工智能时代的数据竞争,人工智能时代数据的竞争特点和规制要点,均有所不同。
  (一)数据竞争特点:从“产品市场”到“要素市场”
  前人工智能时代,数据的经济价值形式主要表现为信息产品,被用来解决市场信息失灵问题。市场经济本身就是一个信息处理系统,其通过价格来传递信息;但是价格不是万能的,真实存在的市场仍是一个信息不完全的市场。市场信息失灵具体表现为:信息数量不充足、信息分布不对称、信息质量有错误{4}。而信息数字化为数据,可以在网络平台上互通共享,这一定程度上缓解了市场信息失灵问题。如淘宝连接卖家和买家,使得卖方的供给信息和买方的需求信息得以畅通,促使交易的达成;再如运满满、货车帮收集整理货源信息数据,通过APP平台提供给货车司机,有效地降低了司机的货车空载率。上述例子中数据的经济价值,是以信息产品或服务的形式呈现的,这是前人工智能时代数据的主要价值形式。
  人工智能时代,数据的经济价值表现形式是生产资料,为机器学习(算法训练)提供原料。一般而言,人工智能的获得有两种途径:一是机器“仿人”思考,即“机器要像人一样思考才能获得智能”,如人工神经网络;二是数据训练算法,即机器学习是从案例和经验(数字化了的信息)中习得的算法(见图1),而不是依赖于硬件代码和事先定义的规则{5}。换句话说,不是一个开发者来告诉机器如何区分苹果和橘子,而是算法本身通过喂养数据,自己学会如何区分苹果和橘子。
  正是在后者的意义上,数据(data)、算法(algorithms)、算力(computing power)构成人工智能的三大基础要素。数据训练算法获得人工智能的好处在于,随着数据的积累,算法将会变得越来越好,而其他的获得人工智能的方法很难受益于数据量的提升。基于此,我们可以说,在人工智能时代中,计算力是生产力,算法是生产工具,而数据将会是社会经济生活中最重要的生产资料之一{6}。
  (图略)
  图1数据训练算法
  概而言之,前人工智能时代的数据价值形式是“信息产品”;而人工智能时代的数据价值形式是“生产资料”:不同行为主体留下来的像面包屑一样的零散数据,在智能算法和超强计算力的作用下,最终可以转化为像蛋白粉一样的高品质产品或服务。“在社会主义市场经济中,要素市场就是将生产要素作为商品进行交换和配置所形成的市场。”{7}可以认为,人工智能时代的数据竞争,将从“产品市场”走向“要素市场”:前人工智能时代的数据竞争集中于“产品市场”,而人工智能时代的数据竞争重点在于“要素市场”。与此同时,人工智能“要素市场”中的数据竞争主体将不再是传统产品市场竞争中类似产品经营者的横向竞争,而主要是人工智能产业上下游经营主体的纵向竞争。简而言之,人工智能时代的数据竞争主体将从“供给方之间的竞争”转变为“供给方与需求方之间的竞争”。人工智能时代的数据竞争重点从“产品市场”走向“要素市场”,相应地,其数据竞争的竞争法规制重点也将从“产品市场”转向“要素市场”。
  (二)竞争规制要点:主体利益兼顾与经济效率均衡
  要素市场竞争是人工智能时代数据竞争的特点,竞争主体通常为上下游的“数据控制方”与“数据使用方”,也可称为“数据供给方”与“数据需求方”。人工智能时代数据竞争的实质就是数据控制方与数据使用方之间的利益博弈。具体而言,不同的产业主体具有不同的利益需求:(1)数据控制方认为自身整理、收集、储存数据的投资巨大,所以应该承认并妥善保护数据平台方的数据经济利益,以保护数据整理收集的投资利益,激励数据收集储存的投资行为;(2)数据使用方主张数据的经济价值有赖于数据的加工、挖掘,应该基于互联网“互联互通”之精神倡导数据的自由流通和开放共享,以充分利用数据资源和释放数据价值,推动人工智能产业的蓬勃发展。由此可见,对于人工智能时代数据要素市场的数据利用问题,数据控制方和数据使用方的利益诉求并不一致。
  言及竞争法规制,双方利益诉求相左的背后是不同的经济效率考量:一方面,数据控制方的数据保护诉求,着眼于数据资源的产出效率,即保护并激励数据的收集存储投资;另一方面,数据使用方的数据共享诉求,着眼于数据资源的配置效率,即充分利用和释放数据资源的经济价值。可以认为,数据资源的产出不足和使用不足,都是经济不效率的表现。因此,如何调整“促进”和“规制”人工智能产业的数据获取使用,如何均衡数据的产出效率和配置效率,是人工智能产业主体数据行为之竞争法研究的核心问题。
  在数据主体利益相左,数据经济效率相异的情况下,首先需要明确的是数据竞争行为之经济法规制的总目标,即维护数据要素市场的竞争秩序和竞争机制,为人工智能产业的发展营造良好的数据要素市场环境。为实现上述产业发展的总目标,竞争法规制的要点有两个:一是竞争规制需要兼顾数据控制方和数据使用方的利益诉求;二是竞争规制需要均衡数据资源的产出激励效率和配置使用效率。一言以蔽之,数据竞争是市场竞争的新兴问题,各市场主体的权益边界尚不清晰,竞争法规制应在利益兼顾和效率均衡的基础上,划定各方的竞争行为边界。数据控制方和数据使用方数据竞争利益诉求不同,相应地,双方的数据竞争行为也不相同。具体而言,在竞争法视野下,数据使用者在数据市场上通常为后来者,不具有大量、多样、有价值的数据资源,其对数据资源的需求在人工智能产业经济利润的驱动下,演变为对数据资源的不当获取和不法使用,因此数据使用者需要规制的行为主要是不正当竞争(Unfair Competition)的数据行为;而数据控制者为了对抗现存竞争者,防范潜在竞争者,其热衷于数据的封锁与独占、并购与整合,意图维持并加强自身的数据市场力量,因此数据控制者需要规制的行为主要是限制竞争(Anti-competition)的数据行为。下文将以竞争法理论为基础,结合现有典型案例,予以分别讨论。
  二、反不正当竞争:数据使用者的行为边界
  相比于数据控制者,数据使用者是人工智能产业体系的下游主体,其不法竞争行为主要是不正当竞争行为。显而易见,不正当的数据竞争行为不在《反不正当竞争法》第2章所列举的7种具体不正当竞争行为之列[10]。因此,数据竞争的不正当行为规制需要考虑适用“一般条款”,也即对数据竞争行为进行“道德性”评价和“经济性”分析[11];前者指考量数据竞争行为是否符合商业道德和行业惯例,后者指考察数据竞争行为是否有违“三方利益”平衡,即分析数据竞争行为对经营者、消费者、社会公众的利益影响。数据使用者的行为主要是数据获取和数据使用,因此下文将围绕这两点展开。
  (一)数据获取的行为准则
  数据获取是数据使用的前提。鉴于数据控制者(数据平台)在数据收集储存方面的投入,数据使用者获取数据理应尊重数据平台方的数据利益,这与司法实践中的做法相一致。在“新浪微博诉脉脉”案中,法院提出“三重授权”原则,即数据控制者(平台方)收集用户信息需要经过“用户授权”,数据使用者(第三方)获取用户数据需要同时经过“平台授权”和“用户授权”[12]。无独有偶,在国外的“Facebook v. Power Ven-tures”案中,法院也强调了Power Ventures访问获取用户数据不仅需要经过用户授权,也需要经过平台方Facebook授权[13]。上述判决的法院立场,表明了数据竞争应承认并尊重数据平台方的数据利益,这将有效地激励平台收集数据和储存数据。本文对此表示赞同,并认为是否获得数据控制方的授权,是数据获取行为正当性评价的重要考量因素。数据获取的授权问题,与数据的开放程度和访问权限密切相关,申言之,数据开放程度是数据获取行为正当性类型化分析的基础。从开放程度而言,数据可分为三种类型:完全公开数据、不完全公开数据和不公开数据。
  首先,对于“完全公开数据”而言,其数据获取不具有用户身份认证等事前限制,因此第三方数据使用者可以自由的获取数据。“当数据访问限制不需要身份认证时,可以视为数据获取面向社会公众开放”{8},即公共许可(授权)。数据使用者获取该类数据的典型行为是使用“网络爬虫”(Web Spider)抓取数据。除非数据控制者网站设置robots.txt文件拒绝爬虫访问,网络爬虫可以自由的抓取公开数据。然而,Robots协议是否是网络爬虫抓取数据应当遵守的行业惯例,以及能否据此评价爬虫抓取数据行为的正当性,尚存争议。以“百度诉奇虎360违反“Robots协议”案为例:一方面,百度诉称360违反Robots协议的抓数据,构成不正当竞争;另一方面,360辩称百度设置robots.txt文件排斥360抓取数据,目的为限制同行业者竞争。最终法院将Robots协议认定为行业惯例,判定360初期阶段违反Robots协议抓取百度数据,行为明显不当;同时,法院认为百度拒绝修改其Robots协议,且未充分说明拒绝理由,故不支持其请求禁止360抓取数据的主张[14]。笔者认为,Robots协议等限制第三方抓取数据的措施,可以称其为行业惯例,但是这些行业惯例不一定是“良好的行业惯例”,也可能是“潜规则”或“恶俗”{9},因此不能简单地依照行业惯例判定不正当竞争行为。对公开数据获取的行为准则而言,该案所确立的“协商—通知”规则具有重要的意义,即数据使用方应在尊重数据控制方数据获取协议的前提下,向数据控制方提出协商;若数据控制方拒绝修改数据获取协议,则应该给出合理的拒绝理由;若协商失败,数据使用者可以向行业协会提出调解,或向法院提起诉讼。
  其次,对于“相对公开数据”而言,数据使用者获取数据需要经过身份认证等事前授权。对该种数据的获取方式,一种是通过API(Application Programming Interface,应用编程接口)认证获取数据;另一种是通过普通注册用户的账号认证获取数据。相对公开数据的不正当获取行为,可以类型化为以下三种:(1)数据使用者虽有Open API接口认证,但是超越数据访问权限,获取授权范围之外的数据,如在“新浪微博诉脉脉”案中,新浪微博诉称脉脉在API接口权限之外获取微博用户的教育职业等信息数据,构成不正当竞争[15];(2)数据使用者注册大量用户账号,模拟正常用户进行信息数据抓取,或者通过不同的IP地址,伪造正常账号的请求以获取数据。如在“WIFI万能钥匙与WIFI共享精灵的数据纠纷”案中,WIFI共享精灵通过程序代码模拟“WIFI万能钥匙”的正常用户,从而获取“WIFI万能钥匙”的WIFI热点密码数据,被法院认定为非法行为[16];(3)数据使用者绕过身份认证技术措施而获取数据的“黑客行为”。以“黑客行为”获取数据不仅仅是一种不正当竞争行为,更多情况下构成刑事犯罪,即《刑法》285条第二款规定了“非法获取计算机信息系统数据罪”[17]。总而言之,采取身份认证为事前授权措施的相对公开数据,如果数据使用者“获得身份认证,即视为取得数据获取权限”;“如果在获得了身份认证的前提下,超越权限的数据访问”,或者是“绕过身份认证环节的数据获取访问”,都是未经授权的“非法侵入行为”。{8}
  再次,对于不公开数据而言,数据控制方一般对数据进行了技术措施保护。在不公开数据类型领域中,典型的不正当数据获取行为是“黑客行为”。不公开数据如果符合秘密性、经济性和保密性,则其属于商业秘密,对该类数据的非法获取是侵犯商业秘密的不正当竞争行为。此外,前文已述,该种数据获取行为,不仅是不正当竞争,而且构成刑事犯罪,如在“酷米客与车来了”的数据纠纷案中,“车来了”入侵“酷米客”数据资源库抓取数据,被法院认定为“非法获取计算机信息系统数据罪”[18],以及不正当竞争[19]。
  

  ······

法宝用户,请登录后查看全部内容。
还不是用户?点击单篇购买;单位用户可在线填写“申请试用表”申请试用或直接致电400-810-8266成为法宝付费用户。
【注释】                                                                                                     
【参考文献】

{1}赵小凡.对“软件定义一切”的思考和理解[J].软件和信息服务,2014(1):16.

{2} IDC (International Data Corporation), Data Age 2025:The Evolution of Data to Life -Critical [EB/OL].(2017-04)[2018-10-30].https://www.import.io/wp-content/uploads/2017/04/Seagate-WP-DataAge2025-March-2017.pdf.

{3}Kenneth Cukier. Data, Data Everywhere [N]. ECONOMIST(London), 2010-1-25.

{4}应飞虎.信息失灵的制度克服研究[M].北京:法律出版社,2004:3-6.

{5}吴军.智能时代:大数据与智能革命重新定义未来[M].北京:中信出版社,2016:37-85.

{6}张钦坤,曹建峰.人工智能时代需要更加关注数据竞争问题[J].腾讯互联网评论,2017(8):2.

{7}宁立志.中国反垄断:从产品市场到要素市场[M].宁立志.知识产权与市场竞争(第3辑).湖北:湖北人民出版社,2016:74.

{8}Orin S. Kerr. Norms of Computer Trespass [J]. ColumbiaLaw Review, 2016,116.

{9}范长军.行业惯例与不正当竞争[J].法学家,2015(5):86.北大法宝

{10}陈秀山.现代竞争理论与竞争政策[M].北京:商务印书馆,1997:56-60.

{11}齐爱民.私法视野下的信息[M].重庆:重庆大学出版社,2012:62.

{12}Maureen K. Ohlhausen, Alexander P. Okuliar. Competition, Consumer protection, and the Right [Approach] to Privacy [J]. Antitrust Law Journal, 2015,80:133.

{13}吴汉东.人工智能时代的制度安排与法律规制[J].法律科学,2017(5):135.

{14}王融.数据匿名化的法律规制[J].信息通信技术,2016(4):38.

{15}维克托·迈尔-舍思伯格,肯尼思·库克耶著.大数据时代——生活、工作与思维的大变革[M].盛杨燕,周涛,译.浙江:浙江人民出版社,2012:105.

{16} Greg Sivinskia, Alex Okuliarb, Lars Kjolbye. Is big data a big deal? A competition law approach to big data [J]. EU- ROPEAN COMPETITION JOURNAL, 2017, 13(2-3):199-227.

{17}曾雄.数据垄断相关问题的反垄断法分析思路[J].竞争政策研究,2017(6):44.

{18} Harbour P J, Koslov T I. Section 2 In A Web 2.0World: An Expanded Vision of Relevant Product Markets [J]. Antitrust Law Journal, 2010, 76(3):769-797.

{19} John M. Newman. Antitrust in Zero-price Markets: Applications [J]. Washington University Law Review, 2016,49:64-71.

{20} Katz M L, Shapiro C. Network Externalities, Competition, and Compatibility [J]. American Economic Review, 1985, 75(3):424-440.

{21} D. Daniel Sokol, Roisin Comerford. Antitrust and Regu-lating Big Data [J]. George Mason Law Review, 2016,23:1137-1138.

{22}陈兵.大数据的竞争法属性及其规制意义[J].法学,2018(8):118.

©北大法宝:(www.pkulaw.cn)专业提供法律信息、法学知识和法律软件领域各类解决方案。北大法宝为您提供丰富的参考资料,正式引用法规条文时请与标准文本核对
欢迎查看所有产品和服务。法宝快讯:如何快速找到您需要的检索结果?    法宝V5有何新特色?
扫码阅读
本篇【法宝引证码CLI.A.1256334      关注法宝动态:  

法宝联想
【相似文献】
【作者其他文献】

热门视频更多