-
石城研究
在数字经济时代,数据已成为驱动经济发展的核心生产要素。互联网平台之间的竞争日益表现为对数据资源的争夺,其中“数据爬取”与“数据封锁”两类行为尤其引人关注。本文旨在分析这两类行为在反不正当竞争法框架下的认定标准、法律适用及规制路径,并通过典型案例剖析其法律边界,以期为构建平衡数据保护与流通的法治环境提供参考。
一、数据爬取行为的法律分析与规制
数据爬取作为获取数据资源的技术手段,其正当性边界需结合爬取方式、数据性质及使用后果进行综合判断。实践中,以下两类爬取行为通常被认定为具有不正当性:
1.1
实质性替代原平台的爬取行为
当爬取行为达到“实质性替代”数据来源网站的程度时,通常构成不正当竞争。这类行为的核心特征是通过爬取他人投入大量资源收集、整理的数据,直接攫取原平台的流量和交易机会,实质性地替代原平台向用户提供信息或服务。在“百度地图爬取大众点评网用户评论”案中,百度地图大量爬取并使用大众点评网上的用户评论信息,用于充实自身的“百度地图”和“百度知道”产品。法院认为,百度自身并未对这些信息做出贡献,却大量使用这些信息,替代了大众点评网向用户提供信息的功能,导致大众点评网流量减少,攫取了其交易机会,构成不正当竞争。此类“搭便车”行为不仅损害了原平台的合法利益,也扭曲了正常的市场竞争秩序。
“实质性替代”的判定通常考虑以下因素:
● 使用比例和方式爬取方是否直接、大量地使用原平台的数据,而非仅作为参考或补充;
● 商业价值影响爬取行为是否直接攫取了原平台的流量、用户注意力或交易机会;
● 创新激励影响是否削弱了原平台继续投入资源收集、整理数据的积极性。
1.2
突破技术屏障爬取非公开数据
通过技术手段突破或绕开被爬取方设定的访问权限、爬取非公开数据的行为,即使未达到“实质性替代”程度,也可能构成不正当竞争。这类行为的违法性在于其破坏了网站采取的技术保护措施,干扰了被爬取方的正常运行。
在“鹰击系统爬取微博数据”案中,“鹰击”系统不仅爬取了微博前台的公开数据,还绕过防范设置爬取了微博后台的非公开数据,并对这些数据进行展示和分析,形成数据分析报告提供给用户。法院认为,该行为干扰了微博平台的正常运行,给微博增加了运营成本,影响了微博经营者对外授权并获得相关收益的能力,构成不正当竞争。与此类似,在实践中还出现了通过“撞库”方式获取经销商数据库的行为,即通过技术手段突破他人数据库的防护措施,非法获取其中存储的数据。
此类行为的违法性认定重点在于:
● 技术手段的侵入性是否通过破坏、绕开或规避技术保护措施而获取数据;
● 数据性质爬取的是否为后台数据、非公开数据或需授权访问的数据;
● 干扰后果是否给被爬取方增加了运营成本或负担,影响其正常经营。
1.3
法律规制路径
对于数据爬取行为,当前法律提供了多种规制路径。《反不正当竞争法》第十三条第二款第四项的兜底条款常被用于规制数据爬取行为,该条款禁止“其他妨碍、破坏其他经营者合法提供的网络产品或者服务正常运行的行为”。此外,《反不正当竞争法》第二条的原则性条款也常作为认定新型数据爬取行为不正当性的法律依据。
在特定情况下,数据爬取行为还可能受到著作权法、商业秘密保护等法律规则的规制。例如,对于具有独创性的数据集合,可以作为汇编作品寻求著作权法保护;对于符合秘密性、价值性并采取了合理保密措施的数据,可以主张商业秘密保护。2024年9月1日起施行的《网络反不正当竞争暂行规定》也为涉数据不正当竞争行为提供了更明确的规制依据。
二、数据封锁行为的竞争法审视
与数据爬取相反,数据封锁行为则表现为平台拒绝向其他经营者开放数据或平台生态,从而排除、限制竞争。这类行为在具有市场支配地位的平台中尤为突出,其主要表现形式和法律分析如下:
2.1
拒绝交易与数据封锁
当平台拒绝向交易相对人提供其掌握的数据资源,且该数据构成其他经营者进入市场或开展竞争所必不可少的要素时,可能构成反垄断法意义上的拒绝交易行为。特别是当平台的数据或平台生态构成“必需设施”时,其拒绝开放的行为可能受到更严格的反垄断审查。
《国务院反垄断委员会关于平台经济领域的反垄断指南》第十四条对平台构成“必需设施”的认定作了相应规定。当平台构成反垄断法上的必需设施时,即具有开放义务,应当以市场竞争秩序为优先考量,不得拒绝相对人合理的交易请求。数据封锁行为可能导致“数据孤岛”,阻碍数据要素的自由流动,抑制行业创新和竞争。
2.2
平台封禁与流量分配权滥用
平台封禁行为泛指禁止竞争对手进入或接入平台的行为或状态,具体表现为拒绝数据爬取、屏蔽竞争对手的内容和链接、下架竞争对手内容或应用、拒绝开放API(应用程序接口)、对竞争对手的操作系统实施不兼容等。这类行为的本质是平台如何合理运用“流量分配权”的问题。
平台封禁行为可能造成的危害包括三类:
● 排他性反竞争效果阻碍竞争平台或其他经营者获得市场机会,抬高其他经营者的成本;
● 自我优待效应平台偏袒自有或关联服务,使竞争者处于不公平竞争状态;
● 消费者福利损害用户被迫留在单一平台生态,减少选择自由,长期可能降低平台创新动机和创新水平。
在认定平台封禁行为的正当性时,需平衡平台自治权与互联网互联互通的基本理念。平台基于保护生态系统完整性、数据安全和个人隐私、知识产权或商业利益保护等理由实施的封禁行为,可能具有一定的合理性。但是,当平台具有市场支配地位时,其封禁行为将受到更严格的反垄断审查。
2.3
法律定性多元性
数据封锁行为可能同时触犯《反垄断法》与《反不正当竞争法》等多个法律规范。根据《反不正当竞争法》第十三条第二款第三项,“恶意不兼容” 被明确列为互联网不正当竞争行为的一种形式。然而,何为“恶意”在实践中存在认定难度,需结合行为目的、市场影响等因素综合判断。
对于不构成垄断的数据封锁行为,《反不正当竞争法》第十三条的“互联网专条”提供了规制路径。特别是该条第二款第四项的兜底条款——“其他妨碍、破坏其他经营者合法提供的网络产品或者服务正常运行的行为”,可为规制数据封锁行为提供法律依据。2022年修订的《反垄断法》新增第九条,强调经营者不得利用数据和算法、技术、资本优势以及平台规则等从事垄断行为,也为规制数据封锁行为提供了更明确的法律依据。
三、反不正当竞争法的适用路径与裁判规则
面对复杂多变的数据竞争行为,司法机关在适用反不正当竞争法时已形成一系列裁判规则和方法,平衡数据保护与流通的多重价值。
3.1
法律适用现状与挑战
当前规制数据不正当竞争行为主要依赖《反不正当竞争法》的一般条款(第二条) 和互联网专条(第十三条)。由于数据爬取和数据封锁行为形式多样,且不断发展变化,法律适用中存在以下挑战:
● 规则原则化大量数据竞争行为依赖于《反不正当竞争法》第二条这一原则性条款和第十三条第二款第四项的兜底条款加以规制,导致司法裁判中存在较大的自由裁量空间;
● 同案不同判由于原则性和兜底性条款的解释空间较大,不同法院对类似事实的判定可能得出不同结论。例如,在字节诉新浪案中,一审法院认为新浪微博在Robots协议中限制字节公司抓取内容的行为构成不正当竞争,而二审法院则认为该行为是企业自主经营权范畴内的正当行为,不构成不正当竞争;
● 技术事实查明困难数据技术的发展日新月异,数据的逻辑、运行原理等专业知识远离一般公众生活,给司法裁判者查明技术事实带来挑战。
3.2
司法裁判规则的创新与发展
面对数据竞争行为的技术性和复杂性,人民法院在个案裁判中积极探索,形成了一系列创新的裁判规则:
● “实质性替代”标准对于数据爬取行为,法院发展出“实质性替代”标准,即如果爬取行为实质性地替代了原平台向用户提供的服务或信息,攫取了原平台的流量和交易机会,则通常认定为不正当竞争;
● “多益平衡”模式在规制数据不正当竞争行为时,法院采用平衡数据市场竞争秩序、其他数据经营者利益以及数据用户权益的“多益平衡”模式。在具体案件中,法院会综合考量经营者利益、消费者利益和公共利益,寻求多元利益的平衡点;
● 平台数据权益的确认与限制:
在腾讯公司诉浙江搜道、杭州聚客公司不正当竞争纠纷案中,法院对网络用户、数据控制主体、第三方平台三者间的数据权益关系进行了积极探索,在区分不同数据类型、平衡各相关方权益关系的基础上。
厘清不同数据权益以及数据主体间的权利边界。这一裁判规则既给予网络平台方数据权益司法保护,也对其权利加以必要限制,以防止其滥用权利侵害用户信息权或形成数据垄断压制其他经营者的自由创新竞争。
表:数据不正当竞争案件中的法律适用条款分析
行为类型 | 主要法律依据 | 认定要点 | 典型案例 |
数据爬取-实质性替代 | 《反不正当竞争法》第13条第2款第4项 | 是否替代原平台功能、攫取流量和交易机会 | 百度地图爬取大众点评案 |
数据爬取-突破技术屏障 | 《反不正当竞争法》第13条第2款第4项 | 是否破坏技术措施、爬取非公开数据 | 鹰击系统爬取微博数据案 |
数据封锁-恶意不兼容 | 《反不正当竞争法》第13条第2款第3项 | 是否主观恶意、对市场竞争的影响 | 平台封禁链接案例 |
数据封锁-拒绝交易 | 《反垄断法》滥用市场支配地位条款 | 数据是否构成必需设施、是否具有正当理由 | 平台数据封锁案例 |
3.3
多元共治体系的构建
数据不正当竞争行为的有效规制需要建立健全政府监管、平台自治、行业自律、社会监督的多元共治体系。2024年5月公布的《网络反不正当竞争暂行规定》为网络反不正当竞争提供了更明确的指引和依据,细化了网络不正当竞争行为的认定标准和处理程序。
在多元共治体系下,不同主体承担不同角色:
● 政府监管部门负责制定规则、监督执法,维护公平竞争市场秩序;
● 平台企业应加强内部合规管理,主动将公平竞争理念融入经营全过程;
● 行业组织可制定行业自律规范,推动行业内部的公平竞争;
● 社会公众和媒体通过社会监督,对数据不正当竞争行为形成舆论压力。
最高人民法院通过发布指导性案例等方式,积极引导各级法院统一裁判标准。例如,在指导性案例263号中,法院明确网络平台提供关联账号服务,经用户授权后转移其在关联网络平台获取的数据,为用户在合理范围内处理该数据提供便利,未扰乱市场竞争秩序的,不构成不正当竞争行为。这类指导性案例为数据流通提供了明确的合法性指引,有助于破除数据自由流动的“壁垒”。
四、数据竞争规制的完善方向
基于对数据爬取和数据封锁行为的分析,以及当前法律适用中面临的挑战,数据竞争规制的完善可从以下几个方面推进:
4.1
细化数据类型化标准与正当性边界
未来立法和司法实践应进一步细化数据爬取和封锁行为的类型化标准,明确各类行为的正当性边界。对于数据爬取行为,可基于数据性质(公开数据与非公开数据)、爬取手段(技术侵入程度)、使用方式(是否实质性替代)等维度建立更精细的认定标准。对于数据封锁行为,则应区分平台规模和市场地位,对具有市场支配地位的平台施加更严格的开放义务。
在判断数据竞争行为的正当性时,可综合考虑以下因素:
● 行为外观的正当性采取的技术手段是否仅为攫取数据、破坏他人竞争优势;
● 行为的社会效果是否促进创新、增加社会福祉,而非通过阻碍他人竞争、扭曲竞争秩序来提升自己的竞争能力;
● 行为的必要性收集、使用企业数据是否超出必要限度,是否存在损害更小的替代方案。
4.2
构建数据权益保护与流通的平衡机制
数据竞争规制的核心在于平衡数据权益保护与数据流通需求。在保护数据权益的同时,也应防止数据垄断和“数据孤岛”的形成。最高人民法院在指导性案例264号中指出,“数据信息具有非排他性。通常而言,对于不属于国家秘密、个人信息和商业秘密的数据信息,应允许自由流动,非因法定事由不应过度管控,以防止形成‘数据壁垒’‘信息封闭’”。
为此,可探索建立数据分级分类保护制度,根据数据的不同类型和敏感程度,设定不同的保护标准和流通规则。对于公共数据,应在保障安全的前提下最大限度促进开放共享;对于企业数据,可在承认和保护数据处理者合法权益的同时,允许合理限度的流通使用;对于个人数据,则应严格遵守《个人信息保护法》的规定,确保个人信息安全。
4.3
强化监管协同与跨部门执法
数据竞争行为往往涉及多个法律领域和监管部门,需要加强监管协同和跨部门执法。《个人信息保护法》《反不正当竞争法》《数据安全法》《反垄断法》等法律在平衡数据保护与数据竞争的关系时均发挥着相应的作用,但不同法律的立法目的和实现路径各有侧重,可能存在法律适用的竞合甚至冲突。
为避免多头监管和监管套利,应建立跨部门协同治理机制,包括常态沟通联络、在线诉调对接、信息资源共享等机制,就规制数据不正当竞争行为形成跨部门协同治理合力。2024年公布的《网络反不正当竞争暂行规定》已在此方面做出积极探索,为网络反不正当竞争提供了更统一的监管框架。
4.4
完善技术治理与算法透明度
随着算法技术在数据收集、分析和使用中的广泛应用,应加强技术治理和算法透明度,防止通过算法实施更隐蔽的数据不正当竞争行为。例如,平台可能通过算法实施算法合谋、价格歧视等行为,这些行为消费者不易察觉,且在具体执法中也由于缺乏必要的主观条件和直接证据,致使竞争执法机关在识别和认定相关行为时难度进一步加大。
为此,可考虑引入算法审计、算法备案等制度,提高算法的透明度和可解释性。对于利用算法实施的数据爬取和数据封锁行为,可要求平台披露算法的基本逻辑和决策规则,以便监管机构和司法机关评估其行为的正当性。
总结
数据爬取与数据封锁作为互联网平台数据竞争的一体两面,其法律规制需在激励创新与维护公平竞争之间寻求精妙平衡。当前法律实践已形成以《反不正当竞争法》为核心,结合《数据安全法》《个人信息保护法》等多法协同的规制体系,司法机关通过个案裁判逐步明确“实质性替代”“多益平衡”等裁判规则。




