Pocket判例教室
网络爬虫行径刑事处罚边界
Pocket发布会
指点老师:黄辰 发布人:许中怡
排版:璩绍筠 校对:李思琪
Part.01
前言
随着科技网络、信息技术发展进程的突飞猛进,咱们已然踏入大数据时代。大数据做为生产资料已然作为各产业的商战资本,商场价值越来越高,人们对数据需要亦越来越大,但由于互联网上的数据信息庞杂,因此呢为满足人们在互联网上有效的完成数据检索的需要,网络爬虫技术应运而生。
华东政法大学张勇教授暗示“技术是中立的,但技术应用永远不是中立的。”网络爬虫做为数据收集环节的一项重要的中立技术,其创建之初是为了帮忙搜索引擎有效收集数据,本身并无好坏之分。然而,有些人在应用爬虫技术的同期附加了行径人自己的主观意志,这使得网络爬虫行径有了善恶之分。人类乱用网络爬虫技术违法爬取网站获取数据来上下互联网行业内竞争格局,诱发市场恶性竞争,造成为了害处后果,亦因此呢落入了刑法的调节范畴,网络爬虫行径在某些状况下亦拥有了刑事危害。现如今,各样利用网络爬虫技术爬取网站数据的行径正处于难以界定其行径性质的灰色地带,引起不正当竞争和数据泄密事件频发,这里背景下,刑法规制恶意的网络爬虫行径是审时度势之举。
Part.02
网络爬虫关联概念
01
网络爬虫
网络爬虫,亦叫作网络设备人或网络蜘蛛,是一种根据必定的规则,经过模拟人(网络用户)的行径,自动且有效地浏览互联网并抓取所需数据的计算机程序。通俗理解,网络爬虫是一个模拟人类用户请求网站行径的程序,按照设定的规则自动请求网页并将数据抓取下来,而后运用必定的规则提取、存储有价值的数据。一般来讲该技术拥有三种基本功能,分别是:拜访、下载、解析。
就纯粹的网络爬虫技术而言,很难说这项技术是善意的技术或恶意的技术,由于其在区别的应用场景下所发挥的功效区别。自1993年12月首个基于爬虫技术的网络搜索引擎——JumpStation诞生之后,网络爬虫技术已被运用了二十余年,之前始终被视为无问题的中立技术,随着做为数据收集环节的一项重要技术的网络爬虫技术的广泛应用,今天已然逐步作为“道德上可疑的并可被视为违法”的技术,并从涉嫌民事违法的技术发展为涉嫌形成刑事犯罪的技术。
02
网络爬虫行径
网络爬虫行径是行径人运用爬虫技术从网站平台上搜索、收集和抓取数据的行径。它并不等同于网络爬虫技术,由于技术本身拥有中立性,无所说好与坏,不触及违法犯罪的问题而网络爬虫行径反映了行径人的主观意志,因此呢存在善意爬虫行径和恶意爬虫行径的界分,爬虫行径是不是违法需要根据详细的应用场景和运用状况进行法律评估。
网络爬虫行径是善意还是恶意,重点从网络爬虫在工作状态下为获取数据而按照爬取规律对服务器实施的一系列行径是不是合法以及数据后续运用行径是不是合法两方面来思虑。在信息爆炸时代,网络爬虫技术渗透在工作生活的方方面面,以各样很难察觉的形式向咱们供给着便利服务。善意爬虫行径例如:“Baiduspider” 间隔不久就会遍布互联网抓取网页数据以供用户运用,不仅促进数据流通与共享,同期亦为各个被扫的网站增多了揭发度和流量。恶意爬虫行径,例如:专门用于抢票的外挂软件类爬虫,据关联报告,12306被爬取次数,最高峰时1天内页面浏览量达 813.4 亿次,1小时最高点击量59.3亿次,平均每秒164.8 万次。又例如,2020年春运时期,12306高峰日网络点击量高达1495亿次,对网站的守护和正常运行造成为了严重威胁。恶意爬虫行径不仅威胁个人信息、知识产权等数据安全,还对计算机系统安全、社会公共秩序、国家安全造成为了严重影响。
百度蜘蛛每日会在海量的互联网信息中进行爬取,爬取优秀信息并收录,当用户在百度搜索引擎上检索对应关键词时,百度将对关键词进行分析处理,从收录的网页中找出关联网页,根据必定的排名规则进行排序并将结果展现给用户。
03
“Robots”协议
“Robots”协议(亦叫作为爬虫协议、设备人协议等)的全叫作是“网络爬虫排除标准”(Robots Exclusion Protocol),“Robots”协议是网站所有者提示网络爬虫准许爬取的数据范围和数据种类的公开声明文件。简言之,网站经过Robots协议告诉搜索引擎那些页面能够抓取,那些页面不可抓。
Part.03
网络爬虫行径司法规制动向
从上表2014年至2022年网络爬虫涉刑案件数据统计图能够看出,网络爬虫涉刑案件的数量相较于以前已然显著增加。从关联案件的判决书推断,对此种行径的规制路径亦从民法逐步向刑法挨近。这足以说明,恶意爬取数据导致被害人经济利益受损的害处结果,已然超出不正当竞争法的规制范畴,进入到刑法规制的行业,其社会害处性亦不问可知。因此呢,在对关联案件进行刑事危害的评估时,更加注重考量此类行径的社会害处性与刑事违法性。
04
网络爬虫行径的刑事处罚边界
(一)网络爬虫行径的立法守护
随着数字经济的发展,近年来我国制定并完善了一系列的网络安全法律法规守护网络安全与数据安全,为网络爬虫行径划定了严格的法律边界。如《网络安全法》第44条:任何个人和组织不得窃取或以其他违法方式获取个人信息。《民法典》第111条:自然人的个人信息受法律守护。任何组织和个人需要获取他人个人信息的,应当依法取得并保证信息安全,不得违法收集、运用、加工、传输他人个人信息,不得违法买卖、供给或公开他人个人信息。《刑法》设立了违法侵入计算机信息系统罪、侵犯百姓个人信息罪、违法获取计算机信息系统数据罪、侵犯商场奥密罪等罪名规制恶意网络爬虫行径。
现如今,网络爬虫已经是互联网企业采集数据的重要技术之一,刑法在严厉打击恶意网络爬虫行径的同期,亦为数据流动、数据共享创造了法律阻碍与技术壁垒。从“上海晟品机构违法抓取视频数据案”做为全国首例网络爬虫入刑之后,再到“魔蝎机构侵犯百姓个人信息案”,再到“快啊答题”侵入腾讯机构服务器案,可以看出我国立法及司法对数据抓取的规制日趋严厉,几个经典案例几乎给网络爬虫打上了“犯罪嫌疑人”的烙印。恶意网络爬虫行径处罚范围欠妥扩大,既有害于爬虫技术发展、网络数据共享与最大化利用,亦与互联网的公益性质不相符合,处罚范围欠妥缩小,则会助长恶意网络爬虫行径的出现。因此呢,怎样有效知道越界网络爬虫行径的刑事处罚边界,需进一步科研。
(二)网络爬虫行径的处罚困难
虽然,《网络安全法》《个人信息守护法》《反不正当竞争法》《刑法》等都经过立法对网络安全、数据安全进行了守护,可针对何种爬虫行径只承担民事责任,何种程度的爬虫行径形成刑事犯罪的问题并未得到知道解答。由此,学界针对网络爬虫行径的处罚边界展开了讨论,主要聚焦于应否对被抓取数据进行类型化分析以及应否对抓取数据的行径特征进行类型化分析。笔者认为,对被抓取数据进行类型化分析与对抓取数据的行径特征进行类型化分析能够清晰网络爬虫行径对所守护的法益的侵害程度,从而知道恶意网络爬虫行径的民事责任与刑事责任的界限。
(三)网络爬虫行径与数据的类型化分析
1.被抓取数据的类型化
互联网上的数据并非都是公开所有人均可随意运用的,部分网站的数据为普通数据,数据所有方并未限制浏览者抓取、运用;部分网站数据则为非普通数据,数据所有方限制或禁止浏览者抓取、运用。网络爬虫抓取区别类型的数据,对法益的侵害程度亦区别。
(1)抓取、运用公开的普通数据
网络爬虫行径抓取此类数据,因为数据所有方将数据公开并不采取相应的“反爬取”“限制运用”“反爬取办法”,应当能够预见到此类数据会被浏览者抓取、运用,能够认为数据所有方已然默许浏览者抓取、运用。并且此类数据属于普通数据,随意抓取、运用不仅不会导致严重的害处后果,况且有利于数据流通,打破信息壁垒,实现数据共享,促进科技进步,因此抓取、使用公开的普通数据通常不拥有违法性。
(2)抓取、运用公开但限制另行运用数据,按照其社会害处性体积分别进行民事、行政、刑事处罚。
虽然爬虫技术本身属于中立的技术手段,但一旦运用欠妥,将面临被认定为不正当竞争的危害。在网络爬虫入刑之前,爬虫行径爬取公开但限制另行运用数据被认定为不正当竞争行径的状况占多数,当前司法实践关于爬虫行径的反不正当竞争法规制,重点集中在《反不正当竞争法》第二条第二款规定的“通常不正当竞争行径”及第十二条规定的“特殊不正当竞争行径”两类。
经过对往年爬虫行径诱发的不正当纠纷案件进行分析,笔者认为,若拥有竞争关系的涉案双方利用网络爬虫爬取公开然则另行运用的数据,以至被爬取方遭受损失,属于《反不正当竞争法》规定的不正当竞争行径,则只需承担民事责任或行政责任就可。针对以恰当正当技术手段爬取公开数据,未对被爬取方平台服务器导致很强压力,且爬取后非直接聚合呈现于自己平台而需转至原被爬取平台的行径而言,通常不属于不正当竞争。
然则,若爬虫行径符合犯罪形成要件,拥有严重社会害处性时,则可能需要承担刑事责任。例如网络爬虫进入计算机信息系统,获取受到守护或不予公开的个人信息行径,则可能形成刑法第253条之一侵犯百姓个人信息罪。互联网时代,为了存活与交流,并不是所有的百姓个人信息不被公开,非常多百姓个人信息都是公开在网站上准许查找的,然则因为该类信息拥有很强的人身依附性,一旦被随意抓取、运用,会导致严重的害处后果,因此,此种行径是应当受到刑事处罚的。网络爬虫行径获取受到守护,不准许随意复制、储存、传播的数据,可能形成侵犯著作权罪。针对平台数据而言,无论是网页还是里面的照片、文字、视频,其本身就拥有独创性,虽然都数状况下此类数据处在公开状态,大众能够随意浏览,网络爬虫获取数据亦是经过公开的搜索引擎,但这并不表率能够随意对此类数据进行复制、储存、传播,若未经著作权人许可,抓取此类数据后进行运用或经过网络公开传播,有可能会形成侵犯著作权罪。网络爬虫抓取公开的数据后,利用所抓取数据进行诈骗、盗窃、传播淫秽物品的,则有可能形成诈骗罪、盗窃罪、传播淫秽物品罪。
(3)抓取、运用采取守护办法进行保密的数据
网络爬虫抓取、运用采取守护办法进行保密的数据所触及的刑事危害较高。数据所有方对数据采取了保密办法,则说明此类数据拥有“保密性”,随意抓取、运用的害处程度很强,仅对其进行民事、行政处罚不足以遏制此类行径的出现,亦不可弥补网络爬虫行径对数据所有方带来的害处,因此呢抓取、运用此类数据形成刑事犯罪的危害较高。例如:商场奥密的运用针对技术的进步、企业的发展至关重要,若商场奥密泄密可能会给企业带来灭顶之灾。因此呢,刑法第219条专门设立侵犯商场奥密罪来守护商场奥密权利人所享有的商场奥密权和国家正常的市场经济秩序,网络爬虫在未经授权或超越授权抓取拥有商场奥密属性的数据时,可能形成侵犯商场奥密罪。国家奥密关系国家的安全和利益,是采取守护办法进行保密,在一按时间内只限必定范围的人员知悉,不准许被外人知晓的数据。刑法第282条设立违法获取国家奥密罪来守护国家奥密的安全和国家保密制度,网络爬虫避开或突破守护办法获取国家奥密,则可能会形成违法获取国家奥密罪。
2.抓取数据的行径特征的类型化
经过对司法案例的分析与刑法罪名形成要件的梳理,司法实践对网络爬虫行径常常采取拥有主观故意和客观违法行径而予以入罪的规制路径。只要符合主观上的恶意与客观违法即行径人违反“robots”协议利用爬虫抓取数据或绕过反爬虫办法抓取数据,则形成犯罪。由此来看,笔者认为判断主观上是不是为恶意能够按照网络爬虫在工作状态下为获取数据而按照爬取规律对服务器实施的一系列行径、所抓取的“数据”的类型以及数据后续运用行径是不是“明知”以及对网络爬虫行径所导致的后果的心理态度,而知道越界网络爬虫行径的刑事处罚边界关键在于知道界定“客观违法”行径。按照往年司法实践来看,网络爬虫行径客观违法重点表现为未经授权或超越授权,以及避开或突破“反爬办法”抓取数据。
(1)未经授权或超越授权
现如今,数据已然作为人们生活、工作的重要构成部分,按照我国关联法律法规,对他人的数据进行未经授权或超越授权的抓取、采集、复制或传播可能触及侵害他人的隐私权、商场奥密等,以及违反著作权法、计算机信息网络安全守护法等法律法规。这些行径可能引起法律责任和纠纷。因此呢,在进行数据抓取时,必须事先得到关联主体的知道授权或遵守关联法律法规与约定,并保证不侵犯他人的合法权益。值得重视的是,互联网上的数据并非公开所有人都能够随意运用的,每一个网站或应用程序都有自己的数据运用政策和服务条款。倘若需要运用特定网站或应用程序的数据,要先阅读并遵守其关联政策和条款,或与相应的数据供给方进行沟通与授权。
《民法典》第140条:行径人能够明示或默示作出意思暗示。沉默仅有在有法律规定、当事人约定或符合当事人之间的交易习惯时,才能够视为意思暗示。可见意思暗示的方式有明示、默示、沉默。相应的,授权能够分为明示授权和默示授权。明示,便是行径人以做为的方式使得相对人能够直接认识到意思表示的内容,拥有直接、知道、很难产生纠纷等特征。默示,与明示相对的一种意思暗示的表达方式,指的是行径人虽无以语言或文字等明示方式作出意思暗示,但以行径的方式作出了意思暗示。其虽强调的是“默”,但仍然是“示”,可经过行径来推定、认定出行径人意思暗示的内容。
网络爬虫行径是不是未经授权或超越授权,重点是看数据掌控方或数据所有方有没有经过明示的方式暗示授予数据需要方以拜访数据的权限,或数据掌控方或数据所有方有没有经过默示的方式的授权数据需要方以拜访数据的权限。数据掌控方授权拜访数据的方式中,前者包含警告、弹窗、用户协议、服务条款、权责声明等。例如平常生活中进入某一网站拜访数据,数据需要方需要对运用条款进行阅读并勾选保证数据需要方已知晓,否则没法拜访数据,显示数据所有方授权数据拜访者拜访数据的意愿。后者比较典型的是“Robots”协议。“Robots”协议是网站所有者提示网络爬虫准许爬取的数据范围和数据种类的公开声明文件,针对“Robots”协议中规定的数据范围和数据种类,数据所有方已然默许网络爬虫能够随意抓取、运用,无需数据需要方在拜访数据之前再去得到数据所有方的明示授权。日前,数据掌控方基本上采用的是明示授权的办法防止网络爬虫随意拜访、爬取、运用本网站数据以守护自己权益。
值得重视的是,针对数据所有方并未明示授权网络爬虫能够爬取某些数据且“Robots”协议亦并未规定的状况下,是不是等同于区别意?针对这个问题,笔者认为,若数据所有方并未明示授权网络爬虫能够爬取某些数据且“Robots”协议亦并未规定,网络爬虫是能够拜访、爬取此类数据,然则在后续的运用过程中要小心运用,只能用于有利于数据的流通与共享,不可利用这些数据进行违法犯罪活动。数据所有方无明示授权并不是显示区别意网络爬虫爬取此类数据。首要,数据所有方认为在如今数据爆炸的时代,只需要针对比较重要或网络爬虫随意爬取可能导致严重后果的数据进行明示授权就可,倘若要对所有数据进行一一授权,不仅数据所有方的工作量庞大,况且亦不拥有可操作性。其次,“Robots”协议只是通常性规定,不可能涵盖所有明示授权以外的数据类型,因此并不可以“Robots”协议并未规定某些数据的理由就排除默示授权。最后,大数据时代,数据的流通与共享关乎人类的存活与发展,出于数据流通与共享的思虑,针对网络爬虫爬取数据不可太苛刻,应当准许数据所有方经过默示的方式授权数据需要方获取普通数据。
另外,“针对‘未经授权’或‘超越授权’不可仅作形式判断,还需要结合被抓取的数据类型来进行实质违法性判断,考察网络爬虫抓取数据行径对法益的侵害或威胁是不是达到刑事可罚的程度。”倘若数据需要方未经授权或超越授权,并未引起数据所有方遭受重大损失或导致重大不良影响或其他严重后果,并未达到刑事可罚的程度,仅对其进行民事或行政处罚就可,仅有当网络爬虫行径对法益的侵害或威胁达到刑事可罚的程度,才对其进行刑事处罚。
(2)避开或突破“反爬办法”
“反爬办法”指的是对网络爬虫设置阻碍,监控并防止网络爬虫肆意抓取数据的有些办法。数据所有方设置“反爬办法”目的在于守护其数据资源的安全和合法性,防止数据需要方爬取保密的数据或未经授权爬取其他重要数据。反爬办法能够有效地限制对数据的违法获取和乱用行径,保证数据的靠谱性和完整性。另外,反爬办法还能够防止恶意抓取、批量下载和频繁请求等行径对服务器的过载导致影响,加强网站的运行效率和稳定性。经过设置反爬办法,数据所有方能够更好地管理和掌控数据的运用范围,守护数据的权益和利益。
网络爬虫行径是不是避开或突破“反爬办法”,关键知道“反爬办法”的方式。反爬虫办法平常的有文本混淆、页面动态渲染、验证码校验、请求签名校验、大数据风控、js混淆和蜜罐等。生活中最平常的反爬虫手段是验证码反爬虫,此种反爬办法指的是当在用户注册和登录时或网站拜访频率过高或行径反常时,会弹出验证码让用户进行识别,以保证该操做为人类行径,以防止网络爬虫肆意爬取数据。种种反爬措施都旨在守护网络安全和数据安全,而网络爬虫避开或突破“反爬办法”的行径显然已然严重害处到网络秩序和数据所有方的权益。按照《刑法》规定,只要实施违反国家规定,侵入国家事务、国防事务、国防建设、尖端科学技术行业的计算机信息系统的行径就形成违法侵入计算机信息系统罪,而侵入国家事务、国防事务、国防建设、尖端科学技术行业以外的计算机信息系统的行径,则有可能形成破坏计算机信息系统罪、违法获取计算机信息系统数据罪等。
Part.05
结语
回顾网络爬虫行径的法律规制历程,过去网络爬虫行径常常被视为企业间不正当竞争的手段之一,而仅采用民法进行规制。随着网络爬虫行径的社会害处性的加重,从民事侵权逐步过渡到刑法处罚,恶意爬取数据导致的害处结果,已然超出不正当竞争法的规制范畴,进入到刑法规制的行业。网络爬虫行径的入刑亦同期暗示刑法乱用的危害亦随之升高,针对以上网络爬虫行径所包含的刑事危害,笔者认为应按照网络爬虫行径类型和所爬取的数据类型两方面来清晰网络爬虫行径对所守护的法益的侵害程度,针对尚未达到严重的社会害处性的法益侵害行径应当仅适用民法、行政法予以规制,针对已然达到严重的社会害处性的法益侵害行径要严格遵守罪刑法定原则适用刑法予以规制。过度限制网络爬虫行径会为数据流通创造了法律阻碍与技术壁垒,有害于数据共享与利用,刑法做为一部保证法,应当秉持刑法谦抑性的精神,能用民法、行政法等其他分部法进行规制的,则刑法不介入,将刑事处罚做为恶意网络爬虫行径法律规制的最后一道防线。
参考文献
【1】刘艳红,杨志琼.网络爬虫的入罪标准与路径科研[J].人民检察,2020,(15):26-31.
【2】杨志琼.数据时代网络爬虫的刑法规制[J].比较法科研,2020,(04):185-200.
【3】杨志琼.我国数据犯罪的司法困境与出路:以数据安全法益为中心[J].环球法律评论,2019,41(06):151-171.
【4】刘宪权,石雄.网络数据犯罪刑法规制体系的构建[J].法治科研,2021,(06):44-55.
【5】刘艳红.网络爬虫行径的刑事规制科研——以侵犯百姓个人信息犯罪为视角[J].政治与法律,2019(11):16-29.
【6】石经海,苏桑妮.爬取公开数据行径的刑法规制误区与匡正——从全国首例“爬虫”入刑案切入[J].北京理工大学学报(社会科学版),2021,23(04):154-164+172.
【7】张勇.数据安全归类分级的刑法守护[J].法治科研,2021,(03):17-27.
扫码关注咱们
Pocket判例教室
运营主体:花萼相辉团队
联系邮箱:huangchenwwf@qq.com
|