本文字?jǐn)?shù):3277,閱讀時(shí)長(zhǎng)約10分鐘
文 |王瓊飛
編輯 | 魯偉
步入大數(shù)據(jù)時(shí)代,網(wǎng)絡(luò)爬蟲(chóng)由網(wǎng)頁(yè)爬取“進(jìn)化”到數(shù)據(jù)爬取,尤其隨著大數(shù)據(jù)應(yīng)用加速,數(shù)據(jù)的價(jià)值極具增加,并成為市場(chǎng)競(jìng)爭(zhēng)的重要資源,惡意爬蟲(chóng)爬取數(shù)據(jù)案件也在頻繁發(fā)生。
據(jù)不完全統(tǒng)計(jì),自2016年至今,涉及網(wǎng)絡(luò)爬蟲(chóng)的司法案件多達(dá)十余起,其中民事案件居多,包括2016年“車來(lái)了”APP爬取“酷米客”APP公交車行駛實(shí)時(shí)數(shù)據(jù)案、2017年脈脈非法抓取使用新浪微博用戶信息案、2017年今日頭條未經(jīng)授權(quán)移植新浪微博大V賬號(hào)內(nèi)容數(shù)據(jù)案、2019年刷寶APP爬取抖音APP短視頻及用戶評(píng)論數(shù)據(jù)案、2021年“極致了”網(wǎng)站爬取微信公眾號(hào)文章數(shù)據(jù)案等。
除了民事案件,因爬取個(gè)人信息數(shù)據(jù)涉及的刑事案件也呈增多趨勢(shì),其中不乏數(shù)億級(jí)別的數(shù)據(jù)被爬取案件。比如,2021年6月,河南省商丘市睢陽(yáng)區(qū)人民法院公布的刑事判決書(shū)顯示,逯某和黎某兩男子通過(guò)自己開(kāi)發(fā)的爬蟲(chóng)軟件,對(duì)淘寶實(shí)施了長(zhǎng)達(dá)8個(gè)月的數(shù)據(jù)爬取,非法獲取近12億條用戶消息。
原本技術(shù)中立的“網(wǎng)絡(luò)爬蟲(chóng)”卻因應(yīng)用于數(shù)據(jù)爬取,有變成“害蟲(chóng)”的威脅。惡意爬蟲(chóng)在輕易爬取數(shù)據(jù)時(shí),未經(jīng)授權(quán)抓取、突破Robots協(xié)議、同行業(yè)間數(shù)據(jù)爬取,往往是典型情形。網(wǎng)絡(luò)爬蟲(chóng)的法律邊界在哪里?數(shù)據(jù)企業(yè)如何保護(hù)自身合法權(quán)益?如何規(guī)制惡意爬蟲(chóng)抓取數(shù)據(jù)亂象,引導(dǎo)行業(yè)合規(guī)健康發(fā)展?這是已經(jīng)進(jìn)入大數(shù)據(jù)時(shí)代后,行業(yè)參與者亟待解答的問(wèn)題。
01
未經(jīng)授權(quán)爬取數(shù)據(jù)涉嫌不正當(dāng)競(jìng)爭(zhēng)
政策加持讓數(shù)據(jù)迎來(lái)高光時(shí)刻。2020年4月9日,《中共中央國(guó)務(wù)院關(guān)于構(gòu)建更加完善的要素市場(chǎng)化配置體制機(jī)制的意見(jiàn)》正式發(fā)布,將數(shù)據(jù)作為一種新型生產(chǎn)要素。
然而,涉及數(shù)據(jù)權(quán)利的配套制度法規(guī)還未出臺(tái),非法數(shù)據(jù)爬蟲(chóng)已經(jīng)襲來(lái)。2014年,因認(rèn)為脈脈未經(jīng)用戶允許和微博平臺(tái)授權(quán),非法抓取、使用新浪微博用戶信息,非法獲取并使用脈脈注冊(cè)用戶手機(jī)通訊錄聯(lián)系人與微博用戶的對(duì)應(yīng)關(guān)系,新浪微博將脈脈訴至法院。該案也被稱為首例大數(shù)據(jù)不正當(dāng)競(jìng)爭(zhēng)糾紛案。
2016年,北京市海淀區(qū)人民法院(下稱“北京海淀法院”)一審認(rèn)為,網(wǎng)絡(luò)平臺(tái)可以就他人未經(jīng)許可擅自使用其經(jīng)過(guò)用戶同意收集并使用的用戶數(shù)據(jù)信息主張權(quán)利。2017年,北京知識(shí)產(chǎn)權(quán)法院終審認(rèn)定,脈脈未經(jīng)用戶允許和微博平臺(tái)授權(quán),非法抓取、使用新浪微博用戶信息,構(gòu)成不正當(dāng)競(jìng)爭(zhēng)。
未經(jīng)授權(quán)和超出授權(quán)范圍使用成為上述案件判決的重要考量因素。北京知識(shí)產(chǎn)權(quán)法院認(rèn)為,作為第三方開(kāi)發(fā)者通過(guò)Open API獲得用戶信息時(shí)必須遵循“用戶授權(quán)+平臺(tái)授權(quán)+用戶授權(quán)”,即用戶同意平臺(tái)向第三方提供信息,平臺(tái)授權(quán)第三方獲取信息,用戶再次授權(quán)第三方使用信息,而且用戶的同意必須是具體的、清晰的,是用戶在充分知情的前提下自由作出的決定。這也被行業(yè)稱為“三重授權(quán)原則”。
“三重授權(quán)原則”對(duì)后續(xù)案件影響重大,并成為第三方爬取、使用數(shù)據(jù)的大前提。然而,惡意爬蟲(chóng)往往越過(guò)紅線?,F(xiàn)實(shí)中,數(shù)據(jù)爬取多發(fā)生在電商領(lǐng)域和內(nèi)容平臺(tái),以內(nèi)容平臺(tái)為例,2021年9月,杭州互聯(lián)網(wǎng)法院審理斯氏(杭州)新媒體科技有限公司(下稱“斯氏公司”)爬取微信公眾號(hào)平臺(tái)數(shù)據(jù)案時(shí)認(rèn)為,斯氏公司運(yùn)營(yíng)的“極致了”網(wǎng)站違背誠(chéng)實(shí)信用原則,擅自使用其他經(jīng)營(yíng)者征得用戶同意、依法匯集且具有商業(yè)價(jià)值的數(shù)據(jù),構(gòu)成不正當(dāng)競(jìng)爭(zhēng)。
尤其在數(shù)字內(nèi)容領(lǐng)域,數(shù)據(jù)是內(nèi)容產(chǎn)業(yè)的核心競(jìng)爭(zhēng)資源,內(nèi)容平臺(tái)經(jīng)過(guò)匯總分析處理后的數(shù)據(jù)往往具有極高的經(jīng)濟(jì)價(jià)值。如果要求內(nèi)容平臺(tái)經(jīng)營(yíng)者將其核心競(jìng)爭(zhēng)資源向競(jìng)爭(zhēng)對(duì)手無(wú)限開(kāi)放,不僅損害創(chuàng)作者的創(chuàng)作環(huán)境,使得社會(huì)整體內(nèi)容生產(chǎn)萎靡,消費(fèi)者對(duì)優(yōu)質(zhì)內(nèi)容的需求也就無(wú)從保障,而且有違“互聯(lián)互通”的精神實(shí)質(zhì),不利于優(yōu)質(zhì)內(nèi)容的不斷更迭和互聯(lián)網(wǎng)產(chǎn)業(yè)的持續(xù)發(fā)展。
02
突破Robots協(xié)議違背商業(yè)道德
在涉及網(wǎng)絡(luò)爬蟲(chóng)的案件中,Robots協(xié)議是繞不開(kāi)的話題。Robots協(xié)議的全稱是“網(wǎng)絡(luò)爬蟲(chóng)排除標(biāo)準(zhǔn)”,網(wǎng)站通過(guò)Robots協(xié)議明確警示搜索引擎哪些頁(yè)面可以爬取,哪些頁(yè)面不能爬取,類似于行業(yè)的“君子協(xié)定”。
按照Robots協(xié)議規(guī)則,搜索引擎會(huì)按照每個(gè)網(wǎng)站主給予自己的權(quán)限來(lái)抓取。實(shí)踐中可以發(fā)現(xiàn),通過(guò)百度搜索引擎無(wú)法搜索到淘寶網(wǎng)的信息,可以搜索到京東商城的商品信息,原因是2008年淘寶禁止百度爬蟲(chóng),而京東商城則沒(méi)有對(duì)百度爬蟲(chóng)說(shuō)“不”。這其中的原因,和淘寶、京東的流量入口選擇和商業(yè)利益考量密切有關(guān)。
淘寶網(wǎng)禁止百度爬蟲(chóng)Baiduspider訪問(wèn)自己網(wǎng)站
但Robots協(xié)議并非強(qiáng)制性規(guī)定,在商業(yè)利益驅(qū)動(dòng)下,網(wǎng)絡(luò)爬蟲(chóng)與反爬取方之間更像是一場(chǎng)攻防戰(zhàn),一些網(wǎng)絡(luò)平臺(tái)的惡意爬蟲(chóng)不惜冒著風(fēng)險(xiǎn)主動(dòng)出擊,突破Robots協(xié)議,而被爬取方只能在技術(shù)上被動(dòng)防守,并通過(guò)求助司法訴訟主動(dòng)維權(quán)。
在這場(chǎng)攻防戰(zhàn)中,也不乏互聯(lián)網(wǎng)領(lǐng)域知名企業(yè)的身影,其中,新浪微博和今日頭條間的矛盾沖突就不止一次出現(xiàn)。
2017年,因認(rèn)為今日頭條未經(jīng)授權(quán)抓取新浪微博賬號(hào)內(nèi)容,新浪微博將今日頭條訴至法院。2021年5月17日,該不正當(dāng)競(jìng)爭(zhēng)糾紛案落槌,北京海淀法院一審判定,未獲平臺(tái)授權(quán)第三方不得抓取用戶內(nèi)容,今日頭條的母公司字節(jié)跳動(dòng)通過(guò)類似“復(fù)制粘貼”的方式對(duì)新浪微博內(nèi)容進(jìn)行大規(guī)模移植,有針對(duì)性地將新浪微博的內(nèi)容移植至今日頭條,構(gòu)成不正當(dāng)競(jìng)爭(zhēng),賠償新浪微博2000萬(wàn)元。
字節(jié)跳動(dòng)轉(zhuǎn)而起訴新浪微博通過(guò)Robots協(xié)議禁止頭條搜索的爬蟲(chóng),構(gòu)成不正當(dāng)競(jìng)爭(zhēng)。該案經(jīng)歷一審敗訴,二審反轉(zhuǎn)的劇情。2021年10月8日,北京市高級(jí)人民法院終審認(rèn)為,網(wǎng)絡(luò)平臺(tái)通過(guò)Robots協(xié)議對(duì)網(wǎng)絡(luò)爬蟲(chóng)進(jìn)行限制是網(wǎng)絡(luò)經(jīng)營(yíng)者經(jīng)營(yíng)自主權(quán)的一種體現(xiàn)。Robots協(xié)議在某種意義上已經(jīng)成為維系企業(yè)核心競(jìng)爭(zhēng)力,維系市場(chǎng)有序競(jìng)爭(zhēng)的一種手段,應(yīng)當(dāng)允許網(wǎng)站經(jīng)營(yíng)者通過(guò)Robots協(xié)議對(duì)其他網(wǎng)絡(luò)機(jī)器人的抓取進(jìn)行限制。
值得一提的是,通過(guò)Robots協(xié)議對(duì)網(wǎng)絡(luò)爬蟲(chóng)進(jìn)行限制并不違背互聯(lián)網(wǎng)行業(yè)的商業(yè)道德。在互聯(lián)網(wǎng)行業(yè)中,除了新浪微博通過(guò)Robots協(xié)議限制爬蟲(chóng)抓取,包括字節(jié)跳動(dòng)在內(nèi)的互聯(lián)網(wǎng)公司均會(huì)通過(guò)Robots協(xié)議來(lái)明示禁止抓取的內(nèi)容。
03
司法裁判指導(dǎo)數(shù)據(jù)合規(guī)
非法爬取數(shù)據(jù)案件背后,惡意爬蟲(chóng)所建立的數(shù)據(jù)服務(wù)往往與被爬取方形成直接的競(jìng)爭(zhēng)關(guān)系,甚至形成某種替代關(guān)系。
法院在案件裁判中也明確,互聯(lián)網(wǎng)領(lǐng)域中消費(fèi)者福利的增加,不是通過(guò)數(shù)據(jù)爬取對(duì)數(shù)據(jù)進(jìn)行明顯替代性或同質(zhì)化地利用。非法爬蟲(chóng)不勞而獲地爬取數(shù)據(jù),獲得競(jìng)爭(zhēng)權(quán)益等行為,顯然具有“搭便車”的不正當(dāng)性。比如,在“極致了”網(wǎng)站爬取微信公眾號(hào)數(shù)據(jù)案中,法院認(rèn)定,“極致了”網(wǎng)站違背誠(chéng)實(shí)信用原則,擅自使用其他經(jīng)營(yíng)者征得用戶同意、依法匯集且具有商業(yè)價(jià)值的數(shù)據(jù),并實(shí)質(zhì)性替代其他經(jīng)營(yíng)者提供的部分產(chǎn)品或服務(wù),損害公平競(jìng)爭(zhēng)的市場(chǎng)秩序。
同時(shí),法院在認(rèn)定數(shù)據(jù)企業(yè)享有數(shù)據(jù)競(jìng)爭(zhēng)權(quán)益時(shí),也把數(shù)據(jù)企業(yè)對(duì)收集、整理時(shí)付出的人力物力財(cái)力等經(jīng)營(yíng)成本作為重要考慮因素。比如,在抖音起訴刷寶爬取數(shù)據(jù)案件中,法院認(rèn)為,微播公司(抖音APP的開(kāi)發(fā)者和運(yùn)營(yíng)者)投入相應(yīng)的人力、財(cái)力成本,通過(guò)正當(dāng)合法的經(jīng)營(yíng)積累用戶和短視頻內(nèi)容。刷寶APP在未投入相應(yīng)成本的情況下,直接獲取視頻資源、評(píng)論內(nèi)容,掠奪微播公司的經(jīng)營(yíng)成果,損害了抖音的合法權(quán)益,構(gòu)成不正當(dāng)競(jìng)爭(zhēng)。
研讀案件裁判思路不難發(fā)現(xiàn),當(dāng)數(shù)據(jù)企業(yè)面臨未經(jīng)授權(quán)的惡意爬取時(shí),司法機(jī)關(guān)也在不斷探索數(shù)據(jù)權(quán)益保護(hù)路徑,定紛止?fàn)帯T谝延械乃痉ㄅ袥Q中,法院對(duì)數(shù)據(jù)企業(yè)所享有的正當(dāng)權(quán)益持肯定態(tài)度。數(shù)據(jù)企業(yè)的數(shù)據(jù)權(quán)利在遭受他人侵害時(shí)有權(quán)要求侵權(quán)人承擔(dān)侵權(quán)責(zé)任,包括在他人未經(jīng)許可而竊取數(shù)據(jù)時(shí),有權(quán)要求侵權(quán)人停止侵害、刪除非法竊取的數(shù)據(jù);在侵權(quán)人因故意或過(guò)失造成損害時(shí),有權(quán)要求侵權(quán)人承擔(dān)侵權(quán)賠償責(zé)任。
此外,從市場(chǎng)經(jīng)濟(jì)發(fā)展的角度來(lái)看,如果數(shù)據(jù)從業(yè)者尤其是數(shù)據(jù)企業(yè)對(duì)于自己收集、存儲(chǔ)的數(shù)據(jù)無(wú)法合理有效地控制,爬蟲(chóng)可以任由抓取,來(lái)去自如,數(shù)據(jù)企業(yè)顯然就沒(méi)有動(dòng)力投入成本去收集、存儲(chǔ)以及利用海量數(shù)據(jù),進(jìn)而挖掘數(shù)據(jù)中蘊(yùn)涵的巨大價(jià)值,更不可能研發(fā)更多的數(shù)據(jù)產(chǎn)品,數(shù)據(jù)產(chǎn)業(yè)的發(fā)展與大數(shù)據(jù)時(shí)代也就無(wú)從談起。
當(dāng)前,雖然法律尚未對(duì)數(shù)據(jù)權(quán)利進(jìn)行界定,但司法實(shí)踐中日漸增多的行業(yè)案例,其中,數(shù)據(jù)“權(quán)利”或“權(quán)益”并非完全無(wú)法界定,“用權(quán)”的合法事實(shí)和情景,“授權(quán)”鏈條相對(duì)清晰,且已經(jīng)得到相當(dāng)程度認(rèn)可,尤其是司法審判對(duì)于數(shù)據(jù)權(quán)利部分的探索和認(rèn)定,將對(duì)指導(dǎo)數(shù)據(jù)企業(yè)開(kāi)展數(shù)據(jù)合規(guī)提供諸多參考和借鑒。
作者為浙江墾丁律師事務(wù)所創(chuàng)始合伙人、浙江省法學(xué)會(huì)競(jìng)爭(zhēng)法學(xué)研究會(huì)理事
關(guān)鍵詞: 數(shù)據(jù) robots 爬蟲(chóng) 用戶 網(wǎng)絡(luò)爬蟲(chóng) 惡意 案件 協(xié)議 司法 經(jīng)營(yíng)者
網(wǎng)站首頁(yè) |網(wǎng)站簡(jiǎn)介 | 關(guān)于我們 | 廣告業(yè)務(wù) | 投稿信箱
Copyright © 2000-2020 hngelin.com All Rights Reserved.
中國(guó)網(wǎng)絡(luò)消費(fèi)網(wǎng) 版權(quán)所有 未經(jīng)書(shū)面授權(quán) 不得復(fù)制或建立鏡像
聯(lián)系郵箱:920 891 263@qq.com
长泰县| 富蕴县| 荣成市| 平原县| 思茅市| 玉溪市| 织金县| 大冶市| 台湾省| 拜城县| 穆棱市| 乡城县| 崇文区| 阳高县| 武胜县| 富川| 阳谷县| 凭祥市| 洛浦县| 东乌| 荆州市| 韶山市| 清丰县| 兴宁市| 广水市| 孙吴县| 本溪市| 黄骅市| 青川县| 磐安县| 永年县| 华容县| 长乐市| 铜川市| 象山县| 民县| 喜德县| 义乌市| 郓城县| 桓台县| 宁都县|