“爬蟲(chóng)”濫用成害蟲(chóng):搬點(diǎn)評(píng)、搶車票、扒隱私……
“爬蟲(chóng)”濫用成害蟲(chóng):搬點(diǎn)評(píng)、搶車票、扒隱私……近日,有自媒體披露在線旅游網(wǎng)站馬蜂窩旅游網(wǎng)涉及產(chǎn)品點(diǎn)評(píng)抄襲甚至作假行為。馬蜂窩回應(yīng)表示,將針對(duì)審查漏洞采取積極改進(jìn)措施,但對(duì)于歪曲事實(shí)的言論和已被查證的有組織攻擊行為將采取法律手段維護(hù)自身權(quán)益。民事訴訟事件有待司法機(jī)關(guān)調(diào)查,但業(yè)內(nèi)人士表示,這一事件折射出技術(shù)倫理和法律問(wèn)題。
記者調(diào)查發(fā)現(xiàn),近5年,互聯(lián)網(wǎng)行業(yè)中用戶生產(chǎn)內(nèi)容平臺(tái)(UGC)中數(shù)據(jù)造假情況長(zhǎng)期存在,尤其是網(wǎng)絡(luò)“爬蟲(chóng)”技術(shù)的非法操作不僅侵犯相關(guān)平臺(tái)知識(shí)產(chǎn)權(quán)和消費(fèi)者合法權(quán)益,還可導(dǎo)致平臺(tái)上的用戶敏感信息泄露。
捅“馬蜂窩”之后:UGC數(shù)據(jù)造假受關(guān)注
日前,微信公號(hào)“小聲比比”發(fā)布題為《估值175億的旅游獨(dú)角獸,是一座僵尸和水軍構(gòu)成的鬼城?》的文章,援用乎睿數(shù)據(jù)團(tuán)隊(duì)所供數(shù)據(jù)稱,作為馬蜂窩核心資產(chǎn)之一的2100萬(wàn)“真實(shí)點(diǎn)評(píng)”中,有1800萬(wàn)條是通過(guò)機(jī)器人從攜程等競(jìng)爭(zhēng)對(duì)手那里抄襲過(guò)來(lái)的。其中,超過(guò)7000個(gè)抄襲賬號(hào),合計(jì)抄襲572萬(wàn)條餐飲點(diǎn)評(píng),1221萬(wàn)條酒店點(diǎn)評(píng),占總點(diǎn)評(píng)數(shù)的85%。
隨著事件日益發(fā)酵,UGC平臺(tái)數(shù)據(jù)造假這一行業(yè)問(wèn)題引發(fā)關(guān)注。業(yè)內(nèi)人士認(rèn)為,從其他平臺(tái)抓數(shù)據(jù)的目的,就是為了制造流量很大的假象,既給用戶看、商家看,更要給投資人看,獲取不同輪次的投資以便上市。而從其他網(wǎng)站抓取頁(yè)面商家內(nèi)容和用戶點(diǎn)評(píng)數(shù)據(jù)非常簡(jiǎn)單,使用“爬蟲(chóng)”技術(shù)和人工編輯就能做到。
一位App研發(fā)者李濱介紹,爬蟲(chóng)最早應(yīng)用在搜索引擎領(lǐng)域,爬取網(wǎng)站頁(yè)面提供給其他用戶進(jìn)行快速搜索和訪問(wèn),當(dāng)前爬蟲(chóng)技術(shù)已是“大數(shù)據(jù)”概念的重要組成部分,爬取對(duì)象也從一些種子擴(kuò)充至整個(gè)網(wǎng)絡(luò)數(shù)據(jù)。為此,行業(yè)還達(dá)成了Robots協(xié)議,形成互聯(lián)網(wǎng)行業(yè)就抓取數(shù)據(jù)普遍遵守的規(guī)則。
然而,近年來(lái),一些公司開(kāi)始利用“爬蟲(chóng)”技術(shù)從其他平臺(tái)惡意抓取數(shù)據(jù)。例如今年7月,生活分享平臺(tái)“小紅書(shū)”官微發(fā)布聲明指責(zé)大眾點(diǎn)評(píng)大量抄襲小紅書(shū)用戶的內(nèi)容,隨后,大眾點(diǎn)評(píng)道歉;今年2月,視頻彈幕網(wǎng)站嗶哩嗶哩大量用戶的視頻、昵稱、頭像及用戶評(píng)論,出現(xiàn)在某新成立的視頻網(wǎng)站上;而航空公司的官網(wǎng)上的機(jī)票、訂座等信息,長(zhǎng)期被代理公司將機(jī)票信息爬取、占座,然后在其他網(wǎng)站上加價(jià)銷售。
“爬蟲(chóng)”被濫用,數(shù)據(jù)造假已成網(wǎng)絡(luò)“灰產(chǎn)”
網(wǎng)宿科技發(fā)布的《2018上半年中國(guó)互聯(lián)網(wǎng)安全報(bào)告》顯示,今年上半年,Web應(yīng)用攻擊總數(shù)環(huán)比增長(zhǎng)了97.82%,惡意“爬蟲(chóng)”攻擊數(shù)量環(huán)比增長(zhǎng)了55.79%。另有數(shù)據(jù)顯示,交通出行類惡意“爬蟲(chóng)”流量占比居首位,其次是電商、社交、點(diǎn)評(píng)、運(yùn)營(yíng)商、公共行政等,網(wǎng)絡(luò)爬蟲(chóng)的非法使用給互聯(lián)網(wǎng)競(jìng)爭(zhēng)環(huán)境帶來(lái)諸多負(fù)面影響。
“目前,市面上大的互聯(lián)網(wǎng)公司都會(huì)推出自己的刷票軟件,目的是為了分享12306網(wǎng)站的"流量紅利"。”中國(guó)鐵科院電子所相關(guān)負(fù)責(zé)人說(shuō),“這些刷票軟件用"爬蟲(chóng)"等技術(shù)刷新12306網(wǎng)站頁(yè)面,截取官網(wǎng)車次、票量等數(shù)據(jù)制作成自己的網(wǎng)站頁(yè)面,再使用程序進(jìn)行搶票,收取不合法的差價(jià)。其中,大約一半的12306訂票網(wǎng)站流量來(lái)自"爬蟲(chóng)"技術(shù)支撐的刷票軟件,不僅給網(wǎng)站服務(wù)器造成巨大壓力,也擾亂了正常的訂票秩序,由此帶來(lái)的購(gòu)票難是鐵路部門一直頭疼的問(wèn)題?!?/p>
山東日中律師事務(wù)所律師陳冠汶說(shuō),公司未經(jīng)許可或授權(quán)的情況下利用“爬蟲(chóng)”技術(shù)獲得可能帶來(lái)商業(yè)利益的信息可以被判定構(gòu)成不正當(dāng)競(jìng)爭(zhēng)。記者梳理相關(guān)案件發(fā)現(xiàn),法院往往認(rèn)為,技術(shù)作為一種工具手段在價(jià)值上具有中立性,但這并不意味著技術(shù)本身可以作為豁免當(dāng)事人法律責(zé)任的依據(jù)。
——2017年,廣東省深圳市中級(jí)人民法院審理的一起案件中,武漢元光科技有限公司為提高其開(kāi)發(fā)的智能公交“車來(lái)了”App在中國(guó)市場(chǎng)的用戶量及信息查詢的準(zhǔn)確度,未經(jīng)深圳市谷米科技有限公司許可,指使公司員工利用網(wǎng)絡(luò)“爬蟲(chóng)”軟件獲取谷米公司服務(wù)器中的實(shí)時(shí)數(shù)據(jù),謀取該軟件在實(shí)時(shí)公交信息查詢軟件中的競(jìng)爭(zhēng)優(yōu)勢(shì),違反了誠(chéng)實(shí)信用原則和公認(rèn)的商業(yè)道德,構(gòu)成不正當(dāng)競(jìng)爭(zhēng)。
——2016年,上海知識(shí)產(chǎn)權(quán)法院二審民事判決書(shū)認(rèn)為,百度公司大量使用大眾點(diǎn)評(píng)網(wǎng)的點(diǎn)評(píng)信息的行為,通過(guò)百度地圖和百度知道與大眾點(diǎn)評(píng)網(wǎng)爭(zhēng)奪網(wǎng)絡(luò)用戶,會(huì)導(dǎo)致大眾點(diǎn)評(píng)網(wǎng)的流量減少,同時(shí),又推介自己的團(tuán)購(gòu)等業(yè)務(wù),攫取了大眾點(diǎn)評(píng)網(wǎng)的部分交易機(jī)會(huì)。百度公司的行為損害了漢濤公司(大眾點(diǎn)評(píng)網(wǎng)所屬公司)的利益,且其行為違反公認(rèn)的商業(yè)道德,構(gòu)成不正當(dāng)競(jìng)爭(zhēng)。
搜狐視頻高級(jí)主管閔博認(rèn)為,濫用網(wǎng)絡(luò)“爬蟲(chóng)”還有可能對(duì)網(wǎng)絡(luò)安全造成影響,引發(fā)網(wǎng)站服務(wù)器宕機(jī)。“一些"爬蟲(chóng)"工具的使用者在采取"全站爬取"的模式時(shí),相當(dāng)于模擬了大量用戶在短時(shí)間內(nèi)對(duì)源站服務(wù)器發(fā)起訪問(wèn)請(qǐng)求,一旦訪問(wèn)量在瞬間達(dá)到承載極值,就會(huì)引起服務(wù)器宕機(jī),從而威脅網(wǎng)絡(luò)空間的安全?!?/p>
還有業(yè)內(nèi)人士指出,被網(wǎng)絡(luò)“爬蟲(chóng)”抓取的信息不僅可以用于同類型平臺(tái)制作,還可能被轉(zhuǎn)售或者可能用于釣魚(yú)網(wǎng)站制作等其他違法行為,不但會(huì)給平臺(tái)帶來(lái)重大損失,更可能導(dǎo)致平臺(tái)上的用戶敏感信息泄露,進(jìn)而使用戶遭遇各類網(wǎng)絡(luò)和電信詐騙。
記者在社交網(wǎng)站和購(gòu)物網(wǎng)站檢索時(shí)發(fā)現(xiàn),一些賣家堂而皇之地售賣“爬蟲(chóng)”自動(dòng)評(píng)價(jià)軟件或進(jìn)行個(gè)人隱私信息爬取的接派單任務(wù)。在QQ群搜索中輸入關(guān)鍵詞“網(wǎng)絡(luò)爬蟲(chóng)”,也會(huì)出現(xiàn)多個(gè)涉及外包網(wǎng)絡(luò)“爬蟲(chóng)”技術(shù)的群組。業(yè)內(nèi)人士透露,這些群組中進(jìn)行的網(wǎng)絡(luò)“爬蟲(chóng)”任務(wù)大部分都屬于未獲授權(quán)而進(jìn)行的違規(guī)爬取操作,由于該項(xiàng)技術(shù)具有一定的隱秘性,在爬取普通用戶隱私數(shù)據(jù)時(shí)較難被識(shí)別。
技術(shù)加法律遏制造假,勿讓“爬蟲(chóng)”成害蟲(chóng)
“一個(gè)技術(shù)如何使用,責(zé)任主體都應(yīng)捫心自問(wèn),這是否侵犯?jìng)€(gè)人隱私,是否破壞言論自由,是否損害公共利益,是否損害其他數(shù)據(jù)財(cái)產(chǎn)擁有者的財(cái)產(chǎn)所有權(quán),是否涉及不正當(dāng)競(jìng)爭(zhēng)。許多大的互聯(lián)網(wǎng)公司,會(huì)同時(shí)有"爬蟲(chóng)"部門和"反爬蟲(chóng)"部門。"爬蟲(chóng)"技術(shù)在互聯(lián)網(wǎng)行業(yè)早已被廣泛使用,但"爬蟲(chóng)"絕不能成為害蟲(chóng)?!敝袊?guó)人民大學(xué)法學(xué)院教授劉俊海表示。
記者了解到,目前的“反爬”技術(shù)有兩種:一種是限制同一IP、同一電腦在一定時(shí)間內(nèi)訪問(wèn)網(wǎng)站的次數(shù),另一種是設(shè)置復(fù)雜的驗(yàn)證碼機(jī)制,讓“爬蟲(chóng)”不好識(shí)別。但對(duì)一些網(wǎng)站來(lái)說(shuō),封IP的做法可能誤傷真實(shí)用戶,而設(shè)置一個(gè)非常復(fù)雜的驗(yàn)證碼,又可能損失用戶。因此,除了加大技術(shù)防范力度之外,要運(yùn)用好法律手段,克服取證難的盲點(diǎn),明確使用紅線。
業(yè)內(nèi)人士表示,雖然網(wǎng)絡(luò)安全法對(duì)非法獲取個(gè)人信息等相關(guān)行為進(jìn)行了規(guī)定,但對(duì)于爬取公開(kāi)信息行為并未予以規(guī)定。相關(guān)部門應(yīng)進(jìn)一步查漏補(bǔ)缺,盡快縮小新技術(shù)應(yīng)用的法律模糊地帶。
據(jù)中國(guó)傳媒大學(xué)教授、大數(shù)據(jù)挖掘與社會(huì)計(jì)算實(shí)驗(yàn)室主任沈浩介紹,歐洲已出臺(tái)GDPR《通用數(shù)據(jù)保護(hù)條例》,想要采集歐盟境內(nèi)企業(yè)和個(gè)人的信息,即使你不在歐盟邊界內(nèi),采集活動(dòng)也要受到相應(yīng)的管制和控制。但目前國(guó)內(nèi)還沒(méi)有全面的規(guī)定,要從根源上解決這類問(wèn)題,還是要從立法層面入手。
此外,以前國(guó)內(nèi)對(duì)網(wǎng)站數(shù)據(jù)造假的懲罰案例很少,懲罰并不算嚴(yán)格,也是數(shù)據(jù)或者內(nèi)容造假的重要原因之一。搜狐視頻高級(jí)主管閔博認(rèn)為,有關(guān)部門應(yīng)加強(qiáng)對(duì)網(wǎng)絡(luò)“爬蟲(chóng)”工具使用者的監(jiān)管,對(duì)于惡意阻塞網(wǎng)絡(luò)訪問(wèn)等濫用行為要嚴(yán)格查處,充分保障中小型互聯(lián)網(wǎng)企業(yè)的網(wǎng)絡(luò)空間安全使用權(quán)。
專家認(rèn)為,未經(jīng)對(duì)方允許從其他平臺(tái)抓取數(shù)據(jù)并謀取商業(yè)利益的一般屬于不正當(dāng)競(jìng)爭(zhēng)行為,由工商部門負(fù)責(zé)監(jiān)管。但是因?yàn)檫@類行為通常比較隱蔽,工商部門一般需要有人舉報(bào)并提供相應(yīng)證據(jù)或線索后啟動(dòng)調(diào)查,因此需要借助技術(shù)手段更有效地進(jìn)行打擊。
誠(chéng)信經(jīng)營(yíng),遵法守法,互聯(lián)網(wǎng)絕不是例外。正如北京知識(shí)產(chǎn)權(quán)法院在一起涉及爬蟲(chóng)技術(shù)的案件審判中所言,網(wǎng)絡(luò)運(yùn)營(yíng)者應(yīng)當(dāng)遵循合法、正當(dāng)、必要的原則,盡到網(wǎng)絡(luò)運(yùn)營(yíng)者的管理義務(wù)。第三方應(yīng)用開(kāi)發(fā)者在收集、使用個(gè)人數(shù)據(jù)信息時(shí),應(yīng)當(dāng)遵循誠(chéng)實(shí)信用的原則及公認(rèn)的商業(yè)道德。
2898站長(zhǎng)資源平臺(tái)網(wǎng)站資訊:http://afrimangol.com/news/