亚洲全黄无码一级在线看_国产剧情久久久性色_无码av一区二区三区无码_亚洲成a×人片在线观看

當前位置: 首頁 > 科技新聞 >

爬蟲收割隱私,黑箱埋葬靈魂

時間:2019-11-13 01:06來源:網(wǎng)絡(luò)整理 瀏覽:
資料來源:數(shù)據(jù)
爬蟲收割隱私,黑箱埋葬靈魂 爬蟲收割隱私,黑箱埋葬靈魂

爬蟲收割隱私,黑箱埋葬靈魂 爬蟲收割隱私,黑箱埋葬靈魂

資料來源:數(shù)據(jù)時代;數(shù)據(jù)來源:IDG

歡迎關(guān)注“創(chuàng)事記”微信訂閱號:sinachuangshiji

文/雷慢

來源:新金融洛書(ID:FintechBook)

01

2006年,已經(jīng)做了幾年天使投資人的唐寧,自掏腰包借款給100多個大學生參加培訓(xùn)收到了回款,因此受到鼓舞,在北京SOHO現(xiàn)代城的三室一廳里創(chuàng)立了宜信公司,在這里一同辦公的,還有他剛創(chuàng)辦的華創(chuàng)資本,招進了早已熟識的第二號員工吳海燕,后者后來成了華創(chuàng)資本的當家人。

36歲這一年,從阿里巴巴安全部技術(shù)總監(jiān)崗位上辭職的蔣韜找到吳海燕說,他想做一個SaaS級應(yīng)用而服務(wù)所有網(wǎng)站,名叫同盾科技。吳海燕很快給了蔣韜第一筆天使投資。

那時,市場傳聞一條不成文的規(guī)則,從阿里中層出來的人創(chuàng)業(yè),天使風投100萬美元起步。華創(chuàng)資本和IDG資本給蔣韜的則是千萬元人民幣的天使輪。

蔣韜出來單干之前兩年,即2011年,在硅谷工作了11年的汪德嘉回國了。汪德嘉是個留美數(shù)學博士,在VISA等公司做大數(shù)據(jù)分析、金融反欺詐技術(shù)工作,回來后就創(chuàng)辦了通付盾,仍是老買賣。

一次,汪德嘉帶隊在杭州參加一個安全技術(shù)交流會,遇見了還在阿里巴巴做安全部技術(shù)總監(jiān)的蔣韜和團隊。兩人聊得投機,很快,雙方簽訂了技術(shù)交流合同,

兩個年輕人走向志同道合的路。不到幾年時間,一個成為網(wǎng)絡(luò)反欺詐領(lǐng)域的兇猛后生,一個成為數(shù)字身份認證領(lǐng)域的不得不提的主。

數(shù)據(jù)產(chǎn)業(yè)起于草莽,蔣韜、汪德嘉們也不得不劍懸顱頂。友商們數(shù)據(jù)倒賣、侵權(quán)爬蟲、竊取隱私的事情太多了。干這事,像淺水行舟,還百舸爭流,水不僅攪渾了,身邊的人也一個個觸礁了。

誰也沒有想到,幾年后,兩人突然翻臉,汪德嘉指蔣韜偷竊通付盾核心技術(shù)。蔣韜則一紙狀書將汪德嘉告上法庭,頓時反目成仇。

02

趟數(shù)據(jù)這趟渾水的,不止蔣、汪。

數(shù)據(jù)產(chǎn)業(yè)的淘金熱,在2007年前后出現(xiàn),于2013年前后興起。與P2P的展業(yè)有著相當?shù)能壽E。

同盾科技、百融金服、聚信立、GEO集奧聚合、白騎士、算話征信。這些大多涌現(xiàn)于2014年前后兩年,這些第三方數(shù)據(jù)公司的出現(xiàn),迅速滿足并激活了消費金融、P2P甚至銀行金融機構(gòu)的風控、獲客、營銷需求。

通觀第三方數(shù)據(jù)企業(yè)的合作體量,就知道市場需求并不少。截至目前,第三方數(shù)據(jù)企業(yè)的聚信立合作企業(yè)超過2900家、上海的新顏科技合作機構(gòu)2500家以上;同盾科技的數(shù)聚魔盒,在2019年3月份下線前,合作企業(yè)10000多家。這些第三方數(shù)據(jù)公司的主顧們,主要來自互聯(lián)網(wǎng)金融機構(gòu),包括了P2P網(wǎng)貸、消費金融、現(xiàn)金貸等。

IDC名為《數(shù)據(jù)時代2025》的報告顯示,全球每年產(chǎn)生的數(shù)據(jù)將從2018年的33ZB增長到2025年的175ZB(1ZB相當于1.1萬億GB)。

做金融的,無論銀行、消費金融、P2P,言必稱大數(shù)據(jù)風控。雖然有效性現(xiàn)在還能定論,但在品牌營銷、精準獲客上,這兩年確實讓做地推的都舍棄了原本的路子。銀行們找騰訊、阿里、百度合作,P2P、現(xiàn)金貸、消費金融們則有同盾、通付盾們,大家各自配對。

問題是,這些第三方數(shù)據(jù)有多少是清白的。那些流量巨頭的數(shù)據(jù)后門,個體甚至監(jiān)管,都不容易摸到。

一些明目張膽做數(shù)據(jù)買賣的,就難免被拉出懲戒示眾。

自稱數(shù)據(jù)第一股的北京“數(shù)據(jù)堂”,2014年掛牌新三板。2017年7月山東公安上門時,這家公司日均傳輸公民個人信息1億3000萬余條,累計傳輸數(shù)據(jù)壓縮后約為4000G。

數(shù)據(jù)堂的數(shù)據(jù),大多是用自營眾包平臺、公共領(lǐng)域共享,網(wǎng)絡(luò)爬蟲爬取方式獲取。一份“車輛標準圖像數(shù)據(jù)”的數(shù)據(jù)包在網(wǎng)頁公開售價20000元。新華視點記者曾問他們客服,這是否會涉嫌侵犯用戶隱私??头暦Q,這些照片都是擺拍,獲得了授權(quán)。但該數(shù)據(jù)產(chǎn)品卻明確寫著“來自交通卡口監(jiān)控視頻截取”,并非擺拍。

被抓了幾十人后,警方偵查發(fā)現(xiàn),數(shù)據(jù)堂公司向不同的多家公司各售賣了1萬條至70萬條不等的公民個人信息。

數(shù)據(jù)堂案件一審判決時,數(shù)據(jù)堂首席運營官柴銀輝、營銷產(chǎn)品部副總裁胡曉敏都被判有期徒刑三年,兩人都不服,以“數(shù)據(jù)堂公司系單位犯罪”理由提起上訴,終被駁回。

之后,“數(shù)據(jù)堂”正常運行。

有些“鐵打的營盤,流水的罪犯”的意思。

03

我曾陷于解這樣一個謎,前一天我和朋友聊過的旅游想法,第二天就出現(xiàn)了微信底部的攜程訂票廣告,我在私底下談過的某款車,之后就出現(xiàn)在了頭條的短視頻里。我想,究竟是誰走漏了風聲?

像一個被扒光的人,卻不知道如何被誰扒光了。而且越來越被扒得徹底。

以數(shù)據(jù)所構(gòu)建出虛擬生活的我們,活在一個巨大的“圓形監(jiān)獄”之中——所有囚室對著中央監(jiān)視塔里的數(shù)據(jù)處理器,每一個囚室有一前一后兩扇窗戶,一扇朝著中央塔樓和所有人的監(jiān)視,一扇背對著中央塔樓贏得短暫和半透明的自由。監(jiān)視者可以觀察到囚室里的罪犯的一舉一動,囚徒卻不知是否被監(jiān)視以及何時被監(jiān)視,時刻處于憂慮之中。

英國哲學家杰里米·邊沁(Bentham)把圓形監(jiān)獄描述為"一種新形式的通用力量 "(a new mode of obtaining power of mind over mind, in a quantity hitherto without example)。

幾個月前,馬化騰喊出了“科技向善”,實在是有些牽強了,因為資本逐利,技術(shù)在資本手里,簡直就是一個黑箱了。

別忘了,中國的互聯(lián)網(wǎng)大公司,在數(shù)據(jù)上都有不光彩的過去,

螞蟻金服鬧過個人信息被默認勾選進《芝麻服務(wù)協(xié)議》事件;京東金融曾曝出留存用戶圖片緩存和10G數(shù)據(jù)外泄事件,至于抨擊百度作惡,已成了政治正確了。

這兩年,我們已幾乎走進科幻電影中的現(xiàn)實。

2002年上映的科幻驚悚電影《少數(shù)派報告》,曾出現(xiàn)這樣一幕(大意):湯姆克魯斯扮演的約翰·安德頓進入商場,大屏幕上出現(xiàn)一個個定制給他個人的廣告,并推銷給他說:約翰·安德頓先生,您上一次買夾克已經(jīng)過去3年了,您要買一件新的皮夾克嗎?

我們的個人信息,大抵如是。

個人信息、隱私,在電腦算法、機器學習的挾持下,輸出給個人的廣告或信息,都是經(jīng)過數(shù)據(jù)精心算計的結(jié)果。

在算法的挾持下,放貸公司的廣告會給出令你心花怒放的說辭,也會在你申請貸款時,給你滴水不漏的貸款價格。這背后,是批量放貸的大數(shù)據(jù)信審和不可琢磨的技術(shù)黑箱。

04

這些年,數(shù)據(jù)黑箱現(xiàn)象隱而不發(fā),但蔚為大觀。

消費金融公司雖然給了你一筆利率不錯的貸款,但你無法知電腦算法在審貸決策過程中,是否出現(xiàn)程序錯誤,是不是對你有算法歧視,是不是將學歷、種族、戶籍信息作為風險定價的依據(jù),你的社交行為數(shù)據(jù)、朋友圈層次在多大程度上作為你利率定價的依據(jù)?這就是數(shù)據(jù)黑箱,看不見摸不著,卻決定著對你的信貸定價。

法學教授弗蘭克·帕特洛伊(Frank Partnoy)和普利策獎獲得者杰西·艾辛格(Jesse Eisinger)曾于2013年年初共同研究過”美國銀行的內(nèi)幕“,他們在報告中把銀行描述為“掩蓋了巨大風險的‘黑箱’,這些風險可能會再次擊垮經(jīng)濟”,因為黑箱不可捉摸,不可明察。

金融科技化之后,越來越多的黑箱產(chǎn)生,并未使得金融科技更加透明。

黑箱的種子與土壤到處都是,如黑產(chǎn)軍團、數(shù)據(jù)倒賣行為、大數(shù)據(jù)信審、人工智能深度學習、機器決策…

金融科技的技術(shù)和數(shù)據(jù)黑箱使得監(jiān)管越來越難。

一家借貸平臺在他的大數(shù)據(jù)風控的系統(tǒng)中輸入一個人用戶數(shù)以千計的社交數(shù)據(jù)、搜索數(shù)據(jù)、瀏覽數(shù)據(jù)、交易數(shù)據(jù)等,經(jīng)過深度學習和決策模型的計算,最終可能將一個人的信用定為不及格,但這其中的具體決策過程是什么,企業(yè)不會告知你。

更甚至于,這個決策過程中出現(xiàn)程序錯誤、算法歧視時,電腦試圖向程序員解釋時,程序員也無法明白。

哥倫比亞大學的機器人學家 Hod Lipson曾說:“這就像是向一條狗解釋莎士比亞是誰?!?/p>

被問及Google公司如何對數(shù)據(jù)進行私下操作時,前首席執(zhí)行官埃里克·施密特(Eric Schmidt)曾經(jīng)回答:“Google的政策就是和警戒線打擦邊球。”

05

2018年,歐盟頒布了一道了不起的法令——《一般數(shù)據(jù)保護條例》(GDPR)》。

它未被國人重視的嚴重性,正如它深遠、前瞻的偉大性一樣不可忽視。

這則法令最重要的兩個原則在于:

1、最大限度的保護個人隱私,嚴格限定企業(yè)、政府對個人信息數(shù)據(jù)的使用條件。將科技、人工智能、數(shù)據(jù)滲透阻擋于個人隱私之外。

2、要求人工審查重要的人工智能中的算法決策,提供個別算法決策的詳細解釋或關(guān)于算法如何做出決定的一般信息。這一條款將大大降低技術(shù)黑箱問題的存在。

通俗并且簡而言之,這兩個原則,試圖保護人類個體不受愈發(fā)失控的數(shù)據(jù)或技術(shù)黑箱之侵害。

如果不受限制,數(shù)據(jù)亂象將導(dǎo)致怎樣的后果?

國內(nèi)大數(shù)據(jù)企業(yè)常掛在嘴上的打擊黑產(chǎn)、打擊擼貸大軍、欺詐軍團,可實際上,數(shù)據(jù)產(chǎn)業(yè)有目前最大之一的黑產(chǎn)軍團。

2014年,曾有過詐騙、敲詐勒索兩次犯罪經(jīng)歷的“王成予”創(chuàng)辦了一家名為“巧達科技”的數(shù)據(jù)公司。僅僅一年多時間后,王成予的巧達科技掌握了1.6億中國人求職簡歷。

巧達科技利用這些數(shù)據(jù)發(fā)布了這款全稱叫“愛伙伴員工離職預(yù)報”的產(chǎn)品,能發(fā)現(xiàn)90%以上員工離職前的動態(tài)信息,最快30分鐘內(nèi)向企業(yè)管理者發(fā)出預(yù)報通知。

巧達科技和企業(yè)、獵頭們在做的是一項拿產(chǎn)品換數(shù)據(jù)的勾當,交易著你我的簡歷,而將你我排除在外。

2019年3月24日,大數(shù)據(jù)行業(yè)盛傳巧達科技被警方“一鍋端”,原因或涉及未經(jīng)授權(quán)收集公民個人信息。

我們回過頭來再看,GDPR有它了不起的地方。

歐盟GDPR了不起的地方在于無視利益集團、犧牲科技革新的速度,將科技進步控制在可理解的天花板里,而非放任在失控的黑箱中。

一百年前,路易斯·布蘭戴斯(Louis Brandeis)曾經(jīng)發(fā)表言論“陽光是最好的消毒劑”。

在數(shù)據(jù)黑箱的失控下,螞蟻金服或騰訊、百度們,甚至于美團、攜程們,有可能成為金融科技領(lǐng)域的新權(quán)威者。

曾經(jīng)我們舟船往來、書信有無,一封家書私藏50年,打聽一個人的私密要聊很久的八卦。如今數(shù)據(jù)通了信息高速,但我還是發(fā)愿:個人不裸體示人,我愿隱姓埋名,國家就對我一無所知,BAT們不能左右。

推薦內(nèi)容