亚洲全黄无码一级在线看_国产剧情久久久性色_无码av一区二区三区无码_亚洲成a×人片在线观看

當(dāng)前位置: 首頁(yè) > 科技新聞 >

如何用大數(shù)據(jù)構(gòu)建精準(zhǔn)用戶畫像?

時(shí)間:2019-12-27 15:25來(lái)源:網(wǎng)絡(luò)整理 瀏覽:
什么是用戶畫像?用戶畫像(User Profile),作為大數(shù)據(jù)的根基,它完美地抽象出一個(gè)用戶的信息全貌,為進(jìn)一步精準(zhǔn)、快速地分析用戶行為習(xí)
如何用大數(shù)據(jù)構(gòu)建精準(zhǔn)用戶畫像?


什么是用戶畫像?


用戶畫像(User Profile),作為大數(shù)據(jù)的根基,它完美地抽象出一個(gè)用戶的信息全貌,為進(jìn)一步精準(zhǔn)、快速地分析用戶行為習(xí)慣、消費(fèi)習(xí)慣等重要信息,提供了足夠的數(shù)據(jù)基礎(chǔ),奠定了大數(shù)據(jù)時(shí)代的基石。


用戶畫像,即用戶信息標(biāo)簽化,就是企業(yè)通過(guò)收集與分析消費(fèi)者社會(huì)屬性、生活習(xí)慣、消費(fèi)行為等主要信息的數(shù)據(jù)之后,完美地抽象出一個(gè)用戶的商業(yè)全貌作是企業(yè)應(yīng)用大數(shù)據(jù)技術(shù)的基本方式。用戶畫像為企業(yè)提供了足夠的信息基礎(chǔ),能夠幫助企業(yè)快速找到精準(zhǔn)用戶群體以及用戶需求等更為廣泛的反饋信息。

如何用大數(shù)據(jù)構(gòu)建精準(zhǔn)用戶畫像?


用戶畫像的四階段

用戶畫像的焦點(diǎn)工作就是為用戶打“標(biāo)簽”,而一個(gè)標(biāo)簽通常是人為規(guī)定的高度精煉的特征標(biāo)識(shí),如年齡、性別、地域、用戶偏好等,最后將用戶的所有標(biāo)簽綜合來(lái)看,就可以勾勒出該用戶的立體“畫像”了。


具體來(lái)講,當(dāng)為用戶畫像時(shí),需要以下四個(gè)階段:

如何用大數(shù)據(jù)構(gòu)建精準(zhǔn)用戶畫像?


用戶畫像的意義


如何用大數(shù)據(jù)構(gòu)建精準(zhǔn)用戶畫像?


用戶畫像的構(gòu)建是有難度的。主要表現(xiàn)為以下四個(gè)方面:

如何用大數(shù)據(jù)構(gòu)建精準(zhǔn)用戶畫像?


為了精準(zhǔn)地描述用戶特征,可以參考下面的思路,從用戶微觀畫像的建立→用戶畫像的標(biāo)簽建?!脩舢嬒竦臄?shù)據(jù)架構(gòu),我們由微觀到宏觀,逐層分析。

首先我們從微觀來(lái)看,如何給用戶的微觀畫像進(jìn)行分級(jí)呢?如下圖所示

總原則:基于一級(jí)分類上述分類逐級(jí)進(jìn)行細(xì)分。


第一分類:人口屬性、資產(chǎn)特征、營(yíng)銷特性、興趣愛好、購(gòu)物愛好、需求特征

第二分類…

第三分類……….


如何用大數(shù)據(jù)構(gòu)建精準(zhǔn)用戶畫像?


完成了對(duì)客戶微觀畫像分析后,就可以考慮為用戶畫像的標(biāo)簽建模了。

從原始數(shù)據(jù)進(jìn)行統(tǒng)計(jì)分析,得到事實(shí)標(biāo)簽,再進(jìn)行建模分析,得到模型標(biāo)簽,再進(jìn)行模型預(yù)測(cè),得到預(yù)測(cè)標(biāo)簽。

如何用大數(shù)據(jù)構(gòu)建精準(zhǔn)用戶畫像?


最后從宏觀層面總結(jié),就是得到用戶畫像的數(shù)據(jù)架構(gòu)。

如何用大數(shù)據(jù)構(gòu)建精準(zhǔn)用戶畫像?


LotuseeData蓮子數(shù)據(jù)在具體設(shè)備分析的統(tǒng)計(jì)基礎(chǔ)上,提供了更強(qiáng)大的自定義時(shí)間,用戶分組,渠道活動(dòng)轉(zhuǎn)化追蹤等新功能,并累計(jì)了大量的設(shè)備和用戶標(biāo)簽,為進(jìn)一步的用戶畫像提供了堅(jiān)實(shí)的基礎(chǔ)。





百分點(diǎn)技術(shù)總監(jiān)郭志金

談?dòng)脩舢嬒駭?shù)據(jù)建模方法


伴隨著大數(shù)據(jù)應(yīng)用的討論、創(chuàng)新,個(gè)性化技術(shù)成為了一個(gè)重要落地點(diǎn)。相比傳統(tǒng)的線下會(huì)員管理、問(wèn)卷調(diào)查、購(gòu)物籃分析,大數(shù)據(jù)第一次使得企業(yè)能夠通過(guò)互聯(lián)網(wǎng)便利地獲取用戶更為廣泛的反饋信息,為進(jìn)一步精準(zhǔn)、快速地分析用戶行為習(xí)慣、消費(fèi)習(xí)慣等重要商業(yè)信息,提供了足夠的數(shù)據(jù)基礎(chǔ)。伴隨著對(duì)人的了解逐步深入,一個(gè)概念悄然而生:用戶畫像(UserProfile),完美地抽象出一個(gè)用戶的信息全貌,可以看作企業(yè)應(yīng)用大數(shù)據(jù)的根基。


一、什么是用戶畫像?


男,31歲,已婚,收入1萬(wàn)以上,愛美食,團(tuán)購(gòu)達(dá)人,喜歡紅酒配香煙。

這樣一串描述即為用戶畫像的典型案例。如果用一句話來(lái)描述,即:用戶信息標(biāo)簽化。

如果用一幅圖來(lái)展現(xiàn),即:


如何用大數(shù)據(jù)構(gòu)建精準(zhǔn)用戶畫像?


二、為什么需要用戶畫像


用戶畫像的核心工作是為用戶打標(biāo)簽,打標(biāo)簽的重要目的之一是為了讓人能夠理解并且方便計(jì)算機(jī)處理,如,可以做分類統(tǒng)計(jì):喜歡紅酒的用戶有多少?喜歡紅酒的人群中,男、女比例是多少?


也可以做數(shù)據(jù)挖掘工作:利用關(guān)聯(lián)規(guī)則計(jì)算,喜歡紅酒的人通常喜歡什么運(yùn)動(dòng)品牌?利用聚類算法分析,喜歡紅酒的人年齡段分布情況?


大數(shù)據(jù)處理,離不開計(jì)算機(jī)的運(yùn)算,標(biāo)簽提供了一種便捷的方式,使得計(jì)算機(jī)能夠程序化處理與人相關(guān)的信息,甚至通過(guò)算法、模型能夠“理解” 人。當(dāng)計(jì)算機(jī)具備這樣的能力后,無(wú)論是搜索引擎、推薦引擎、廣告投放等各種應(yīng)用領(lǐng)域,都將能進(jìn)一步提升精準(zhǔn)度,提高信息獲取的效率。


三、如何構(gòu)建用戶畫像


一個(gè)標(biāo)簽通常是人為規(guī)定的高度精煉的特征標(biāo)識(shí),如年齡段標(biāo)簽:25~35歲,地域標(biāo)簽:北京,標(biāo)簽呈現(xiàn)出兩個(gè)重要特征:語(yǔ)義化,人能很方便地理解每個(gè)標(biāo)簽含義。這也使得用戶畫像模型具備實(shí)際意義。能夠較好的滿足業(yè)務(wù)需求。如,判斷用戶偏好。短文本,每個(gè)標(biāo)簽通常只表示一種含義,標(biāo)簽本身無(wú)需再做過(guò)多文本分析等預(yù)處理工作,這為利用機(jī)器提取標(biāo)準(zhǔn)化信息提供了便利。


人制定標(biāo)簽規(guī)則,并能夠通過(guò)標(biāo)簽快速讀出其中的信息,機(jī)器方便做標(biāo)簽提取、聚合分析。所以,用戶畫像,即:用戶標(biāo)簽,向我們展示了一種樸素、簡(jiǎn)潔的方法用于描述用戶信息。


3.1 數(shù)據(jù)源分析


構(gòu)建用戶畫像是為了還原用戶信息,因此數(shù)據(jù)來(lái)源于:所有用戶相關(guān)的數(shù)據(jù)。


對(duì)于用戶相關(guān)數(shù)據(jù)的分類,引入一種重要的分類思想:封閉性的分類方式。如,世界上分為兩種人,一種是學(xué)英語(yǔ)的人,一種是不學(xué)英語(yǔ)的人;客戶分三類,高價(jià)值客戶,中價(jià)值客戶,低價(jià)值客戶;產(chǎn)品生命周期分為,投入期、成長(zhǎng)期、成熟期、衰退期…所有的子分類將構(gòu)成了類目空間的全部集合。


這樣的分類方式,有助于后續(xù)不斷枚舉并迭代補(bǔ)充遺漏的信息維度。不必?fù)?dān)心架構(gòu)上對(duì)每一層分類沒(méi)有考慮完整,造成維度遺漏留下擴(kuò)展性隱患。另外,不同的分類方式根據(jù)應(yīng)用場(chǎng)景,業(yè)務(wù)需求的不同,也許各有道理,按需劃分即可。


本文將用戶數(shù)據(jù)劃分為靜態(tài)信息數(shù)據(jù)、動(dòng)態(tài)信息數(shù)據(jù)兩大類。


如何用大數(shù)據(jù)構(gòu)建精準(zhǔn)用戶畫像?


靜態(tài)信息數(shù)據(jù)


用戶相對(duì)穩(wěn)定的信息,如圖所示,主要包括人口屬性、商業(yè)屬性等方面數(shù)據(jù)。這類信息,自成標(biāo)簽,如果企業(yè)有真實(shí)信息則無(wú)需過(guò)多建模預(yù)測(cè),更多的是數(shù)據(jù)清洗工作,因此這方面信息的數(shù)據(jù)建模不是本篇文章重點(diǎn)。


動(dòng)態(tài)信息數(shù)據(jù)


用戶不斷變化的行為信息,如果存在上帝,每一個(gè)人的行為都在時(shí)刻被上帝那雙無(wú)形的眼睛監(jiān)控著,廣義上講,一個(gè)用戶打開網(wǎng)頁(yè),買了一個(gè)杯子;與該用戶傍晚溜了趟狗,白天取了一次錢,打了一個(gè)哈欠等等一樣都是上帝眼中的用戶行為。當(dāng)行為集中到互聯(lián)網(wǎng),乃至電商,用戶行為就會(huì)聚焦很多,如上圖所示:瀏覽凡客首頁(yè)、瀏覽休閑鞋單品頁(yè)、搜索帆布鞋、發(fā)表關(guān)于鞋品質(zhì)的微博、贊“雙十一大促給力”的微博消息。等等均可看作互聯(lián)網(wǎng)用戶行為。


本篇文章以互聯(lián)網(wǎng)電商用戶,為主要分析對(duì)象,暫不考慮線下用戶行為數(shù)據(jù)(分析方法雷同,只是數(shù)據(jù)獲取途徑,用戶識(shí)別方式有些差異)。


在互聯(lián)網(wǎng)上,用戶行為,可以看作用戶動(dòng)態(tài)信息的唯一數(shù)據(jù)來(lái)源。如何對(duì)用戶行為數(shù)據(jù)構(gòu)建數(shù)據(jù)模型,分析出用戶標(biāo)簽,將是本文著重介紹的內(nèi)容。


3.2 目標(biāo)分析


用戶畫像的目標(biāo)是通過(guò)分析用戶行為,最終為每個(gè)用戶打上標(biāo)簽,以及該標(biāo)簽的權(quán)重。如,紅酒 0.8、李寧 0.6。

標(biāo)簽,表征了內(nèi)容,用戶對(duì)該內(nèi)容有興趣、偏好、需求等等。

權(quán)重,表征了指數(shù),用戶的興趣、偏好指數(shù),也可能表征用戶的需求度,可以簡(jiǎn)單的理解為可信度,概率。


3.3 數(shù)據(jù)建模方法


下面內(nèi)容將詳細(xì)介紹,如何根據(jù)用戶行為,構(gòu)建模型產(chǎn)出標(biāo)簽、權(quán)重。一個(gè)事件模型包括:時(shí)間、地點(diǎn)、人物三個(gè)要素。每一次用戶行為本質(zhì)上是一次隨機(jī)事件,可以詳細(xì)描述為:什么用戶,在什么時(shí)間,什么地點(diǎn),做了什么事。


什么用戶:關(guān)鍵在于對(duì)用戶的標(biāo)識(shí),用戶標(biāo)識(shí)的目的是為了區(qū)分用戶、單點(diǎn)定位。


如何用大數(shù)據(jù)構(gòu)建精準(zhǔn)用戶畫像?


以上列舉了互聯(lián)網(wǎng)主要的用戶標(biāo)識(shí)方法,獲取方式由易到難。視企業(yè)的用戶粘性,可以獲取的標(biāo)識(shí)信息有所差異。


什么時(shí)間:時(shí)間包括兩個(gè)重要信息,時(shí)間戳+時(shí)間長(zhǎng)度。時(shí)間戳,為了標(biāo)識(shí)用戶行為的時(shí)間點(diǎn),如,1395121950(精度到秒),1395121950.083612(精度到微秒),通常采用精度到秒的時(shí)間戳即可。因?yàn)槲⒚氲臅r(shí)間戳精度并不可靠。瀏覽器時(shí)間精度,準(zhǔn)確度最多也只能到毫秒。時(shí)間長(zhǎng)度,為了標(biāo)識(shí)用戶在某一頁(yè)面的停留時(shí)間。


什么地點(diǎn):用戶接觸點(diǎn),Touch Point。對(duì)于每個(gè)用戶接觸點(diǎn)。潛在包含了兩層信息:網(wǎng)址 + 內(nèi)容。網(wǎng)址:每一個(gè)url鏈接(頁(yè)面/屏幕),即定位了一個(gè)互聯(lián)網(wǎng)頁(yè)面地址,或者某個(gè)產(chǎn)品的特定頁(yè)面。可以是PC上某電商網(wǎng)站的頁(yè)面url,也可以是手機(jī)上的微博,微信等應(yīng)用某個(gè)功能頁(yè)面,某款產(chǎn)品應(yīng)用的特定畫面。如,長(zhǎng)城紅酒單品頁(yè),微信訂閱號(hào)頁(yè)面,某游戲的過(guò)關(guān)頁(yè)。


內(nèi)容:每個(gè)url網(wǎng)址(頁(yè)面/屏幕)中的內(nèi)容。可以是單品的相關(guān)信息:類別、品牌、描述、屬性、網(wǎng)站信息等等。如,紅酒,長(zhǎng)城,干紅,對(duì)于每個(gè)互聯(lián)網(wǎng)接觸點(diǎn),其中網(wǎng)址決定了權(quán)重;內(nèi)容決定了標(biāo)簽。


注:接觸點(diǎn)可以是網(wǎng)址,也可以是某個(gè)產(chǎn)品的特定功能界面。如,同樣一瓶礦泉水,超市賣1元,火車上賣3元,景區(qū)賣5元。商品的售賣價(jià)值,不在于成本,更在于售賣地點(diǎn)。標(biāo)簽均是礦泉水,但接觸點(diǎn)的不同體現(xiàn)出了權(quán)重差異。這里的權(quán)重可以理解為用戶對(duì)于礦泉水的需求程度不同。即,愿意支付的價(jià)值不同。


標(biāo)簽 權(quán)重

礦泉水 1 // 超市

礦泉水 3 // 火車

礦泉水 5 // 景區(qū)


類似的,用戶在京東商城瀏覽紅酒信息,與在品尚紅酒網(wǎng)瀏覽紅酒信息,表現(xiàn)出對(duì)紅酒喜好度也是有差異的。這里的關(guān)注點(diǎn)是不同的網(wǎng)址,存在權(quán)重差異,權(quán)重模型的構(gòu)建,需要根據(jù)各自的業(yè)務(wù)需求構(gòu)建。


所以,網(wǎng)址本身表征了用戶的標(biāo)簽偏好權(quán)重。網(wǎng)址對(duì)應(yīng)的內(nèi)容體現(xiàn)了標(biāo)簽信息。


什么事:用戶行為類型,對(duì)于電商有如下典型行為:瀏覽、添加購(gòu)物車、搜索、評(píng)論、購(gòu)買、點(diǎn)擊贊、收藏 等等。


不同的行為類型,對(duì)于接觸點(diǎn)的內(nèi)容產(chǎn)生的標(biāo)簽信息,具有不同的權(quán)重。如,購(gòu)買權(quán)重計(jì)為5,瀏覽計(jì)為1

紅酒 1 // 瀏覽紅酒

紅酒 5 // 購(gòu)買紅酒


綜合上述分析,用戶畫像的數(shù)據(jù)模型,可以概括為下面的公式:用戶標(biāo)識(shí) + 時(shí)間 + 行為類型 + 接觸點(diǎn)(網(wǎng)址+內(nèi)容),某用戶因?yàn)樵谑裁磿r(shí)間、地點(diǎn)、做了什么事。所以會(huì)打上**標(biāo)簽。


用戶標(biāo)簽的權(quán)重可能隨時(shí)間的增加而衰減,因此定義時(shí)間為衰減因子r,行為類型、網(wǎng)址決定了權(quán)重,內(nèi)容決定了標(biāo)簽,進(jìn)一步轉(zhuǎn)換為公式:

標(biāo)簽權(quán)重=衰減因子×行為權(quán)重×網(wǎng)址子權(quán)重


如:用戶A,昨天在品尚紅酒網(wǎng)瀏覽一瓶?jī)r(jià)值238元的長(zhǎng)城干紅葡萄酒信息。

標(biāo)簽:紅酒,長(zhǎng)城時(shí)間:因?yàn)槭亲蛱斓男袨?,假設(shè)衰減因子為:r=0.95行為類型:瀏覽行為記為權(quán)重1地點(diǎn):品尚紅酒單品頁(yè)的網(wǎng)址子權(quán)重記為 0.9(相比京東紅酒單品頁(yè)的0.7)

假設(shè)用戶對(duì)紅酒出于真的喜歡,才會(huì)去專業(yè)的紅酒網(wǎng)選購(gòu),而不再綜合商城選購(gòu)。


則用戶偏好標(biāo)簽是:紅酒,權(quán)重是0.95*0.7 * 1=0.665,即,用戶A:紅酒 0.665、長(zhǎng)城 0.665。


上述模型權(quán)重值的選取只是舉例參考,具體的權(quán)重值需要根據(jù)業(yè)務(wù)需求二次建模,這里強(qiáng)調(diào)的是如何從整體思考,去構(gòu)建用戶畫像模型,進(jìn)而能夠逐步細(xì)化模型。


四、總結(jié)


本文并未涉及具體算法,更多的是闡述了一種分析思想,在計(jì)劃構(gòu)建用戶畫像時(shí),能夠給您提供一個(gè)系統(tǒng)性、框架性的思維指導(dǎo)。


核心在于對(duì)用戶接觸點(diǎn)的理解,接觸點(diǎn)內(nèi)容直接決定了標(biāo)簽信息。內(nèi)容地址、行為類型、時(shí)間衰減,決定了權(quán)重模型是關(guān)鍵,權(quán)重值本身的二次建模則是水到渠成的進(jìn)階。模型舉例偏重電商,但其實(shí),可以根據(jù)產(chǎn)品的不同,重新定義接觸點(diǎn)。


比如影視產(chǎn)品,我看了一部電影《英雄本色》,可能產(chǎn)生的標(biāo)簽是:周潤(rùn)發(fā) 0.6、槍戰(zhàn) 0.5、港臺(tái) 0.3。


最后,接觸點(diǎn)本身并不一定有內(nèi)容,也可以泛化理解為某種閾值,某個(gè)行為超過(guò)多少次,達(dá)到多長(zhǎng)時(shí)間等。


比如游戲產(chǎn)品,典型接觸點(diǎn)可能會(huì)是,關(guān)鍵任務(wù),關(guān)鍵指數(shù)(分?jǐn)?shù))等等。如,積分超過(guò)1萬(wàn)分,則標(biāo)記為鉆石級(jí)用戶。鉆石用戶 1.0。


百分點(diǎn)現(xiàn)已全面應(yīng)用用戶畫像技術(shù)于推薦引擎中,在對(duì)某電商客戶,針對(duì)活動(dòng)頁(yè)新訪客的應(yīng)用中,依靠用戶畫像產(chǎn)生的個(gè)性化效果,對(duì)比熱銷榜,推薦效果有顯著提升:推薦欄點(diǎn)擊率提升27%, 訂單轉(zhuǎn)化率提升34%。



轉(zhuǎn)自燈塔大數(shù)據(jù),來(lái)源:大數(shù)據(jù)人


新浪微博的用戶畫像是怎樣構(gòu)建的?



1.概述

從上一篇《認(rèn)識(shí)每一個(gè)“你”:微博中的用戶模型》里面對(duì)用戶模型維度的劃分可以看出,屬性和興趣維度的用戶模型都可以歸入用戶畫像(User Profile)的范疇。而所謂用戶畫像,簡(jiǎn)單來(lái)說(shuō)就是對(duì)用戶的信息進(jìn)行標(biāo)簽化。如圖1所示。一方面,標(biāo)簽化是對(duì)用戶信息進(jìn)行結(jié)構(gòu)化,方便計(jì)算機(jī)的識(shí)別和處理;另一方面,標(biāo)簽本身也具有準(zhǔn)確性和非二義性,也有利于人工的整理、分析和統(tǒng)計(jì)。


如何用大數(shù)據(jù)構(gòu)建精準(zhǔn)用戶畫像?


用戶屬性指相對(duì)靜態(tài)和穩(wěn)定的人口屬性,例如:性別、年齡區(qū)間、地域、受教育程度、學(xué)校、公司……這些信息的收集和建立主要依靠產(chǎn)品本身的引導(dǎo)、調(diào)查、第三方提供等。微博本身就有比較完整的用戶注冊(cè)引導(dǎo)、用戶信息完善任務(wù)、認(rèn)證用戶審核、以及大量的合作對(duì)象等,在收集和清洗用戶屬性的過(guò)程中,需要注意的主要是標(biāo)簽的規(guī)范化以及不同來(lái)源信息的交叉驗(yàn)證。


用戶興趣則是更加動(dòng)態(tài)和易變化的特征,首先興趣受到人群、環(huán)境、熱點(diǎn)事件、行業(yè)……等方面的影響,一旦這些因素發(fā)生變化,用戶的興趣容易產(chǎn)生遷移;其次,用戶的行為(特指在互聯(lián)網(wǎng)上的行為)多樣且碎片化,不同行為反映出來(lái)的興趣差異較大。接下來(lái)主要介紹一下微博畫像中興趣維度的構(gòu)建方法。

2.微博用戶興趣分析

1

標(biāo)簽來(lái)源


用戶自標(biāo)簽、達(dá)人或認(rèn)證標(biāo)簽、公司、學(xué)校、微群標(biāo)簽、星座、微博關(guān)鍵詞……這些來(lái)源都可能成為用戶的標(biāo)簽。而針對(duì)每個(gè)特定的用戶收集標(biāo)簽除了其自身以外,他關(guān)注用戶的標(biāo)簽也會(huì)傳遞到該用戶身上。如圖2所示(藍(lán)色實(shí)線代表關(guān)注關(guān)系,橙色虛線代表興趣標(biāo)簽來(lái)源)。


如何用大數(shù)據(jù)構(gòu)建精準(zhǔn)用戶畫像?


2

權(quán)重計(jì)算


在收集到一個(gè)用戶可能存在的標(biāo)簽后,還需要給標(biāo)簽賦一定的權(quán)重,用來(lái)區(qū)分不同標(biāo)簽對(duì)于該用戶的重要程度。不同標(biāo)簽的來(lái)源用戶質(zhì)量,標(biāo)簽的傳遞路徑,轉(zhuǎn)發(fā)關(guān)系,標(biāo)簽的本身,以及標(biāo)簽與用戶之間的共現(xiàn)關(guān)系都會(huì)考慮在內(nèi)。


不同質(zhì)量的用戶自身產(chǎn)生的標(biāo)簽權(quán)重不一樣,質(zhì)量越高,認(rèn)為該標(biāo)簽的可信度越高,無(wú)論是將該標(biāo)簽賦給自己還是傳遞出去的時(shí)候其權(quán)重值越高。


標(biāo)簽的傳遞路徑主要是針對(duì)基于關(guān)注關(guān)系的標(biāo)簽傳遞,親密度比較高的關(guān)注用戶傳遞過(guò)來(lái)的標(biāo)簽權(quán)重值會(huì)比較高。


標(biāo)簽是來(lái)自于用戶的原創(chuàng)還是其轉(zhuǎn)發(fā)的微博,權(quán)重值會(huì)有區(qū)別,一般來(lái)說(shuō)原創(chuàng)的權(quán)重會(huì)高于轉(zhuǎn)發(fā)權(quán)重。


如果標(biāo)簽本身是一個(gè)非常常見的詞,那么它用于刻畫用戶的興趣的區(qū)分性是比較差的,相反如果是一個(gè)長(zhǎng)尾詞,則區(qū)分性較強(qiáng)。出于這樣的考慮,越是長(zhǎng)尾詞,標(biāo)簽的權(quán)重值會(huì)越高。


標(biāo)簽與用戶的共現(xiàn)關(guān)系是指用戶和該標(biāo)簽是否經(jīng)常共同出現(xiàn),評(píng)價(jià)的是兩者的關(guān)聯(lián)性。關(guān)聯(lián)性越高,則標(biāo)簽的權(quán)重值越高。


綜合上述的因素,一個(gè)標(biāo)簽對(duì)于特定用戶的權(quán)重值可以大致表示為:標(biāo)簽權(quán)重 = (來(lái)源因子 + 親密度因子 + 轉(zhuǎn)發(fā)因子 + 長(zhǎng)尾因子) × 共現(xiàn)因子。


3

時(shí)效性


隨著時(shí)間的變化,用戶的興趣會(huì)發(fā)生轉(zhuǎn)移,時(shí)間越久遠(yuǎn),標(biāo)簽的權(quán)重應(yīng)該相應(yīng)的下降,距離當(dāng)前時(shí)間越近的興趣標(biāo)簽應(yīng)該得到適當(dāng)突出。出于這樣的考慮,一般會(huì)在標(biāo)簽權(quán)重值上疊加一個(gè)時(shí)間衰減函數(shù),這個(gè)時(shí)間衰減函數(shù)被設(shè)計(jì)成如圖3所示的指數(shù)衰減的形式,通過(guò)定義衰減幅度和半衰期,調(diào)節(jié)衰減的程度,體現(xiàn)不同的時(shí)效性。


此外,針對(duì)用戶的興趣,還會(huì)設(shè)定一個(gè)較小的時(shí)間窗口來(lái)獲取用戶的短期興趣。通過(guò)用戶在短時(shí)間內(nèi)的原創(chuàng)、轉(zhuǎn)發(fā)和關(guān)注行為收集興趣標(biāo)簽,并計(jì)算標(biāo)簽的權(quán)重。短期興趣更新周期會(huì)較長(zhǎng)期興趣更短,興趣更集中,但是能夠比較及時(shí)地反應(yīng)用戶興趣的變化。

4

從興趣到能力


然而,用戶具有某方面的興趣,只代表了他愿意接受這方面的信息,并不能代表他具有產(chǎn)生相關(guān)內(nèi)容的能力。因此,在挖掘了用戶興趣標(biāo)簽的基礎(chǔ)上,還需要發(fā)掘哪些用戶能夠針對(duì)特定的標(biāo)簽具有一定的內(nèi)容生產(chǎn)能力。


微博中的關(guān)注關(guān)系可以認(rèn)為是一種認(rèn)證,具有相同興趣的用戶之間的關(guān)注則有可能是興趣相投(當(dāng)然也可能不是,但畢竟有一定的指導(dǎo)性),那么將具有相同興趣標(biāo)簽的用戶提出來(lái),通過(guò)關(guān)注關(guān)系構(gòu)成一個(gè)圖,被認(rèn)證得最多的用戶(被關(guān)注邊指向得最多)被認(rèn)為在這個(gè)興趣標(biāo)簽上具有最強(qiáng)能力。如圖4所示中的帶紅色邊框的用戶。





歡網(wǎng)大數(shù)據(jù)開啟“全網(wǎng)+跨屏”用戶畫像新時(shí)代

來(lái)源:新華網(wǎng)


  長(zhǎng)期以來(lái),智能電視行業(yè)一直局限于電視端數(shù)據(jù)進(jìn)行用戶畫像分析,希望以此進(jìn)行精準(zhǔn)營(yíng)銷,難道僅基于電視端收視數(shù)據(jù)進(jìn)行用戶畫像就可以實(shí)現(xiàn)精準(zhǔn)營(yíng)銷嗎?此方式雖然取得一些成果,但是距大數(shù)據(jù)時(shí)代眾多收視用戶的精準(zhǔn)營(yíng)銷還是距離遙遠(yuǎn)。近日,歡網(wǎng)大數(shù)據(jù)以卓越創(chuàng)新的“全網(wǎng)+跨屏”理念,掀起了電視行業(yè)融合全網(wǎng)大數(shù)據(jù)的精準(zhǔn)營(yíng)銷革命,該理念通過(guò)關(guān)聯(lián)智能電視與PC、移動(dòng)端數(shù)據(jù),不僅能夠跨屏識(shí)別用戶,而且可以獲悉用戶在不同終端的使用行為。此舉打破傳統(tǒng)電視行業(yè)信息孤島,實(shí)現(xiàn)跨屏全網(wǎng)數(shù)據(jù)融合,顛覆電視端營(yíng)銷方式,打造通過(guò)分析用戶線上線下行為數(shù)據(jù)獲知真實(shí)潛在需求的精準(zhǔn)營(yíng)銷平臺(tái),并以此提升基于智能電視平臺(tái)所實(shí)現(xiàn)的“增強(qiáng)電視”、“T2O”等一系列精準(zhǔn)營(yíng)銷的服務(wù)價(jià)值。

  歡網(wǎng)作為國(guó)內(nèi)最大的互聯(lián)網(wǎng)智能電視服務(wù)商,自創(chuàng)立以來(lái)一直致力于成為電視內(nèi)容的聚合者和分發(fā)者,而用戶畫像是提供個(gè)性化電視營(yíng)銷服務(wù)的基礎(chǔ)?!叭W(wǎng)+跨屏”融合更加全面的用戶數(shù)據(jù),這包括用戶在電視端的收視數(shù)據(jù)、與其它智能終端的行為習(xí)慣數(shù)據(jù)。以熱門綜藝《奔跑吧兄弟2》為例,觀看該節(jié)目的電視用戶,平時(shí)主要活動(dòng)區(qū)域、偏好何種APP軟件、忠愛哪些品牌、喜歡吃什么玩什么等,通過(guò)全網(wǎng)數(shù)據(jù)的融合,了解其行為習(xí)慣,建立用戶畫像,將有助于精準(zhǔn)營(yíng)銷、個(gè)性化內(nèi)容推送,再度提升文化娛樂(lè)對(duì)消費(fèi)行為的影響。

  何謂智能電視用戶畫像?是收集、融合并分析智能電視用戶海量收視數(shù)據(jù)以及全網(wǎng)使用行為后,判斷其家庭收視偏好、消費(fèi)行為與能力、家庭成員組成、潛在購(gòu)物傾向等,最終梳理出不同屬性的用戶人群,為業(yè)務(wù)運(yùn)營(yíng)提供更充足的信息基礎(chǔ)。

  以下為歡網(wǎng)科技與TalkingData聯(lián)合發(fā)布的熱門綜藝案列分析:

如何用大數(shù)據(jù)構(gòu)建精準(zhǔn)用戶畫像?

如何用大數(shù)據(jù)構(gòu)建精準(zhǔn)用戶畫像?

如何用大數(shù)據(jù)構(gòu)建精準(zhǔn)用戶畫像?

如何用大數(shù)據(jù)構(gòu)建精準(zhǔn)用戶畫像?

如何用大數(shù)據(jù)構(gòu)建精準(zhǔn)用戶畫像?


如何用大數(shù)據(jù)構(gòu)建精準(zhǔn)用戶畫像?

如何用大數(shù)據(jù)構(gòu)建精準(zhǔn)用戶畫像?

如何用大數(shù)據(jù)構(gòu)建精準(zhǔn)用戶畫像?

如何用大數(shù)據(jù)構(gòu)建精準(zhǔn)用戶畫像?

如何用大數(shù)據(jù)構(gòu)建精準(zhǔn)用戶畫像?

如何用大數(shù)據(jù)構(gòu)建精準(zhǔn)用戶畫像?

如何用大數(shù)據(jù)構(gòu)建精準(zhǔn)用戶畫像?

如何用大數(shù)據(jù)構(gòu)建精準(zhǔn)用戶畫像?


  建立全網(wǎng)用戶畫像,是顛覆傳統(tǒng)意義上僅以電視端數(shù)據(jù)進(jìn)行用戶畫像的革命性的營(yíng)銷方式。多端數(shù)據(jù)的結(jié)合,可將更精準(zhǔn)的服務(wù)推送給有潛在需求的用戶,從而幫助需求方鎖定用戶群。此舉有助于電視臺(tái)、節(jié)目組、制作方、廣告商更精確的了解受眾用戶,為之后編播節(jié)目、投放廣告等帶來(lái)極大價(jià)值。

  歡網(wǎng)大數(shù)據(jù)打破了固有的“電視歸電視,互聯(lián)網(wǎng)歸互聯(lián)網(wǎng)”的局面。以“全網(wǎng)+跨屏”探索智能電視與互聯(lián)網(wǎng)行業(yè)的未來(lái),在顛覆傳統(tǒng)理念的同時(shí),讓智能電視用戶享受更優(yōu)質(zhì)的服務(wù)。




大數(shù)據(jù)用戶畫像在金融行業(yè)實(shí)踐


一. 用戶畫像背后的原因


金融消費(fèi)行為的改變,

企業(yè)無(wú)法接觸到客戶

80后、90后總計(jì)共有3.4億人口,并日益成為金融企業(yè)主要的消費(fèi)者,但是他們的金融消費(fèi)習(xí)慣正在改變,他們不愿意到金融網(wǎng)點(diǎn)辦理業(yè)務(wù),不喜歡被動(dòng)接受金融產(chǎn)品和服務(wù)。年輕人將主要的時(shí)間都消費(fèi)在移動(dòng)互聯(lián)網(wǎng),消費(fèi)在智能手機(jī)上。平均每個(gè)人,每天使用智能手機(jī)的時(shí)間超過(guò)了3小時(shí),年輕人可能會(huì)超過(guò)4個(gè)小時(shí)。瀏覽手機(jī)已經(jīng)成為工作和睡覺之后的,人類第三大生活習(xí)慣,移動(dòng)APP也成為所有金融企業(yè)的客戶入口、服務(wù)入口、消費(fèi)入口、數(shù)據(jù)入口。


金融企業(yè)越來(lái)越難面對(duì)面接觸到年輕人,無(wú)法像過(guò)去一樣,從對(duì)話中了解年輕人的想法,了解年輕人金融產(chǎn)品的需求。

消費(fèi)者需求出現(xiàn)分化,需要尋找目標(biāo)客戶

客戶消費(fèi)習(xí)慣的改變,企業(yè)無(wú)法接觸到客戶,無(wú)法了解客戶需求;


客戶需求的分化,企業(yè)需要細(xì)分客戶,為目標(biāo)客戶開發(fā)設(shè)計(jì)產(chǎn)品。


金融企業(yè)需要借助于戶畫像,來(lái)了解客戶,找到目標(biāo)客戶,觸達(dá)客戶。

如何用大數(shù)據(jù)構(gòu)建精準(zhǔn)用戶畫像?


如何用大數(shù)據(jù)構(gòu)建精準(zhǔn)用戶畫像?


二. 用戶畫像的目的


用戶畫像是在解客戶需求和消費(fèi)能力,以及客戶信用額度的基礎(chǔ)上,尋找潛在產(chǎn)品的目標(biāo)客戶,并利用畫像信息為客戶開發(fā)產(chǎn)品。


提到用戶畫像,很多廠商都會(huì)提到360度用戶畫像,其實(shí)經(jīng)常360度客戶畫像是一個(gè)廣告宣傳用語(yǔ),根本不存數(shù)據(jù)可以全面描述客戶,透徹了解客戶。人是非常復(fù)雜的動(dòng)物,信息緯度非常復(fù)雜,僅僅依靠外部信息來(lái)刻畫客戶內(nèi)心需要根本不可能。


用戶畫像一詞具有很重的場(chǎng)景因素,不同企業(yè)對(duì)于用戶畫像有著不同對(duì)理解和需求。舉個(gè)例子,金融行業(yè)和汽車行業(yè)對(duì)于用戶畫像需求的信息完全不一樣,信息緯度也不同,對(duì)畫像結(jié)果要求也不同。每個(gè)行業(yè)都有一套適合自己行業(yè)的用戶畫像方法,但是其核心都是為客戶服務(wù),為業(yè)務(wù)場(chǎng)景服務(wù)。


用戶畫像本質(zhì)就是從業(yè)務(wù)角度出發(fā)對(duì)用戶進(jìn)行分析,了解用戶需求,尋找目標(biāo)客戶。另外一個(gè)方面就是,金融企業(yè)利用統(tǒng)計(jì)的信息,開發(fā)出適合目標(biāo)客戶的產(chǎn)品。


從商業(yè)角度出發(fā)的用戶畫像對(duì)企業(yè)具有很大的價(jià)值,用戶畫像目的有兩個(gè)。

一個(gè)是業(yè)務(wù)場(chǎng)景出發(fā),尋找目標(biāo)客戶。另外一個(gè)就是,參考用戶畫像的信息,為用戶設(shè)計(jì)產(chǎn)品或開展?fàn)I銷活動(dòng)。


如何用大數(shù)據(jù)構(gòu)建精準(zhǔn)用戶畫像?


三. 用戶畫像工作堅(jiān)持的原則


市場(chǎng)上用戶畫像的方法很多,許多企業(yè)也提供用戶畫像服務(wù),將用戶畫像提升到很有逼格一件事。金融企業(yè)是最早開始用戶畫像的行業(yè),由于擁有豐富的數(shù)據(jù),金融企業(yè)在進(jìn)行用戶畫像時(shí),對(duì)眾多緯度的數(shù)據(jù)無(wú)從下手,總是認(rèn)為用戶畫像數(shù)據(jù)緯度越多越好,畫像數(shù)據(jù)越豐富越好,某些輸入的數(shù)據(jù)還設(shè)定了權(quán)重甚至建立了模型,搞的用戶畫像是一個(gè)巨大而復(fù)雜的工程。但是費(fèi)力很大力氣進(jìn)行了畫像之后,卻發(fā)現(xiàn)只剩下了用戶畫像,和業(yè)務(wù)相聚甚遠(yuǎn),沒(méi)有辦法直接支持業(yè)務(wù)運(yùn)營(yíng),投入精力巨大但是回報(bào)微小,可以說(shuō)是得不償失,無(wú)法向領(lǐng)導(dǎo)交代。


事實(shí)上,用戶畫像涉及數(shù)據(jù)的緯度需要業(yè)務(wù)場(chǎng)景結(jié)合,既要簡(jiǎn)單干練又要和業(yè)務(wù)強(qiáng)相關(guān),既要篩選便捷又要方便進(jìn)一步操作。用戶畫像需要堅(jiān)持三個(gè)原則,分別是人口屬性和信用信息為主,強(qiáng)相關(guān)信息為主,定性數(shù)據(jù)為主。下面就分別展開進(jìn)行解釋和分析。

3.1

信用信息和人口屬性為主

描述一個(gè)用戶的信息很多,信用信息是用戶畫像中重要的信息,信用信息是描述一個(gè)人在社會(huì)中的消費(fèi)能力信息。任何企業(yè)進(jìn)行用戶畫像的目的是尋找目標(biāo)客戶,其必須是具有潛在消費(fèi)能力的用戶。信用信息可以直接證明客戶的消費(fèi)能力,是用戶畫像中最重要和基礎(chǔ)的信息。一句戲言,所有的信息都是信用信息就是這個(gè)道理。其包含消費(fèi)者工作、收入、學(xué)歷、財(cái)產(chǎn)等信息。


定位完目標(biāo)客戶之后,金融企業(yè)需要觸達(dá)客戶,人口屬性信息就是起到觸達(dá)客戶的作用,人口屬性信息包含姓名、性別,電話號(hào)碼,郵件地址,家庭住址等信息。這些信息可以幫助金融企業(yè)聯(lián)系客戶,將產(chǎn)品和服務(wù)推銷給客戶。

3.2

采用強(qiáng)相關(guān)信息,忽略弱相關(guān)信息

我們需要介紹一下強(qiáng)相關(guān)信息和弱相關(guān)信息。強(qiáng)相關(guān)信息就是同場(chǎng)景需求直接相關(guān)的信息,其可以是因果信息,也可以是相關(guān)程度很高的信息。

如果定義采用0到1作為相關(guān)系數(shù)取值范圍的化,0.6以上的相關(guān)系數(shù)就應(yīng)該定義為強(qiáng)相關(guān)信息。例如在其他條件相同的前提下,35歲左右人的平均工資高于平均年齡為30歲的人,計(jì)算機(jī)專業(yè)畢業(yè)的學(xué)生平均工資高于哲學(xué)專業(yè)學(xué)生,從事金融行業(yè)工作的平均工資高于從事紡織行業(yè)的平均工資,上海的平均工資超過(guò)海南省平均工資。從這些信息可以看出來(lái)人的年齡、學(xué)歷、職業(yè)、地點(diǎn)對(duì)收入的影響較大,同收入高低是強(qiáng)相關(guān)關(guān)系。簡(jiǎn)單的將,對(duì)信用信息影響較大的信息就是強(qiáng)相關(guān)信息,反之則是弱相關(guān)信息。

用戶其他的信息,例如用戶的身高、體重、姓名、星座等信息,很難從概率上分析出其對(duì)消費(fèi)能力的影響,這些弱相關(guān)信息,這些信息就不應(yīng)該放到用戶畫像中進(jìn)行分析,對(duì)用戶的信用消費(fèi)能力影響很小,不具有較大的商業(yè)價(jià)值。

用戶畫像和用戶分析時(shí),需要考慮強(qiáng)相關(guān)信息,不要考慮弱相關(guān)信息,這是用戶畫像的一個(gè)原則。

3.3

將定量的信息歸類為定性的信息

用戶畫像的目的是為產(chǎn)品篩選出目標(biāo)客戶,定量的信息不利于對(duì)客戶進(jìn)行篩選,需要將定量信息轉(zhuǎn)化為定性信息,通過(guò)信息類別來(lái)篩選人群。

例如可以將年齡段對(duì)客戶進(jìn)行劃分,18歲-25歲定義為年輕人,25歲-35歲定義為中青年,36-45定義為中年人等??梢詤⒖紓€(gè)人收入信息,將人群定義為高收入人群,中等收入人群,低收入人群。參考資產(chǎn)信息也可以將客戶定義為高、中、低級(jí)別。定性信息的類別和方式方法,金融可以從自身業(yè)務(wù)出發(fā),沒(méi)有固定的模式。

將金融企業(yè)各類定量信息,集中在一起,對(duì)定性信息進(jìn)行分類,并進(jìn)行定性化,有利與對(duì)用戶進(jìn)行篩選,快速定位目標(biāo)客戶,是用戶畫像的另外一個(gè)原則。

如何用大數(shù)據(jù)構(gòu)建精準(zhǔn)用戶畫像?

如何用大數(shù)據(jù)構(gòu)建精準(zhǔn)用戶畫像?



用戶畫像的方法介紹,不要太復(fù)雜


金融企業(yè)需要結(jié)合業(yè)務(wù)需求進(jìn)行用戶畫像,從實(shí)用角度出發(fā),我們可以將用戶畫像信息分成五類信息。分別是人口屬性,信用屬性,消費(fèi)特征,興趣愛好,社交屬性。它們基本覆蓋了業(yè)務(wù)需求所需要的強(qiáng)相關(guān)信息,結(jié)合外部場(chǎng)景數(shù)據(jù)將會(huì)產(chǎn)生巨大的商業(yè)價(jià)值。我們先了解下用戶畫像的五大類信息的作用,以及涉及的強(qiáng)相關(guān)信息。特別復(fù)雜的用戶畫像緯度例如八個(gè)緯度,十個(gè)緯度信息都不利于商業(yè)應(yīng)用,不建議金融企業(yè)進(jìn)行采用,其他具有價(jià)值的信息,基本上都可以歸納到這五個(gè)緯度。金融企業(yè)達(dá)到其商業(yè)需求,從這五個(gè)緯度信息進(jìn)行應(yīng)用就可以了,不需要過(guò)于復(fù)雜用戶畫像這個(gè)工作,同時(shí)商業(yè)意義也不太大。


4.1

人口屬性

用于描述一個(gè)人基本特征的信息,主要作用是幫助金融企業(yè)知道客戶是誰(shuí),如何觸達(dá)用戶。姓名,性別,年齡,電話號(hào)碼,郵箱,家庭住址都屬于人口屬性信息。

4.2

信用屬性

用于描述用戶收入潛力和收入情況,支付能力。幫助企業(yè)了解客戶資產(chǎn)情況和信用情況,有利于定位目標(biāo)客戶。客戶職業(yè)、收入、資產(chǎn)、負(fù)債、學(xué)歷、信用評(píng)分等都屬于信用信息。

4.3

消費(fèi)特征

用于描述客戶主要消費(fèi)習(xí)慣和消費(fèi)偏好,用于尋找高頻和高價(jià)值客戶。幫助企業(yè)依據(jù)客戶消費(fèi)特點(diǎn)推薦相關(guān)金融產(chǎn)品和服務(wù),轉(zhuǎn)化率將非常高。為了便于篩選客戶,可以參考客戶的消費(fèi)記錄將客戶直接定性為某些消費(fèi)特征人群,例如差旅人群,境外游人群,旅游人群,餐飲用戶,汽車用戶,母嬰用戶,理財(cái)人群等。

4.4

興趣愛好

用于描述客戶具有哪方面的興趣愛好,在這些興趣方面可能消費(fèi)偏好比較高。幫助企業(yè)了解客戶興趣和消費(fèi)傾向,定向進(jìn)行活動(dòng)營(yíng)銷。興趣愛好的信息可能會(huì)和消費(fèi)特征中部分信息有重復(fù),區(qū)別在于數(shù)據(jù)來(lái)源不同。消費(fèi)特征來(lái)源于已有的消費(fèi)記錄,但是購(gòu)買的物品和服務(wù)不一定是自己享用,但是興趣愛好代表本人的真實(shí)興趣。例如戶外運(yùn)動(dòng)愛好者,旅游愛好者,電影愛好者,科技發(fā)燒友,健身愛好者,奢侈品愛好者等。興趣愛好的信息可能來(lái)源于社交信息和客戶位置信息。

4.5

社交信息

用于描述用戶在社交媒體的評(píng)論,這些信息往往代表用戶內(nèi)心的想法和需求,具有實(shí)時(shí)性高,轉(zhuǎn)化率高的特點(diǎn)。例如客戶詢問(wèn)上海哪里好玩?澳大利亞墨爾本的交通?房屋貸款哪家優(yōu)惠多?那個(gè)理財(cái)產(chǎn)品好?這些社交信息都是代表客戶多需求,如果企業(yè)可以及時(shí)了解到,將會(huì)有助于產(chǎn)品推廣。

如何用大數(shù)據(jù)構(gòu)建精準(zhǔn)用戶畫像?

這些用戶畫像信息歸類基本覆蓋了業(yè)務(wù)需求和產(chǎn)品開發(fā)所需要的信息,需要對(duì)這些信息進(jìn)行進(jìn)行整理和處理。根據(jù)業(yè)務(wù)場(chǎng)景,將定量的數(shù)據(jù)轉(zhuǎn)化為定性的數(shù)據(jù),并將強(qiáng)相關(guān)數(shù)據(jù)進(jìn)行整理。(36大數(shù)據(jù))

5

金融企業(yè)用戶畫像的基本步驟


參考金融企業(yè)的數(shù)據(jù)類型和業(yè)務(wù)需求,可以將金融企業(yè)用戶畫像工作進(jìn)行細(xì)化?;旧蠌臄?shù)據(jù)集中到數(shù)據(jù)處理,從強(qiáng)相關(guān)數(shù)據(jù)到定性分類數(shù)據(jù),從引入外部數(shù)據(jù)到依據(jù)業(yè)務(wù)場(chǎng)景進(jìn)行篩選目標(biāo)用戶。


5.1

畫像相關(guān)數(shù)據(jù)的整理和集中

金融企業(yè)內(nèi)部的信息分布在不同的系統(tǒng)中,一般情況下,人口屬性信息主要集中在客戶關(guān)系管理系統(tǒng),信用信息主要集中在交易系統(tǒng)和產(chǎn)品系統(tǒng)之中,也集中在客戶關(guān)系管理系統(tǒng)中,消費(fèi)特征主要集中在渠道和產(chǎn)品系統(tǒng)中。


興趣愛好和社交信息需要從外部引入,例如客戶的行為軌跡可以代表其興趣愛好和品牌愛好,移動(dòng)設(shè)備到位置信息可以提供較為準(zhǔn)確的興趣愛好信息。社交信息,可以借助于金融行業(yè)自身的文本挖掘能力進(jìn)行采集和分析,也是可以借助于廠商的技術(shù)能力在社交網(wǎng)站上直接獲得。社交信息往往是實(shí)時(shí)信息,商業(yè)價(jià)值較高,轉(zhuǎn)化率也較高,是大數(shù)據(jù)預(yù)測(cè)方面的主要信息來(lái)源。例如用戶在社交網(wǎng)站上提出羅馬哪里好玩的問(wèn)題,就代表用戶未來(lái)可能有出國(guó)旅游的需求;如果客戶在對(duì)比兩款汽車的優(yōu)良,客戶購(gòu)買汽車的可能性就較大。金融企業(yè)可以及時(shí)介入,為客戶提供金融服務(wù)。


客戶畫像數(shù)據(jù)主要分為五類,人口屬性、信用信息、消費(fèi)特征、興趣愛好、社交信息。這些數(shù)據(jù)都分布在不同的信息系統(tǒng),金融企業(yè)都上線了數(shù)據(jù)倉(cāng)庫(kù)(DW),所有畫像相關(guān)的強(qiáng)相關(guān)信息都可以從數(shù)據(jù)倉(cāng)庫(kù)里面整理和集中,并且依據(jù)畫像商業(yè)需求,利用跑批作業(yè),加工數(shù)據(jù),生成用戶畫像的原始數(shù)據(jù)。


數(shù)據(jù)倉(cāng)庫(kù)成為用戶畫像數(shù)據(jù)的主要處理工具,依據(jù)業(yè)務(wù)場(chǎng)景和畫像需求將原始數(shù)據(jù)進(jìn)行分類、篩選、歸納、加工等,生成用戶畫像需要的原始數(shù)據(jù)。


用戶畫像的緯度信息不是越多越好,只需要找到這五大類畫像信息強(qiáng)相關(guān)信息,同業(yè)務(wù)場(chǎng)景強(qiáng)相關(guān)信息,同產(chǎn)品和目標(biāo)客戶強(qiáng)相關(guān)信息即可。根本不存在360度的用戶畫像信息,也不存在豐富的信息可以完全了解客戶,另外數(shù)據(jù)的實(shí)效性也要重點(diǎn)考慮。

5.2

找到同業(yè)務(wù)場(chǎng)景強(qiáng)相關(guān)數(shù)據(jù)

依據(jù)用戶畫像的原則,所有畫像信息應(yīng)該是五大分類的強(qiáng)相關(guān)信息。強(qiáng)相關(guān)信息是指同業(yè)務(wù)場(chǎng)景強(qiáng)相關(guān)信息,可以幫助金融行業(yè)定位目標(biāo)客戶,了解客戶潛在需求,開發(fā)需求產(chǎn)品。


只有強(qiáng)相關(guān)信息才能幫助金融企業(yè)有效結(jié)合業(yè)務(wù)需求,創(chuàng)造商業(yè)價(jià)值。例如姓名、手機(jī)號(hào)、家庭地址就是能夠觸達(dá)客戶的強(qiáng)人口屬性信息,收入、學(xué)歷、職業(yè)、資產(chǎn)就是客戶信用信息的強(qiáng)相關(guān)信息。差旅人群、境外游人群、汽車用戶、旅游人群、母嬰人群就是消費(fèi)特征的強(qiáng)相關(guān)信息。攝影愛好者、游戲愛好者、健身愛好者、電影人群、戶外愛好者就是客戶興趣愛好的強(qiáng)相關(guān)信息。社交媒體上發(fā)表的旅游需求,旅游攻略,理財(cái)咨詢,汽車需求,房產(chǎn)需求等信息代表了用戶的內(nèi)心需求,是社交信息場(chǎng)景應(yīng)用的強(qiáng)相關(guān)信息。


金融企業(yè)內(nèi)部信息較多,在用戶畫像階段不需要對(duì)所有信息都采用,只需要采用同業(yè)務(wù)場(chǎng)景和目標(biāo)客戶強(qiáng)相關(guān)的信息即可,這樣有助于提高產(chǎn)品轉(zhuǎn)化率,降低投資回報(bào)率(ROI),有利于簡(jiǎn)單找到業(yè)務(wù)應(yīng)用場(chǎng)景,在數(shù)據(jù)變現(xiàn)過(guò)程中也容易實(shí)現(xiàn)。


千萬(wàn)不要將用戶畫像工作搞的過(guò)于復(fù)雜,同業(yè)務(wù)場(chǎng)景關(guān)系不大,這樣就讓很多金融企業(yè)特別是領(lǐng)導(dǎo)失去用戶畫像的興趣,看不到用戶畫像的商業(yè),不愿意在大數(shù)據(jù)領(lǐng)域投資。為企業(yè)帶來(lái)商業(yè)價(jià)值才是用戶畫像工作的主要?jiǎng)恿椭饕康摹?/p>

5.3

對(duì)數(shù)據(jù)進(jìn)行分類和標(biāo)簽化(定量to定性)

金融企業(yè)集中了所有信息之后,依據(jù)業(yè)務(wù)需求,對(duì)信息進(jìn)行加工整理,需要對(duì)定量的信息進(jìn)行定性,方便信息分類和篩選。這部分工作建議在數(shù)據(jù)倉(cāng)庫(kù)進(jìn)行,不建議在大數(shù)據(jù)管理平臺(tái)(DMP)里進(jìn)行加工。


定性信息進(jìn)行定量分類是用戶畫像的一個(gè)重要工作環(huán)節(jié),具有較高的業(yè)務(wù)場(chǎng)景要求,考驗(yàn)用戶畫像商業(yè)需求的轉(zhuǎn)化。其主要目的是幫助企業(yè)將復(fù)雜數(shù)據(jù)簡(jiǎn)單化,將交易數(shù)據(jù)定性進(jìn)行歸類,并且融入商業(yè)分析的要求,對(duì)數(shù)據(jù)進(jìn)行商業(yè)加工。例如可以將客戶按照年齡區(qū)間分為學(xué)生,青年,中青年,中年,中老年,老年等人生階段。源于各人生階段的金融服務(wù)需求不同,在尋找目標(biāo)客戶時(shí),可以通過(guò)人生階段進(jìn)行目標(biāo)客戶定位。企業(yè)可以利用客戶的收入、學(xué)歷、資產(chǎn)等情況將客戶分為低、中、高端客戶,并依據(jù)其金融服務(wù)需求,提供不同的金融服務(wù)??梢詤⒖计浣鹑谙M(fèi)記錄和資產(chǎn)信息,以及交易產(chǎn)品,購(gòu)買的產(chǎn)品,將客戶消費(fèi)特征進(jìn)行定性描述,區(qū)分出電商客戶,理財(cái)客戶,保險(xiǎn)客戶,穩(wěn)健投資客戶,激進(jìn)投資客戶,餐飲客戶,旅游客戶,高端客戶,公務(wù)員客戶等。利用外部的數(shù)據(jù)可以將定性客戶的興趣愛好,例如戶外愛好者,奢侈品愛好者,科技產(chǎn)品發(fā)燒友,攝影愛好者,高端汽車需求者等信息。


將定量信息歸納為定性信息,并依據(jù)業(yè)務(wù)需求進(jìn)行標(biāo)簽化,有助于金融企業(yè)找到目標(biāo)客戶,并且了解客戶的潛在需求,為金融行業(yè)的產(chǎn)品找到目標(biāo)客戶,進(jìn)行精準(zhǔn)營(yíng)銷,降低營(yíng)銷成本,提高產(chǎn)品轉(zhuǎn)化率。另外金融企業(yè)還可以依據(jù)客戶的消費(fèi)特征、興趣愛好、社交信息及時(shí)為客戶推薦產(chǎn)品,設(shè)計(jì)產(chǎn)品,優(yōu)化產(chǎn)品流程。提高產(chǎn)品銷售的活躍率,幫助金融企業(yè)更好地為客戶設(shè)計(jì)產(chǎn)品。

5.4

依據(jù)業(yè)務(wù)需求引入外部數(shù)據(jù)

利用數(shù)據(jù)進(jìn)行畫像目的主要是為業(yè)務(wù)場(chǎng)景提供數(shù)據(jù)支持,包括尋找到產(chǎn)品的目標(biāo)客戶和觸達(dá)客戶。金融企業(yè)自身的數(shù)據(jù)不足以了解客戶的消費(fèi)特征、興趣愛好、社交信息。


金融企業(yè)可以引入外部信息來(lái)豐富客戶畫像信息,例如引入銀聯(lián)和電商的信息來(lái)豐富消費(fèi)特征信息,引入移動(dòng)大數(shù)據(jù)的位置信息來(lái)豐富客戶的興趣愛好信息,引入外部廠商的數(shù)據(jù)來(lái)豐富社交信息等。


外部信息的緯度較多,內(nèi)容也很豐富,但是如何引入外部信息是一項(xiàng)具有挑戰(zhàn)的工作。外部信息在引入時(shí)需要考慮幾個(gè)問(wèn)題,分別是外部數(shù)據(jù)的覆蓋率,如何和內(nèi)部數(shù)據(jù)打通,和內(nèi)部信息的匹配率,以及信息的相關(guān)程度,還有數(shù)據(jù)的鮮活度,這些都是引入外部信息的主要考慮緯度。外部數(shù)據(jù)魚龍混雜,數(shù)據(jù)的合規(guī)性也是金融企業(yè)在引入外部數(shù)據(jù)時(shí)的一個(gè)重要考慮,敏感的信息例如手機(jī)號(hào)、家庭住址、身份證號(hào)在引入或匹配時(shí)都應(yīng)該注意隱私問(wèn)題,基本的原則是不進(jìn)行數(shù)據(jù)交換,可以進(jìn)行數(shù)據(jù)匹配和驗(yàn)證。


外部數(shù)據(jù)不會(huì)集中在某一家,需要金融企業(yè)花費(fèi)大量時(shí)間進(jìn)行尋找。外部數(shù)據(jù)和內(nèi)部數(shù)據(jù)的打通是個(gè)很復(fù)雜的問(wèn)題,手機(jī)號(hào)/設(shè)備號(hào)/身份證號(hào)的MD5數(shù)值匹配是一種好的方法,不涉及隱私數(shù)據(jù)的交換,可以進(jìn)行唯一匹配。依據(jù)行業(yè)內(nèi)部的經(jīng)驗(yàn),沒(méi)有一家企業(yè)外部數(shù)據(jù)可以滿足企業(yè)要求,外部數(shù)據(jù)的引入需要多方面數(shù)據(jù)。一般情況下,數(shù)據(jù)覆蓋率達(dá)到70%以上,就是一個(gè)非常高的覆蓋率。覆蓋率達(dá)到20%以上就可以進(jìn)行商業(yè)應(yīng)用了。


金融行業(yè)外部數(shù)據(jù)源較好合作方有銀聯(lián)、芝麻信用、運(yùn)營(yíng)商、中航信、騰云天下、騰訊、微博、前海征信,各大電商平臺(tái)等。市場(chǎng)上數(shù)據(jù)提供商已經(jīng)很多,并且數(shù)據(jù)質(zhì)量都不錯(cuò),需要金融行業(yè)一家一家去挖掘,或者委托一個(gè)廠商代理引入也可以。獨(dú)立第三方幫助金融行業(yè)引入外部數(shù)據(jù)可以降低數(shù)據(jù)交易成本,同時(shí)也可以降低數(shù)據(jù)合規(guī)風(fēng)險(xiǎn),是一個(gè)不錯(cuò)的嘗試。另外各大城市和區(qū)域的大數(shù)據(jù)交易平臺(tái),也是一個(gè)較好的外部數(shù)據(jù)引入方式。

5.5

按照業(yè)務(wù)需求進(jìn)行篩選客戶(DMP的作用)

用戶畫像主要目的是讓金融企業(yè)挖掘已有的數(shù)據(jù)價(jià)值,利用數(shù)據(jù)畫像技術(shù)尋找到目標(biāo)客戶和客戶的潛在需求,進(jìn)行產(chǎn)品推銷和設(shè)計(jì)改良產(chǎn)品。


用戶畫像從業(yè)務(wù)場(chǎng)景出發(fā),實(shí)現(xiàn)數(shù)據(jù)商業(yè)變現(xiàn)重要方式。用戶畫像是數(shù)據(jù)思維運(yùn)營(yíng)過(guò)程中的一個(gè)重要閉環(huán),幫助金融企業(yè)利用數(shù)據(jù)進(jìn)行精細(xì)化運(yùn)營(yíng)和市場(chǎng)營(yíng)銷,以及產(chǎn)品設(shè)計(jì)。用戶畫像就是一切以數(shù)據(jù)商業(yè)化運(yùn)營(yíng)為中心,以商業(yè)場(chǎng)景為主,幫助金融企業(yè)深度分析客戶,找到目標(biāo)客戶。


DMP(大數(shù)據(jù)管理平臺(tái))在整個(gè)用戶畫像過(guò)程中起到了一個(gè)數(shù)據(jù)變現(xiàn)的作用。從技術(shù)角度來(lái)講,DMP將畫像數(shù)據(jù)進(jìn)行標(biāo)簽化,利用機(jī)器學(xué)習(xí)算法來(lái)找到相似人群,同業(yè)務(wù)場(chǎng)景深度結(jié)合,篩選出具有價(jià)值的數(shù)據(jù)和客戶,定位目標(biāo)客戶,觸達(dá)客戶,對(duì)營(yíng)銷效果進(jìn)行記錄和反饋。大數(shù)據(jù)管理平臺(tái)DMP過(guò)去主要應(yīng)用在廣告行業(yè),在金融行業(yè)應(yīng)用不多,未來(lái)會(huì)成為數(shù)據(jù)商業(yè)應(yīng)用的主要平臺(tái)。


DMP可以幫助信用卡公司篩選出未來(lái)一個(gè)月可能進(jìn)行分期付款的客戶,電子產(chǎn)品重度購(gòu)買客戶,篩選出金融理財(cái)客戶,篩選出高端客戶(在本行資產(chǎn)很少,但是在他行資產(chǎn)很多),篩選出保障險(xiǎn)種,壽險(xiǎn),教育險(xiǎn),車險(xiǎn)等客戶,篩選出穩(wěn)健投資人,激進(jìn)投資人,財(cái)富管理等方面等客戶,并且可以觸達(dá)這些客戶,提高產(chǎn)品轉(zhuǎn)化率,利用數(shù)據(jù)進(jìn)行價(jià)值變現(xiàn)。DMP還可以了解客戶的消費(fèi)習(xí)慣、興趣愛好、以及近期需求,為客戶定制金融產(chǎn)品和服務(wù),進(jìn)行跨界營(yíng)銷。利用客戶的消費(fèi)偏好,提高產(chǎn)品轉(zhuǎn)化率,提高用戶黏度。


DMP還作為引入外部數(shù)據(jù)的平臺(tái),將外部具有價(jià)值的數(shù)據(jù)引入到金融企業(yè)內(nèi)部,補(bǔ)充用戶畫像數(shù)據(jù),創(chuàng)建不同業(yè)務(wù)應(yīng)用場(chǎng)景和商業(yè)需求,特別是移動(dòng)大數(shù)據(jù)、電商數(shù)據(jù)、社交數(shù)據(jù)的應(yīng)用,可以幫助金融企業(yè)來(lái)進(jìn)行數(shù)據(jù)價(jià)值變現(xiàn),讓用戶畫像離商業(yè)應(yīng)用更加近一些,體現(xiàn)用戶畫像的商業(yè)價(jià)值。


用戶畫像的關(guān)鍵不是360度分析客戶,而是為企業(yè)帶來(lái)商業(yè)價(jià)值,離開了商業(yè)價(jià)值談?dòng)脩舢嬒窬褪撬A髅?。金融企業(yè)用戶畫像項(xiàng)目出發(fā)點(diǎn)一定要從業(yè)務(wù)需求出發(fā),從強(qiáng)相關(guān)數(shù)據(jù)出發(fā),從業(yè)務(wù)場(chǎng)景應(yīng)用出發(fā)。用戶畫像的本質(zhì)就是深度分析客戶,掌握具有價(jià)值數(shù)據(jù),找到目標(biāo)客戶,按照客戶需求來(lái)定制產(chǎn)品,利用數(shù)據(jù)實(shí)現(xiàn)價(jià)值變現(xiàn)。

如何用大數(shù)據(jù)構(gòu)建精準(zhǔn)用戶畫像?

6

金融行業(yè)用戶畫像實(shí)踐

6.1

銀行用戶畫像實(shí)踐介紹

銀行具有豐富的交易數(shù)據(jù)、個(gè)人屬性數(shù)據(jù)、消費(fèi)數(shù)據(jù)、信用數(shù)據(jù)和客戶數(shù)據(jù),用戶畫像的需求較大。但是缺少社交信息和興趣愛好信息。


到銀行網(wǎng)點(diǎn)來(lái)辦業(yè)務(wù)的人年紀(jì)偏大,未來(lái)消費(fèi)者主要在網(wǎng)上進(jìn)行業(yè)務(wù)辦理。銀行接觸不到客戶,無(wú)法了解客戶需求,缺少觸達(dá)客戶的手段。分析客戶、了解客戶、找到目標(biāo)客戶、為客戶設(shè)計(jì)其需要的產(chǎn)品,成了銀行進(jìn)行用戶畫像的主要目的。銀行的主要業(yè)務(wù)需求集中在消費(fèi)金融、財(cái)富管理、融資服務(wù),用戶畫像要從這幾個(gè)角度出發(fā),尋找目標(biāo)客戶。


銀行的客戶數(shù)據(jù)很豐富,數(shù)據(jù)類型和總量較多,系統(tǒng)也很多??梢試?yán)格遵循用戶畫像的五大步驟。先利用數(shù)據(jù)倉(cāng)庫(kù)進(jìn)行數(shù)據(jù)集中,篩選出強(qiáng)相關(guān)信息,對(duì)定量信息定性化,生成DMP需要的數(shù)據(jù)。利用DMP進(jìn)行基礎(chǔ)標(biāo)簽和應(yīng)用定制,結(jié)合業(yè)務(wù)場(chǎng)景需求,進(jìn)行目標(biāo)客戶篩選或?qū)τ脩暨M(jìn)行深度分析。同時(shí)利用DMP引入外部數(shù)據(jù),完善數(shù)據(jù)場(chǎng)景設(shè)計(jì),提高目標(biāo)客戶精準(zhǔn)度。找到觸達(dá)客戶的方式,對(duì)客戶進(jìn)行營(yíng)銷,并對(duì)營(yíng)銷效果進(jìn)行反饋,衡量數(shù)據(jù)產(chǎn)品的商業(yè)價(jià)值。利用反饋數(shù)據(jù)來(lái)修正營(yíng)銷活動(dòng)和提高ROI。形成市場(chǎng)營(yíng)銷的閉環(huán),實(shí)現(xiàn)數(shù)據(jù)商業(yè)價(jià)值變現(xiàn)的閉環(huán)。另外DMP還可以深度分析客戶,依據(jù)客戶的消費(fèi)特征、興趣愛好、社交需求、信用信息來(lái)開發(fā)設(shè)計(jì)產(chǎn)品,為金融企業(yè)的產(chǎn)品開發(fā)提供數(shù)據(jù)支撐,并為產(chǎn)品銷售方式提供場(chǎng)景數(shù)據(jù)。


簡(jiǎn)單介紹一些DMP可以做到的數(shù)據(jù)場(chǎng)景變現(xiàn)。

A 尋找分期客戶

利用發(fā)卡機(jī)構(gòu)數(shù)據(jù)+自身數(shù)據(jù)+信用卡數(shù)據(jù),發(fā)現(xiàn)信用卡消費(fèi)超過(guò)其月收入的用戶,推薦其進(jìn)行消費(fèi)分期。

B 尋找高端資產(chǎn)客戶

利用發(fā)卡機(jī)構(gòu)數(shù)據(jù)+移動(dòng)位置數(shù)據(jù)(別墅/高檔小區(qū))+物業(yè)費(fèi)代扣數(shù)據(jù)+銀行自身數(shù)據(jù)+汽車型號(hào)數(shù)據(jù),發(fā)現(xiàn)在銀行資產(chǎn)較少,在其他行資產(chǎn)較多的用戶,為其提供高端資產(chǎn)管理服務(wù)。

C 尋找理財(cái)客戶

利用自身數(shù)據(jù)(交易+工資)+移動(dòng)端理財(cái)客戶端/電商活躍數(shù)據(jù)。發(fā)現(xiàn)客戶將工資/資產(chǎn)轉(zhuǎn)到外部,但是電商消費(fèi)不活躍客戶,其互聯(lián)網(wǎng)理財(cái)可能性較大,可以為其提供理財(cái)服務(wù),將資金留在本行。

D 尋找境外游客戶

利用自身卡消費(fèi)數(shù)據(jù)+移動(dòng)設(shè)備位置信息+社交好境外強(qiáng)相關(guān)數(shù)據(jù)(攻略,航線,景點(diǎn),費(fèi)用),尋找境外游客戶為其提供金融服務(wù)。

E 尋找貸款客戶

利用自身數(shù)據(jù)(人口屬性+信用信息)+移動(dòng)設(shè)備位置信息+社交購(gòu)房/消費(fèi)強(qiáng)相關(guān)信息,尋找即將購(gòu)車/購(gòu)房的目標(biāo)客戶,為其提供金融服務(wù)(抵押貸款/消費(fèi)貸款)。

如何用大數(shù)據(jù)構(gòu)建精準(zhǔn)用戶畫像?

6.2

保險(xiǎn)行業(yè)用戶畫像實(shí)踐

保險(xiǎn)行業(yè)的產(chǎn)品是一個(gè)長(zhǎng)周期產(chǎn)品,保險(xiǎn)客戶再次購(gòu)買保險(xiǎn)產(chǎn)品的轉(zhuǎn)化率很高,經(jīng)營(yíng)好老客戶是保險(xiǎn)公司一項(xiàng)重要任務(wù)。保險(xiǎn)公司內(nèi)部的交易系統(tǒng)不多,交易方式不是很復(fù)雜,數(shù)據(jù)主要集中在產(chǎn)品系統(tǒng)和交易系統(tǒng)之中,客戶關(guān)系管理系統(tǒng)中也包含豐富了信息,但是數(shù)據(jù)集中在很多保險(xiǎn)公司還沒(méi)有完成,數(shù)據(jù)倉(cāng)庫(kù)建設(shè)可能需要在用戶畫像建設(shè)前完成。


保險(xiǎn)公司主要數(shù)據(jù)有人口屬性信息,信用信息,產(chǎn)品銷售信息,客戶家人信息。缺少興趣愛好、消費(fèi)特征、社交信息等信息。保險(xiǎn)產(chǎn)品主要有壽險(xiǎn),車險(xiǎn),保障,財(cái)產(chǎn)險(xiǎn),意外險(xiǎn),養(yǎng)老險(xiǎn),旅游險(xiǎn)。


保險(xiǎn)行業(yè)DMP用戶畫像的業(yè)務(wù)場(chǎng)景都是圍繞保險(xiǎn)產(chǎn)品進(jìn)行的,簡(jiǎn)單的應(yīng)用場(chǎng)景可以是。

A

依據(jù)自身數(shù)據(jù)(個(gè)人屬性)+外部養(yǎng)車App活躍情況,為保險(xiǎn)公司找到車險(xiǎn)客戶。

B

依據(jù)自身數(shù)據(jù)(個(gè)人屬性)+移動(dòng)設(shè)備位置信息,為保險(xiǎn)企業(yè)找到商旅人群,推銷意外險(xiǎn)和保障險(xiǎn)。

C

依據(jù)自身數(shù)據(jù)(家人數(shù)據(jù))+人生階段信息,為用戶推薦理財(cái)保險(xiǎn),壽險(xiǎn),保障保險(xiǎn),養(yǎng)老險(xiǎn),教育險(xiǎn)。

D

依據(jù)自身數(shù)據(jù)+外部數(shù)據(jù),為高端人士提供財(cái)產(chǎn)險(xiǎn)和壽險(xiǎn)。

6.3

證券行業(yè)用戶畫像

2015年4月13日,一碼通實(shí)施之后,證券行業(yè)面臨了互聯(lián)網(wǎng)證券平臺(tái)的強(qiáng)力競(jìng)爭(zhēng),依據(jù)某機(jī)構(gòu)發(fā)布的金融App排行榜,移動(dòng)互聯(lián)網(wǎng)證券App,排名前5位的證券類App,只有一家傳統(tǒng)券商。排名第一的互聯(lián)網(wǎng)券商是排名第一傳統(tǒng)券商的6倍,前三名的互聯(lián)券商總體覆蓋用戶接近6000萬(wàn)用戶。用戶總數(shù)還在不斷增加。傳統(tǒng)證券行業(yè)現(xiàn)在面臨的主要挑戰(zhàn)是用戶交易賬戶的爭(zhēng)奪,證券行業(yè)如何增加新用戶?如何留住用戶?如何提高證券行業(yè)用戶的活躍?如何提高單個(gè)客戶的收入?是證券行業(yè)主要的業(yè)務(wù)需求。


證券行業(yè)擁有的數(shù)據(jù)類型有個(gè)人屬性信息例如用戶名稱,手機(jī)號(hào)碼,家庭地址,郵件地址等。證券公司還擁有交易用戶的資產(chǎn)和交易紀(jì)錄,同時(shí)還擁有用戶收益數(shù)據(jù),利用這些數(shù)據(jù)和外部數(shù)據(jù),證券公司可以利用數(shù)據(jù)建立業(yè)務(wù)場(chǎng)景,篩選目標(biāo)客戶,為用戶提供適合的產(chǎn)品,同時(shí)提高單個(gè)客戶收入。


證券公司可以利用用戶畫像數(shù)據(jù)來(lái)進(jìn)行產(chǎn)品設(shè)計(jì),下面舉幾個(gè)例子,看看用戶畫像和用戶分析來(lái)幫助證券公司創(chuàng)造商業(yè)價(jià)值。

7

外部數(shù)據(jù)介紹

金融企業(yè)內(nèi)部數(shù)據(jù)主要集中在個(gè)人屬性,信用屬性和消費(fèi)特征上,缺少社交屬性和興趣偏好等信息,這些信息可以通過(guò)第三方獲得。


社交數(shù)據(jù)就是客戶在社交媒體上發(fā)表的言論和行為,可以是評(píng)論,文章,圖片,甚至可以是表情符號(hào),音頻和視頻。社交數(shù)據(jù)可以依靠第三方平臺(tái),在社交網(wǎng)站上利用爬蟲技術(shù)進(jìn)行獲得(Spider)。社交數(shù)據(jù)的打通是一個(gè)挑戰(zhàn),如果能夠讓客戶的授權(quán)最好,金融企業(yè)就可以將社交數(shù)據(jù)納入到用戶畫像之中。社交數(shù)據(jù)具有實(shí)時(shí)和反映內(nèi)心需要的特點(diǎn),某銀行已經(jīng)將社交數(shù)據(jù)作為分析客戶需求的一個(gè)重要數(shù)據(jù)緯度。例如如果某一個(gè)客戶在社交媒體上發(fā)表了一個(gè)問(wèn)題,羅馬有哪些好玩的地方,金融企業(yè)就會(huì)推測(cè)客戶可能近期會(huì)有出境游的計(jì)劃,就會(huì)向客戶推銷一些旅游相關(guān)產(chǎn)品。


社交媒體數(shù)據(jù)正在成為金融企業(yè)積極爭(zhēng)取獲得的數(shù)據(jù),除了利用網(wǎng)絡(luò)爬蟲技術(shù)到微博上進(jìn)行數(shù)據(jù)采集之外,金融企業(yè)自身網(wǎng)站上到文本數(shù)據(jù)采集和呼叫中心(call center)紀(jì)錄的信息都可以進(jìn)行文本挖掘。通過(guò)客戶編號(hào),進(jìn)行打通,將其補(bǔ)充到客戶畫像之中。社交數(shù)據(jù)需要通過(guò)數(shù)據(jù)挖掘?qū)⑵涠x為結(jié)構(gòu)化數(shù)據(jù),并且同業(yè)務(wù)場(chǎng)景、客戶需求向結(jié)合,清晰進(jìn)行分類。例如將母嬰論壇發(fā)言活躍的用戶定義為潛在教育需求客戶,將學(xué)生論壇活躍的客戶定義為學(xué)區(qū)房需要客戶,將境外自助游論壇上活躍的客戶定義為境外旅游客戶,將理財(cái)APP上活躍的客戶定義為理財(cái)客戶等。金融企業(yè)完全可以從社交數(shù)據(jù)中挖掘出客戶近期的消費(fèi)需求,及時(shí)進(jìn)行市場(chǎng)營(yíng)銷和定制產(chǎn)品。


興趣愛好數(shù)據(jù)可以借助于移動(dòng)大數(shù)據(jù)位置信息獲得,客戶手機(jī)設(shè)備的位置軌跡信息可以揭示客戶喜歡何種品牌,喜歡吃辣還是吃火鍋,客戶喜歡旅游還是喜歡宅在家里,客戶喜歡看電影還是喜歡運(yùn)動(dòng)。客戶喜歡中檔品牌還是高檔品牌,客戶喜歡喝茶還是喝咖啡。移動(dòng)手機(jī)上App的安裝情況和活動(dòng)頻次一樣可以揭示客戶的興趣和愛好。同時(shí)移動(dòng)大數(shù)據(jù)進(jìn)行加工之后還可以告訴金融企業(yè),客戶近期的需求是買車還是買房。


外部數(shù)據(jù)引入過(guò)程中,金融企業(yè)面臨的巨大挑戰(zhàn)是外部數(shù)據(jù)的覆蓋率,如何打通內(nèi)外部數(shù)據(jù),外部數(shù)據(jù)同內(nèi)部客戶的匹配率,外部數(shù)據(jù)同業(yè)務(wù)的相關(guān)度,外部數(shù)據(jù)的活躍程度等。用戶畫像平臺(tái)(DMP)可以通過(guò)技術(shù)手段將外部數(shù)據(jù)引入到金融企業(yè)內(nèi)部,建立標(biāo)準(zhǔn)的標(biāo)簽體系,提供靈活的用戶畫像方式,按照業(yè)務(wù)場(chǎng)景進(jìn)行篩選客戶。

8

移動(dòng)大數(shù)據(jù)的商業(yè)價(jià)值

移動(dòng)互聯(lián)網(wǎng)時(shí)代,移動(dòng)大數(shù)據(jù)具有較高的商業(yè)價(jià)值。如果一個(gè)用戶不喜歡一個(gè)App,其不會(huì)裝在手機(jī)上。客戶經(jīng)常使用的App可以推測(cè)用戶的興趣愛好和消費(fèi)偏好。另外移動(dòng)設(shè)備的位置信息可以幫助金融企業(yè)了解客戶行為軌跡、興趣愛好、品牌偏好和消費(fèi)需求。

8.1

移動(dòng)App提供一切服務(wù),App可以反映用戶喜好

智能手機(jī)上安裝的App正在代替PC互聯(lián)網(wǎng)為所有客戶提供服務(wù),清晨起床可以看看天氣,了解一下今天的天氣情況。出門時(shí)可以通過(guò)打車App來(lái)預(yù)定出租車,安排出行?;蛘咄ㄟ^(guò)地圖App來(lái)了解路況信息,決定進(jìn)行從哪條路到公司??斓街形鐣r(shí),可以通過(guò)外賣App預(yù)定午餐,如果想出去吃飯可以利用團(tuán)購(gòu)App訂餐和買單。中午可以利用旅游App預(yù)定家庭旅行機(jī)票和酒店,還可以將通過(guò)App看看理財(cái)產(chǎn)品。如果需要看電影,可以通過(guò)票務(wù)App來(lái)預(yù)定要電影票,如果需要看醫(yī)生,可以通過(guò)醫(yī)療App預(yù)約醫(yī)生。晚上可以透過(guò)App購(gòu)物、監(jiān)督子女教育等??梢钥闯鲆苿?dòng)App已經(jīng)可以滿足人們大部分生活需要,提供了人們的衣食住行、教育、醫(yī)療、旅游、金融等服務(wù)。移動(dòng)App包圍了人們的日常生活,成為人們消費(fèi)的主要場(chǎng)所。


智能手機(jī)上App使用的頻率,可以代表用戶的喜好。例如喜歡理財(cái)?shù)目蛻?,其智能手機(jī)上一定會(huì)安裝理財(cái)App,并經(jīng)常使用;母嬰人群也會(huì)安裝和母嬰相關(guān)的App,頻繁使用;商旅人群使用商旅App的頻率一定會(huì)高于其他移動(dòng)用戶。80后、90后的消費(fèi)行為將會(huì)以移動(dòng)互聯(lián)網(wǎng)為主,App的安裝和活躍數(shù)據(jù)更加能夠反應(yīng)出年輕人的消費(fèi)偏好。

8.2

智能設(shè)備的位置信息,商業(yè)價(jià)值廣大

智能手機(jī)設(shè)備的位置信息代表了消費(fèi)者的位置軌跡,這個(gè)軌跡可以推測(cè)出消費(fèi)者的消費(fèi)偏好和習(xí)慣。在美國(guó),移動(dòng)設(shè)備位置信息的商業(yè)化較為成熟,GPS數(shù)據(jù)正在幫助很多企業(yè)進(jìn)行數(shù)據(jù)變現(xiàn),提高社會(huì)運(yùn)營(yíng)效率。在中國(guó),移動(dòng)大數(shù)據(jù)的商業(yè)應(yīng)用剛剛開始,在房地產(chǎn)業(yè)、零售行業(yè)、金融行業(yè)、市場(chǎng)分析等領(lǐng)域取得了一些效果。移動(dòng)大數(shù)據(jù)中的位置信息代表了用戶軌跡,商業(yè)應(yīng)用較早。2014年,美國(guó)移動(dòng)設(shè)備位置信息的市場(chǎng)規(guī)模接近1000億美金。但中國(guó)移動(dòng)設(shè)備位置信息的商業(yè)應(yīng)用才剛剛開始。目前主要的應(yīng)用在互聯(lián)網(wǎng)金融的反欺詐領(lǐng)域。


線上的欺詐行為具有較高的隱蔽性,很難識(shí)別和偵測(cè)。P2P貸款用戶很大一部分來(lái)源于線上,因此惡意欺詐事件發(fā)生在線上的風(fēng)險(xiǎn)遠(yuǎn)遠(yuǎn)大于線下。中國(guó)的很多數(shù)據(jù)處于封閉狀態(tài),P2P公司在客戶真實(shí)信息驗(yàn)證方面面臨較大的挑戰(zhàn)。


移動(dòng)大數(shù)據(jù)可以驗(yàn)證P2P客戶的居住地點(diǎn),例如某個(gè)客戶在利用手機(jī)申請(qǐng)貸款時(shí),填寫自己居住地是上海。但是P2P企業(yè)依據(jù)其提供的手機(jī)設(shè)備信息,發(fā)現(xiàn)其過(guò)去三個(gè)月從來(lái)沒(méi)有居住在上海,這個(gè)人提交的信息可能是假信息,發(fā)生惡意欺詐的風(fēng)險(xiǎn)較高。移動(dòng)設(shè)備的位置信息可以辨識(shí)出設(shè)備持有人的居住地點(diǎn),幫助P2P公司驗(yàn)證貸款申請(qǐng)人的居住地。


借款用戶的工作單位是用戶還款能力的強(qiáng)相關(guān)信息,具有高薪工作的用戶,其貸款信用違約率較低。這些客戶成為很多貸款平臺(tái)積極爭(zhēng)取的客戶,也是惡意欺詐團(tuán)伙主要假冒的客戶。


某個(gè)用戶在申請(qǐng)貸款時(shí),如果聲明自己是工作在上海陸家嘴金融企業(yè)的高薪人士,其貸款審批會(huì)很快并且額度也會(huì)較高。但是P2P公司利用移動(dòng)大數(shù)據(jù),發(fā)現(xiàn)這個(gè)用戶在過(guò)去的三個(gè)月里面,從來(lái)沒(méi)有出現(xiàn)在陸家嘴,大多數(shù)時(shí)間在城鄉(xiāng)結(jié)合處活動(dòng),那么這個(gè)用戶惡意欺詐的可能性就較大。


移動(dòng)大數(shù)據(jù)可以幫助P2P公司在一定程度上來(lái)驗(yàn)證貸款用戶真實(shí)工作地點(diǎn),降低犯罪分子利用高薪工作進(jìn)行惡意欺詐的風(fēng)險(xiǎn)。


P2P企業(yè)可以利用移動(dòng)設(shè)備的位置信息,了解過(guò)去3個(gè)月用戶的行為軌跡。如果某個(gè)用戶經(jīng)常在半夜2點(diǎn)出現(xiàn)在酒吧等危險(xiǎn)區(qū)域,并且經(jīng)常有飆車行為,這個(gè)客戶定義成高風(fēng)險(xiǎn)客戶的概率就較高。移動(dòng)App的使用習(xí)慣和某些高風(fēng)險(xiǎn)App也可以幫助P2P企業(yè)識(shí)別出用戶的高風(fēng)險(xiǎn)行為。如果用戶經(jīng)常在半夜2點(diǎn)頻繁使用App,其成為高風(fēng)險(xiǎn)客戶的概率就較大。


移動(dòng)大數(shù)據(jù)在預(yù)防互聯(lián)網(wǎng)惡意欺詐和高風(fēng)險(xiǎn)客戶識(shí)別方面,已經(jīng)有了成熟的應(yīng)用場(chǎng)景。很多公司已經(jīng)開始利用第三方機(jī)構(gòu)的數(shù)據(jù),預(yù)防互聯(lián)網(wǎng)惡意欺詐和識(shí)別高風(fēng)險(xiǎn)客戶,并取得了較好的效果。移動(dòng)大數(shù)據(jù)應(yīng)用場(chǎng)景正在被逐步挖掘出來(lái),未來(lái)移動(dòng)大數(shù)商業(yè)應(yīng)用將更加廣闊。


薦:

【中國(guó)風(fēng)動(dòng)漫】除了《哪吒》,這些良心國(guó)產(chǎn)動(dòng)畫也應(yīng)該被更多人知道!

聲明

來(lái)源:鋅科技,RAD極客會(huì)(ID:RAD_Geek_Club)推薦閱讀,不代表RAD極客會(huì)立場(chǎng),轉(zhuǎn)載請(qǐng)注明,如涉及作品版權(quán)問(wèn)題,請(qǐng)聯(lián)系我們刪除或做相關(guān)處理!

人工智能產(chǎn)業(yè)鏈聯(lián)盟

如何用大數(shù)據(jù)構(gòu)建精準(zhǔn)用戶畫像?

推薦內(nèi)容