簡單說來,用戶畫像是參照用戶社會屬性、生活習慣和消費行為等信息而抽象概念出的一個標簽化的用戶模型。最終形成用戶畫像的核心工作即是給用戶貼“標簽”,而標簽是實際對用戶信息講而來的高度煉話的特征標志。
舉例來說,如果沒有你經常會購買一些玩偶玩具,那你電商網站再試一下根據玩具定購的情況替你打上標簽“有孩子”,甚至還還也可以推測出你孩子大致的年齡,貼上“有5-10歲的孩子”那樣極為具體的標簽,而這些所有給你貼的標簽統在一次,就成了你的用戶畫像,并且,也也算客戶畫像就是確定一個人是什么樣的人。
除去“標簽化”,用戶畫像還具有的特點是“低十字交叉率”,當兩組畫像之外權重較小的標簽外其余標簽簡直同一,的話可以將二者擴展,弱化低權重標簽的差異。
羅振宇在《時間的朋友》時間的朋友上舉了那樣的話一個例子:當一個壞商家掌握了你的購買數據,他就是可以據你平常購買商品的偏好來確定是給你發正品肯定假貨以能提高利潤。且再說是否需要必然這情況,但這也那說明了借用用戶畫像也可以能夠做到“精準銷售”,當然了,這是極其出錯的用法。
其作用大體不離以上幾個方面:
數據收集大概情況可分網絡行為數據、服務內行為數據、用戶內容偏好數據、用戶交易數據這四類。
還得一提的是,儲存用戶行為數據時最好是同樣存貯下發生了什么該行為的場景,希望能夠要好地通過數據分析。
該階段是對上階段積攢到數據的處理,進行行為建模,以抽象出用戶的標簽,這個階段崇尚的應是大概率事件,實際數學算法模型盡肯定地可以排除用戶的偶然行為。
正當此時也要應用機器學習,對用戶的行為、偏好參與猜測,君不見一個y=kx+b的算法,X代表己知信息,Y是用戶偏好,通過斷的的最精確k和b來精確Y。
在這個階段,需要要用很多模型來給用戶貼標簽。
該階段的確是二階段的三個踏入,要把用戶的基本屬性(年齡、性別、地域)、去購買能力、行為特征、興趣愛好、心理特征、社交網絡確切地標簽化。
我想知道為什么說是基本是崩散?畢竟用戶畫像永遠也沒能100%地具體描述一個人,沒有辦法能做到不斷地去迅速接近一個人,但,用戶畫像既應參照變化的基礎數據不斷修正,還得據己知數據來抽象的概念出新的標簽使用戶畫像更加立體。
麻煩問下“標簽化”,像是按結構51級標簽、28級分類,例如第一級標簽是基本信息(姓名、性別),第二級是消費習慣、用戶行為;第一級分類有人口屬性,人口屬性又有基本信息、地理位置等二級分類,地理位置又分工作地址和家庭地址的三級分類。
這是把用戶畫像完全依靠出聲的踏上一步,在此步驟中一般是針對群體的分析,比如說是可以據用戶價值來細分出核心用戶、評估某一群體的潛在價值空間,以作出針對性的運營。如圖:
這里只寫了用戶畫像的最終形成流程和一些原理,下次有時間我會寫篇關于大數據平臺的實踐文章,并說看看一些行為模型的算法原理,有興趣的朋友是可以參與下。
參考寫作:[1]永洪BI:親自教學教您搞定用戶畫像[2]易觀智庫:大數據下的用戶總結(PPT)[3]楊步濤:基于用戶畫像的大數據挖掘實踐[4]慕課網:電商大數據應用之用戶畫像[5]知乎:AlexChu關於用戶畫像的回答
Copyright 2021 快鯨
掃碼咨詢與免費使用
掃碼免費用
申請免費使用
在線咨詢