的原因分類相同,用戶畫像的驗證方法也有了差異。200元以內具體具體闡述不驗證的過程與方法:
一、用戶畫像分類
基于組件白條的日常業務,我們將用戶畫像兩類三大類。
第一類為基本信息畫像,主要是用戶基本信息,如年齡、性別、學歷、職業、收入、資產、婚否、是否有房、如何確定有車等;
第二類為用戶行為畫像(實現互聯網業務,此處的用戶行為比較多指用戶的消費行為),如品類偏好、下單付款分析和預測、申請分期意愿等;
第三類則是涵蓋面的用戶分群畫像,是非畫像基于條件統計方法(聚類)將同類型用戶劃作一類,據有所不同業務需求,群體特征也差異極大。
二、用戶畫像驗正
按事件的發展過程來看,用戶畫像準確性驗證分為事中和出事,其中事中指用戶開發過程中,而當時則是指畫像上線運用于業務后。不同階段的驗證方法也極大有所不同。
事后全過程驗證:
事中不驗證主要注意基于組件畫像開發過程中所選模型及統計方法,對此三類畫像,有200元以內三種驗證指標:
1.模型驗證指標
具體用法的模型指標驗證比較多用戶前兩類畫像的驗證,通用的為AUC、KS、ROC、Confusion Matrix等,這些指標的介紹及判斷標準早有比較晚熟的理論基礎,此處不發起贅述。
是對第三類實現聚類的用戶畫像沒有較具體方法的驗證指標。通常情況下,聚類效果圖不能非常好的只能證明問題,還需結合業務及每個群體用戶包裹度參與你所選調整,到最后的驗證大多數也基于組件事后的業務反饋效果。
2.抽樣驗正
業務中用戶畫像大多數不屬于千萬級甚至連上億級用戶,不可能全部驗正,那種情況下這個可以根據不同情況整群抽樣驗證或分層抽樣驗證??隙ㄒ虼顺闃域炚臄祿靠傮w較小,并且勸得動度不高。
3.交叉驗證
交叉驗證分畫像指標間的交叉驗證及外部數據的補充交叉驗證。
通常情況下,一些畫像類的指標間會未知一些相關性,此時可并且交叉驗證。
至于,如果沒有公司去購買的第三方機構數據也有相應的畫像指標,也可主要用于可以參考進行交叉驗證。
這件事修改密保:
這件事驗正要注意基于隨業務發展減少的數據源(假的數據)及應用形式于業務后的反饋數據。
1.真實數據不驗證
緊接著業務發展,一些用戶畫像信息會從弱變強漸漸地積累,無容置疑的是,將神秘數據主要是用于驗正畫像類指標是最清楚的。
2.A/BTest
A/BTest是互聯網公司最常用的驗證方法,就像實現用戶畫像如何制定的策略在上游戲時都會并且嚴不的對比試驗,以測試畫像的準確性。
舉例來說:下圖為一組差別試驗(假設縱軸為用戶發令率,橫軸為營銷活動正在時間),更說明實驗組的效果優于對照組,并且該畫像可懷疑低些準。
3.業務反饋數據驗證
用戶畫像中的第二類(用戶行為畫像)和第三類(用戶分群畫像)與業務有緊密聯系,來源于業務也應用于業務,因此由求實際業務數據反饋來驗證畫像準確性是相對來說最快速有效的。
驗正方法通??礃I務反饋排序與畫像模型排序模型是否是呈現出單調性。應該舉例來說:
備注:Level1-Level10分析和預測概率等級呈降序,即level1概率最低,level10概率最低。
如上圖中,實現用戶畫像指標(下訂單預測國家概率模型)將用戶劃分為十個等級。求實際業務中,會從每個level隨機抽一部分用戶用于營銷,隨即依據什么不好算情況(即下單后率)來可以檢測畫像模型排序能力。
上圖中,下訂單率與畫像模型排序完全呈現嚴不單調性,而就業務角度而言該畫像是最有效的,能作用于業務并對業務發揮作用一定會提升作用。若不-1,則必須確定是否是需求及時優化畫像模型。
感謝京東金融-消費者金融部-信用管理部可以提供內容
Copyright 2021 快鯨
掃碼咨詢與免費使用
掃碼免費用
申請免費使用
在線咨詢