1-1簡介
基本概念
1.基本屬性:每個人都有一些基本屬性(性別、年齡、婚否、收人、教育程度)。
行為記錄:網上購買行為、查看網頁行為、點擊行為、購物車行為,從這些行為中判斷出用戶的一些信息,假如經常網上購買小孩的物品,從此之后可以不判斷出小孩的年齡、小孩的性別、等等的一些信息。
2.去購買能力:可以可以確定出用戶的購買能力,最終達到打上購買力的等級標志。
3.行為特征:是可以判斷用戶的行為特征,比如說用戶的活躍程度、購物類型。
4.社交網絡:這個可以可以確定出他的社交網絡。
5.心理特征:比如報出促銷的敏感度,購物的真心誠意度。
6.興趣愛好:顏色的偏好,品牌的偏好。
用戶畫像的用途
1.精準營銷:郵件、短信、
2.用戶統計數據:地域、時段
3.數據挖掘:特征、行為
學習目標:
1.知道一點hive數據倉庫的特點
2.學會了在用hive并且數據開發
3.進入到解釋用戶數據的特點
4.完全掌握要如何構建體系用戶畫像
5.親密接觸換算項目的開發
6.靠積累項目實戰經驗
主要內容:
1.用戶畫像項目介紹
2.用戶畫像建模
3.不使用hive進項數據開發
4.用戶畫像數據開發
1-2用戶畫像簡介
定義
用戶畫像(UserProfile)也叫用戶信息標簽化,客戶標簽。根據基本信息和行為,用一些標簽把用戶描繪出出,
具體描述用戶的標簽就是消費者畫像。
最終形成用戶畫像的技術
1.數據收集:網絡日志數據、用戶行為數據、網站交易數據
2.行為建模:文本挖掘、自然語言處理、機器學習、預測算法、聚類算法
3.用戶畫像:基本屬性、可以購買能力、行為特征、興趣愛好、心里特征、社交網絡
源數據
1.動態和靜態信息數據:來源于用戶填好的個人資料,或是從而反算的數據。要是有不判斷的。可以確立模型來判斷。比如用戶性別如果不填,可以不組建性別模型,實際用戶的行為來推測其性別是什么船舶概論概率。
人口屬性:性別、生日、年齡、婚否、收人、城市、教育程度、職業、是否是有小孩(數量)、星座、月收入
商業屬性:消費等級、消費周期
2.動態信息數據:用戶行為再產生的數據:注冊、打開瀏覽器、點擊、去購買、簽收后、評價。
比較比較重要的行為:購買商品、瀏覽的網頁商品、放入購物車、參與商品。
注冊時間、首單時間、潮媽族,糾結啊商品、大消費、退貨數量、敗家指數、品牌偏好。
用戶相互點(TouchPoint)
行為類型:網頁、搜索、發表文章、點贊數
外界點(Tag):女裝單品頁面、女鞋單品頁面……
標簽分類
1.確認的標簽
2.根據算法猜測的標簽
標簽舉例子:
1.用戶活躍度:未定購、異常活躍、沉睡、大量流失
2.用戶分群:電腦達人、數碼潮人、家庭用戶、有房一族、網購達人、單身貴族、時尚男女、奶爸奶媽、
拼購用戶、超級用戶。(參照用戶去購買的品類情況,比如說一級品類、二級品類)
1-3用戶畫像用途
用戶畫像的作用:
1.分類統計:12星座對霧霾天氣的防范指數;奶爸當家指數;
訪客畫像(男女比例;新老用戶比;年齡分布;學歷分布)
2.營銷幫我推薦:郵件營銷;短信營銷;push信息。
例確認你有小孩的話,推薦一下一些母嬰產品
3.數據挖掘:據用戶的數據挖掘出一些用處不大的信息以支持決策。
利用關聯規則計算:比較喜歡紅酒的人常見喜歡什么品牌?利用聚類算法講:喜歡紅酒的人,年齡段分布情況。
數據挖掘
1.屬性再次篩選:屬性篩選后、基于組件信息增益的屬性打分、屬性重要性打分、主成分分析、實現卡方檢驗的屬性再次篩選;
2.具體分類分析預測:決策樹、神經網絡分類、貝葉斯網絡、歸類重臨樹、支持向量機分類、邏輯回歸、樸素貝葉斯、分類組合模型;
3.回歸預測:20塊多項式回歸、神經網絡回歸、廣義線性回歸、支持向量機輪回、回歸兩種模型;
4.聚類分析:K均值聚類、基于條件K均值的層次聚類、分布肯定聚類、兩階段聚類;
5.關聯分析:購物籃分析、屬性關聯分析、序列模式分析;
6.時間序列:ARX時間序列
比較喜歡什么東西的人往往很喜歡什么?
做了這個事的人接下來好象會干什么?
最比較經典例子:啤酒與尿布的關系。
Copyright 2021 快鯨
掃碼咨詢與免費使用
掃碼免費用
申請免費使用
在線咨詢