一、提問
1、淘寶用戶流失情況如何?造成這種流失的原因是什么?
2、淘寶APP用戶行為的規律是什么?
理解數據1、數據來源:
Tianchi:Data sets這個數據集來自阿里云天池,淘寶 選擇了數據APP 2017年11月25日至2017年12月3日,約100萬隨機用戶的所有行為數據(包括點擊、購買、購買和喜歡)。
2、數據導入SQL
第一步是選擇導入導向
第2步,選擇Excel文件數據源
第三步是選擇需要導入的表
如果第四步是為源定義一些附加選項excel數據量大,可以在導入過程中設置分批導入。
第五步是選擇將數據導入哪個表
若將數據導入到新數據庫表中,則在下面的新表中打鉤。
若將數據導入到現有的數據庫表中,則無需在新建表中打鉤。
第六步,定義源表(excel與目標表(數據庫表)的對應關系
如果目標表(數據庫表)設置了主鍵,則必須根據您的業務需要檢查相應目標欄的主鍵,否則以后不能選擇更新模式。
第七步是選擇導入模式
我們可以根據具體情況選擇不同的選項。如果是新手表,我們選擇第一項-添加:將記錄添加到目標表中。
步驟8:單擊開始按鈕執行導入命令
導入完成后,會有導入結果的消息提示,可以看導入是否成功,錯誤的原因是什么,相應的糾正。
3、表中的字段含義
user-id:用戶編號
item-id:商品編號
behavior-type:用戶行為類型(包括點擊、收藏、購物車、購買四種行為,分別以數字1、2、3、4表示)
item-category:商品類別編號
time:發生用戶行為的時間
三、數據清洗通過數據庫管理工具Navicat 將數據集導入 MySQL 數據庫
1、選擇子集
2、刪除重復值
5主鍵定義為:用戶id,商品id,保證用戶行為發生時間不重復數據。
3、 缺失值處理
刪除缺失值
delete from 表名 where 列名 is null;經驗證明,無缺失值
填充缺失值
select coalesce(列名,填充值) from 表名;4、日期處理
由于 time 字段時間包括(年度)-月-日)和小時,為便于分析,將該字段分為 2個字段,一個日期列和一個時間列。
修改后的數據表是這樣的:
5、刪除重復數據
檢查日期是否在規定范圍內:2017年 11月 25日至 2017年 12月 3 日。
SELECT MAX(日期),MIN(日期)from 用戶;22017年9月11日至2017年12月3日發現數據集中的時間范圍。因此,刪除日期小于2017年11月25日的數據
刪除44行數據
刪除重復數據
經驗證,無重復數據
四、構建模型1.分析用戶行為的漏斗模型 使用AARRR這里的數據主要涉及用戶 ** 和購買轉換環節,用戶從瀏覽到最終購買的整個過程,包括瀏覽、收集、加入購物車和購買環節,9天內的指標如下:
1)uv代表獨立訪客人數:983人
2)pv代表點擊量:8965次
3)pv/uv每個獨立訪客的平均瀏覽次數為91次/人
這表明,在2017年11月25日至2017年12月3日的9天內,每個訪問者訪問淘寶頁面的平均數量為91次,每個人每天訪問10個頁面。數據顯示,消費者使用淘寶的頻率非常高,平均每天10次
用戶行為漏斗分析:
包括用戶行為pv(點擊)、cart(購物車),fav(收藏)和buy(購買)放入購物車比較點擊次數5.45%,點擊喜歡只占2.75%這表明用戶平均瀏覽10個網頁會產生收藏或添加到購物車中;最后,實際購買不到2.1%,說明平均瀏覽50個網頁會產生實際購買行為。
我們猜測,這種現象可能發生的原因是用戶花了很多時間在淘寶上找不到他們想要的產品,所以他們放棄了在淘寶平臺上購買。
讓我們從業務流程來分析用戶是否真的從瀏覽界面中流失,轉化率是多少?
從上圖我們可以看到,用戶平均每天點擊50次才會有3.6二次收集或加入購物車動作和二次購買的轉化率約為7%,進入購買的轉化率約為4%。因此,從業務流程驗證用戶確實從瀏覽界面中流失,這也表明從瀏覽到收集和加入購物車的階段是指標改進的關鍵環節。
基于以上判斷,我們猜測用戶從瀏覽界面流失有兩個原因:
用戶是否能從頁面上找到淘寶平臺推送的產品,以滿足用戶的需求(1)用戶想要找到的商品能否從頁面上找到
衡量用戶最想在淘寶平臺上找到什么樣的產品,最重要的指標是商品點擊率。通過這個指標,我們可以最大限度地了解用戶對哪些產品的需求更大,對哪些產品的需求更小。
從上圖可以看出,商品類別ID淘寶4756105/3607361/415813/2355072/9826APP中點擊率最高,說明用戶最想在淘寶平臺上找到這五種商品,在這五種類型下,各種中點擊率排名前三的商品是:
( -- 4756105類商品點擊前三名SELECT商品類別ID, 商品ID, COUNT(商品ID) AS 點擊次數 FROM 用戶 WHERE 用戶行為類型= 'pv' AND 商品類目ID = 4756105 GROUP BY 商品ID ORDER BY點擊次數 DESC LIMIT 3)UNION --366商品SELECT 商品類別ID, 商品ID, COUNT(商品ID) AS 點擊次數 FROM用戶WHERE 用戶行為類型= 'pv' AND 商品類目ID = 3607361 GROUP BY 商品類別ID, 商品ID ORDER BY 點擊次數 DESC LIMIT 3 )UNION --對411商品進行點擊SELECT 商品類別ID, 商品ID, COUNT(商品ID) AS次數FROM用戶WHERE用戶行為類型= 'pv' AND 商品類目ID = 4145813 GROUP BY商品類別ID, 商品ID ORDER BY點擊次數 DESC LIMIT 3 )UNION -- 235SELECT商品類別ID, 商品ID, COUNT(商品ID) AS次數FROM用戶WHERE用戶行為類型= 'pv' AND 商品類目ID = 2355072 GROUP BY商品類別ID, 商品ID ORDER BY點擊次數 DESC LIMIT 3 )UNION --982商品點擊前)SELECT商品類別ID, 商品ID, COUNT(商品ID) AS次數FROM用戶WHERE用戶行為類型= 'pv' AND 商品類目ID = 982926 GROUP BY商品類別ID, 商品ID ORDER BY點擊次數 DESC LIMIT 3 )從圖中可以看出,4756105類商品需求量較高,前三類商品平均點擊量在31以上;4145813類和235072類商品需求量相對較小,平均點擊量為13.6。
(2)淘寶平臺推送的產品是否滿足用戶需求
在分析了用戶想要尋找的產品之后,需要知道淘寶平臺篩選推送的產品是否滿足了用戶的需求。
首先從商品數量占比上分析這五類商品是否在淘寶平臺上足夠多,以供用戶選擇。
SELECT 商品類目ID,COUNT(DISTINCT 商品ID) AS 商品數量,商品數量/COUNT(DISTINCT 商品ID)FROM 用戶where 商品類目ID=4756105 or 商品類目ID=3607361 or 商品類目ID=4145813 or 商品類目ID=982926 or 商品類目ID=2355072GROUP BY 商品類目ID;從以上結果可以看出,淘寶平臺共有 ** 440種商品種類繁多,需求量最大的前五種商品占商品數量的比例14.8說明淘寶平臺為這五類商品提供了足夠的選擇。
在選擇足夠多的情況下,需要分析淘寶對這五類商品的推送機制是否合理,即用戶搜索某類商品后出現的商品是否滿足用戶的需求。
從上圖可以看出,購買次數前5的類別與點擊次數前5的類別不一致,表明平臺推薦機制不合理。淘寶平臺推送給用戶的五種產品不符合用戶的要求,即用戶點擊查看此類產品后,發現自己不想放棄加入購物車,導致轉化率下降。
2.用戶行為模式在不同時間尺度下的分析
分析用戶在統計范圍內和一天內的購買行為,找出用戶活躍的規律。
統計范圍(9天)用戶對這五種商品的需求
SELECT 日期,COUNT(商品類目ID)FROM 用戶WHERE 用戶行為類型='pv' AND 商品類目ID=4756105GROUP BY 時間ORDER BY 時間 desc;SELECT 日期,商品類別ID,cOUNT(商品ID) as 點擊次數FROM 用戶WHERE 用戶行為類型='pv' and 商品類目ID=3607361GROUP BY 日期,商品類別IDORDER BY 日期 desc;SELECT 日期,商品類別ID,cOUNT(商品ID) as 點擊次數FROM 用戶WHERE 用戶行為類型='pv' and 商品類目ID=4145813GROUP BY 日期,商品類別IDORDER BY 日期 desc;SELECT 日期,商品類別ID,cOUNT(商品ID) as 點擊次數FROM 用戶WHERE 用戶行為類型='pv' and 商品類目ID=2355072GROUP BY 日期,商品類目IDORDER BY 日期 desc;SELECT 日期,商品類別ID,cOUNT(商品ID) as 點擊次數FROM 用戶WHERE 用戶行為類型='pv' and 商品類目ID=982926GROUP BY 日期,商品類別IDORDER BY 日期 desc;從圖中可以看出,隨著時間越來越接近雙十二,前五類商品的總點擊量在9天內顯著增加;
SELECT 日期,SUM(CASE WHEN 用戶行為類型 = 'pv' THEN 1 ELSE 0 END ) AS '點擊次數', SUM(CASE WHEN 用戶行為類型 = 'fav' THEN 1 ELSE 0 END ) AS '收藏次數', SUM(CASE WHEN 用戶行為類型 = 'cart' THEN 1 ELSE 0 END) AS '加入購物車', SUM(CASE WHEN 用戶行為類型 = 'buy' THEN 1 ELSE 0 END) AS '購買次數' FROM 用戶 WHERE 商品類別ID=4756105 or 商品類目ID=3607361 or 商品類目ID=4145813 or 商品類目ID=982926 or 商品類目ID=2355072 group by 日期 ORDER BY 日期9當前五類商品的總點擊量顯著增加 時,收購次數也顯著增加,購買次數增長緩慢,具體原因需要更多的數據支持分析。
我們使用時間因素hour()判斷函數。
alter table 用戶 add 時間點 varchar(255);#從時間戳中5:04等時間戳中抽取時間點update 用戶set 時間點=hour(時間);SELECT 時間點,SUM(CASE WHEN 用戶行為類型 = 'pv' THEN 1 ELSE 0 END ) AS '點擊次數', SUM(CASE WHEN 用戶行為類型 = 'fav' THEN 1 ELSE 0 END ) AS '收藏次數', SUM(CASE WHEN 用戶行為類型 = 'cart' THEN 1 ELSE 0 END) AS '加入購物車', SUM(CASE WHEN 用戶行為類型 = 'buy' THEN 1 ELSE 0 END) AS '購買次數'FROM 用戶 WHERE 商品類目ID=4756105 or 商品類目ID=3607361 or 商品類目ID=4145813 or 商品類目ID=982926 or 商品類目ID=2355072group by 時間點ORDER BY 時間點可以看出,這五類商品的用戶行為數從每日4點到5點快速降低,5點左右降到一天中的行為數最低值,6點--7點開始用戶行為數快速上升,9點左右達到一天中的最高值,10點以后用戶行為數又開始降落至平均水平。
綜合上述分析可知,9-11點是用戶點擊、收藏和購買的高峰期,平臺在這個時間段推送成交率將更高
因為數據集有限,只能大致分析出淘寶用戶想要尋找哪幾類商品。若要更細致地分析出用戶想要什么樣的商品,還需知道用戶使用的搜索高頻詞,利用該項數據建立用戶搜索畫像,并結合商品點擊數數據,建立搜索點擊率指標,分析總結出點擊率高的搜索高頻詞和點擊率低的搜索高頻詞。從而更精確地總結出用戶在淘寶平臺最想要尋找什么商品。
3.不同商品種類的用戶行為
統計所有商品的購買次數,同時找到購買次數和加入購物車次數最多的商品。
select 次數,COUNT(商品ID) as 商品ID數from(SELECT 商品ID, COUNT(用戶ID) AS '次數' FROM 用戶 WHERE 用戶行為類型 = 'buy'GROUP BY 商品ID) as AGROUP BY 次數在本次統計的數據中,只購買一次的產品有1881種,購買兩次的產品有93種,本次分析的商品中用戶購買的共有1984種商品,卻沒有出現購買用戶數量非常集中的商品,購買一次的商品占到94.8%,說明商品售賣主要依靠長尾商品的累積效應,而非爆款商品的帶動。
SELECT 商品ID ,count( 商品ID) as 次數 FROM 用戶 WHERE 用戶行為類型 = 'buy' GROUP BY 商品ID order by 次數 desc limit 20SELECT 商品ID ,count( 商品ID) as 次數 FROM 用戶 WHERE 用戶行為類型 = 'pv' GROUP BY 商品ID order by 次數 desc limit 20列出銷量前20位的商品,商品ID為855191/4395247/1910706的商品銷量最高,均為4次,那么是否瀏覽次數最高的商品銷量也最高呢,對商品瀏覽量也進行了統計: 我們看到瀏覽數最高的商品為3027414,沒有進入銷量前20,說明這些吸引用戶更多注意力的商品沒有很好的轉化為實際銷量。
五、結論與建議本文選取淘寶APP用戶行為數據共10萬條,從三個不同角度對數據進行分析,現給出如下結論和建議。
1.AARRR模型提升轉化率:
由于數據中沒有給出每個用戶第一次的登陸的時間,我們暫且把瀏覽行為視為用戶的獲取。 ,用戶行為包括點擊、放進購物車、收藏以及購買。由于收藏和加入購物車都為瀏覽和購買階段之間確定購買意向的用戶行為,且不分先后順序,因此將其算作一個階段。 從瀏覽到有購買意向只有2%的轉化率,即使有一部分用戶是直接購買,但也說明大多數用戶以瀏覽頁面為主而購買轉化較少,此處為轉化漏斗中需要改善和提高的環節。
針對這一環節改善轉化率的建議有:
優化電商平臺的搜索匹配度和推薦策略,主動根據用戶喜好推薦相關的商品,優化商品搜索的準確度和聚合能力,對搜索結果排序優先級進行優化。 在商品詳情頁的展示上突出用戶關注的重點信息,精簡信息流的呈現方式,減少用戶尋找信息的成本 優化加入購物車和收藏按鍵的觸達,用戶在滑屏時也能方便觸達,增加功能使用的次數。2.用戶行為活躍高峰期推送:
用戶在不同時間周期下的活躍規律 9天中的消費活動隨時間越來越接近雙十二而增加明顯;一天內高峰期出現在9點-11點左右。
針對高峰期的建議:進行營銷活動收益最高,此時使用人數最多,活動容易觸達用戶,營銷活動的形式可以通過促銷、拼團等形式進行。
3.針對不同商品采取不同營銷策略:
商品售賣主要依靠長尾商品的累積效應,而非爆款商品的帶動。銷量最高的商品瀏覽數沒有進入銷量前20,說明這些吸引用戶更多注意力的商品沒有很好的轉化為實際銷量。
建議:針對瀏覽量高而銷量不高的這部分商品,需要提高的是用戶從點擊進入商品詳情頁到最終購買的體驗。作為商家端可以從以下幾個方面提高銷售額: 商品詳情頁的實際價格是否相比展示價格偏差過大,有的商家為了吸引用戶點擊在商品展示頁投放的價格具有較強吸引力,但實際價格偏高,在用戶心中反而引起反感 詳情頁的信息流展示是否合理,是否將用戶最想看到的部分置于容易看到的位置,便于信息的獲取 優化商品展示的形式,利用視頻等方式給用戶更直觀的感受,提高照片的美觀程度 評論區評價管理,尤其對于差評區的用戶反饋進行認真對待,提高自身服務質量
Copyright 2021 快鯨
掃碼咨詢與免費使用
申請免費使用