1. 概述
1.1 概念
透過研究使用者消費資料,將不同商品之間進行聯動,並挖掘二者之間聯絡的分析方法,即「購物籃分析」。
使用本文可計算出「提升度」,若提升度>1,則證明兩種商品聯動度高,兩種商品的組合方式有效,可以考慮放在一起售賣。
注:本文計算中的左右合併會產生笛卡爾積,造成資料裏 N 倍膨脹,建議使用者在實際使用時取小部分資料進行購物籃分析,以免造成資料過量膨脹。若需要對較多資料進行商品聯動分析,建議使用:購物籃之計算連帶率
1.2 解決的問題
找出顧客購買行為的模式:
比如使用者買了A商品,是否會對B商品產生什麼影響?
不同的使用者是否具有不同的購買模式?
哪些產品應該放在一起進行捆綁銷售?
1.3 預期效果
詳情儀表板連結請參見:購物籃分析
1.4 實現思路
聯動分析由以下指標進行衡量。
定義 | 概率描述 | 舉例說明 | |
---|---|---|---|
支援度 | 支援度是指A商品和B商品同時被購買的概率,或者說某個商品組合的購買次數佔總商品購買次數的比例。 支援度說明瞭這條規則在所有交易中有多大的代表性,顯然支援度越大,聯動規則越重要。 | 物品集A對物品集B的支援度support P(A n B) | 今天共有10筆訂單,其中同時購買牛奶和麪包的次數是6次,那麼牛奶+麪包組合的支援度就是6/10=60% |
置信度 | 置信度是指購買A之後又購買B的條件概率,簡單說就是因為購買了A所以購買了B的概率 | 物品集B對物品集A的置信 度P(B|A) | 今天共有10筆訂單,其中購買A的次數是8,同時購買A和B的次數是6,則其置信度是6/8=75% |
提升度 | 先購買A對購買B的提升作用,用來判斷商品組合方式是否具有實際價值,是看組合商品被購買的次數是否高於單獨商品的購買次數,大於1說明該組合方式有效,小於1則說明無效。 | L= P(A n B) /[P(A)*P(B)] | 今天共有10筆訂單,購買A的次數是8,購買B的次數是6,購買A+B的次數是6,那麼提升度是0.6/(0.8*0.6)>1,因此A+B的組合方式是有效的。 |
支援度計算公式:同時購買A和B訂單數/總購買訂單數
置信度計算公式:同時購買A和B訂單數/購買A的訂單數
提升度計算公式:支援度/((購買A次數/總購買訂單數)*(購買B次數/總購買訂單數))
2. 範例
2.1 左右合併求商品組合
以「單據編碼」為合併依據,可以得到所有訂單中產生的商品組合。
1)建立分析主題並新增資料集「集團商品銷售總表」。詳情請參見 5分鐘上手FineBI。
2)新增資料,勾選「單據編碼」和「商品名稱」。如下圖所示:
3)再次新增資料「集團商品銷售總表」,新增「左右合併」,合併資料集為「集團商品銷售總表1」下的「單據編碼」和「商品名稱」,如下圖所示:
4)選擇「左合併」,合併依據為「單據編碼」,如下圖所示:
5)新增欄位設定更改名稱。將「商品名稱」作為 A 商品,「集團商品總表-商品名稱」作為 B 商品。如下圖所示:
2.2 計算需要的指標
由 1.4 節的公式可知需要的指標有:同時購買A和B的訂單數、購買A的訂單數、購買B的訂單數、總購買訂單數
2.2.1 求「購買A的訂單數」
新增一欄,按「A商品名稱」進行分組,對分組後的單據編碼進行去重計數,可以得到購買A的訂單數。如下圖所示:
2.2.2 求「購買B的訂單數」
重新整理增一個新增匯總列,按「B商品名稱」進行分組,對分組後的單據編碼進行去重計數,可以得到購買B的訂單數,如下圖所示:
2.2.3 求「同時購買A和B的訂單數」
新增一個新增匯總列,按「A商品名稱」和「B商品名稱」進行分組,對分組後的單據編碼進行去重計數,可以得到同時購買A和B的訂單數,如下圖所示:
2.2.4 求「總購買訂單數」
新增一個新增匯總欄,對所有的單據編碼進行去重計數,可以得到一共有多少訂單,如下圖所示:
以上所有的基礎指標「同時購買A和B的訂單數」、「購買A的次數」、「購買B的次數」、「總購買訂單數」都已經計算得出了。接下來只需要計算支援度、置信度、提升度就可以了。
2.3 計算支援度、置信度、提升度
2.3.1 求「支援度」
支援度=同時購買A和B訂單數/總購買訂單數,新增公式欄,如下圖所示:
2.3.2 求「置信度」
置信度=同時購買A和B訂單數/購買A的訂單數,新增欄,如下圖所示:
2.3.3 求「提升度」
提升度=支援度/((購買A的訂單數/總購買訂單數)*(購買B的訂單數/總購買訂單數)),新增欄,如下圖所示:
2.4 去除AB相同的商品組合
當 A商品名稱 和 B商品名稱 相同時,它們是同一個產品,計算支援度、置信度、提升度沒有意義。我們可以過濾掉這部分的商品組合,如下圖所示:
完成以上步驟後,儲存並更新該分析主題。
2.5 製作組件
1)使用剛剛儲存的「購物籃分析」製作組件。選擇「自訂圖示」,將「A產品名稱」和「B產品名稱」分別拖入橫軸和縱軸。
在圖形屬性設定矩形快,將「支援度」拖入顏色欄。由於作圖會導致多訂單的值相加,所以支援度的匯總方式需要選擇平均。如下圖所示:
2)再建立一個組件,展示「支援度」、「置信度」、「提升度」的明細資料。如下圖所示:
其中「支援度、置信度、提升度」由於多訂單會合並求和,所以它們的匯總方式要改為「平均」。數值格式設定為百分比,如下圖所示:
2.6 效果展示
詳情參見本文 1.3 節。