文獻標識碼: A
DOI:10.16157/j.issn.0258-7998.183235
中文引用格式: 石元博,張鑫明,黃越洋. 移動用戶維系挽留系統中K-means算法應用[J].電子技術應用,2019,45(2):5-8.
英文引用格式: Shi Yuanbo,Zhang Xinming,Huang Yueyang. Application of K-means algorithm in mobile user retention system[J]. Application of Electronic Technique,2019,45(2):5-8.
0 引言
伴隨移動運營商4G技術逐漸的應用成熟,運營商相互之間的競爭壓力日趨白熱化,存量用戶的爭奪逐漸成為運營商提規模、增效益的競爭核心[1]。為了能將原有客戶順利轉化為新用戶,并根據客戶的特征和行為對客戶的保持程度進行預測,制定有效的客戶挽留和贏回策略并實現盈利是每一個運營商亟需解決的問題。
近年來,數據已經滲透到每一個行業和業務職能領域,逐漸成為生產經營的重要因素,數據挖掘、數據分析迅速成為各大行業的熱門詞匯。數據挖掘引發的用戶需求的極大滿足,使得傳統運營商發展模式面臨巨大挑戰和危機[2]。
通過對用戶行為精準分析,搭建數據挖掘營銷模型對用戶進行聚類,實現網絡、終端、業務統一適配[3],有助于完善落實用戶全生命周期維系管理體系,加強用戶消費監控,協助用戶解決套餐消費不匹配問題,提升用戶對業務依賴性,提升用戶忠誠度和穩定度,提高用戶對移動服務的期望、提升用戶感知增強用戶黏性。
1 維系挽留系統模型建立
1.1 系統應用對象分析
用戶細分是對于用戶維系挽留的數據進行分析的一個必要手段,有利于后期數據矩陣的建立,用戶細分步驟如圖1所示。
在移動用戶營銷中,用戶價值和用戶的穩定程度是判斷該用戶維系的關鍵指標,因此在做用戶分類時以這兩個指標為用戶細分屬性,按照資源保障優先級由高到低的程度將用戶分為:黃金客戶、高位客戶、波動客戶、低端客戶、潛力客戶和跳騷客戶6類。通過聚類方法對移動用戶進行聚類,明確分群用戶及用戶資源配置原則,將有限的資源優先投放給最有價值的用戶,得出聚類后的用戶類別如表1所示。
隨著通信市場嚴重飽和,用戶流失較為嚴重,其主要原因表現在兩個方面:(1)各個運營商之間競爭以價格屬性特征競爭激烈;(2)用戶對業務模塊滿意程度不高。
1.2 數據準備
用戶在使用移動通信業務時,如在網上營業廳上進行費用詳單查詢、話費查詢、業務充值等,這些行為都會以半結構化的數據方式記錄在中央服務器的Web日志和交易記錄中,通過數據提取和預處理后建立數據倉庫,為用戶數據的分析和維系挽留系統的數據挖掘提供基礎數據。用戶數據分析主要采集的用戶數據信息包括:存量用戶的基本信息和用戶的交易記錄。數據屬性包括:(1)存量用戶基本信息,即用戶手機號、用戶姓名、用戶狀態、用戶入網時間、近3個月出賬收入等屬性信息;(2)用戶交易信息,即產品ID、用戶通信號碼、業務類型、預存交易金額、瀏覽次數等屬性信息。
當用戶數據屬性確定之后,按照屬性建立用戶數據矩陣,矩陣以價值作為主軸,結合穩定度,構建交叉矩陣,并以客戶編碼標識,結合用戶規模、收入規模占比分析,對交叉矩陣用戶進行合并,通過重要-緊急的矩陣管理,判定資源保障優先級。其中,存量用戶交叉矩陣如圖2所示。
矩陣數據形式如下:
(1)存量用戶屬性矩陣Vm×n
存量用戶信息矩陣主要包括用戶的自然屬性,代表了用戶的一般性質,其具體的表現形式為:
其中,vi代表為一個可維系用戶,總共有m個可維系用戶;vij為可維系用戶i的第j個屬性,共有n個屬性。
(2)用戶興趣信息矩陣Pm×k
在用戶B2C模式下,用戶通過Web進行交易,交易及瀏覽的次數不同,代表了用戶的興趣度,分別為興趣度進行加權賦值,將興趣度分為三類:一般、有興趣、非常有興趣。通過用戶的興趣等級進行用戶興趣信息矩陣的建立。
其中,dij是第i個可維系用戶對第j次交易的感興趣等級程度,值為一般、有興趣、非常有興趣。通過以上的矩陣的構建可以將每一個用戶的情況唯一地表示成一個向量,可以通過向量的計算來分析用戶的性質。
1.3 基于B2C環境下的模型的建立
用戶行為分析是指企業通過對用戶的存量自然屬性、用戶興趣行為軌跡所表現的特征進行分析,來了解用戶的消費偏好,分析用戶流失的原因,判定用戶獲取渠道,管理用戶的滿意度及預測用戶的忠誠度,并制定用戶維系挽留計劃[4-5]。
根據以上的定義,可以構建一個基于B2C模式下的用戶行為分析框架,如圖3所示,完整的用戶行為分析過程如下:
(1)用戶和電子商務平臺的交互過程;
(2)數據收集、整理過程;
(3)知識獲取過程;
(4)數據挖掘過程;
(5)決策優化過程;
(6)維系挽留系統。
建立一個可以可靠預測用戶行為的維系挽留模型,首先需要數據源并進行預處理分析,然后經過參數確定后進行預測識別,在識別的過程中進行聚類分析和數據挖掘,將預測結果建立決策樹,最終給出維系挽留的預測結果[6]。
2 數據挖掘算法在系統中的應用
2.1 數據分析
在維系挽留中,數據挖掘的應用主要表現在以下幾個方面:
(1)獲得新用戶
通過數據挖掘可以針對不同用戶的興趣程度、消費習慣、消費傾向和消費需求等用戶購買屬性來對新用戶進行促銷。
(2)維系挽留住老用戶
數據挖掘技術中的分類算法則可以將所有的用戶分為不同的種類,可以完全做到為不同的用戶提供完全不同的產品服務來提高用戶的滿意度。
(3)對老用戶進行交叉銷售
對老用戶進行交叉銷售,預測用戶的下一個購買行為。
數據分類工作的目的就是學習訓練出分類模型,利用該模型可以將數據庫中的數據項目映射到預先設定好的某個類別中,具體來說:給定一個數據庫D={t1,t2,…,tn}和一組類C={C1,C2,…,Cm},分類問題是去確定一個映射f:D→C,每個元組ti被分配到一個類中,一個類Cj包含映射到該類的所有元組,即Cj={ti|f(ti)=Cj,1≤i≤n,ti∈D}。
2.2 K-means在維系挽留系統中的應用
K-means算法是一種得到廣泛應用的聚類算法,該算法也稱為k-均值算法[7]。k-均值算法以k為參數,將n個對象分為k個簇,每個簇滿足低耦合高內聚的特性,即使得簇內部的屬性元素具有較高的相似度,而簇與簇之間元素的相似度較低[8]。
2.3 數據準備
在維系挽留系統中,本文需要對用戶的消費習慣和行為等特征進行分析,進行聚類。本文利用運營商在某一階段的用戶數據對其進行學習,給出聚類數據樣本,如表2所示,為后續的數據細化分類工作的推進提供參考依據。
然后,從數據庫中選取數據樣本,如表3所示。
按照K-means算法對上面數據表中所給出的企業用戶進行聚類分析。在此實例中主要對用戶的收入、ARPU、是否合約捆綁、是否滲透和有效語音交往圈總人數進行分析,根據它們之間所存在的潛在關系得到相應不同的類,并且從結果當中得到相應的聚類規則。本文希望從分析的結果中能夠得到以下一些用戶的屬性類別:其他屬性和收入大體相關;合約捆綁和是否滲透基本一致等顯著特征的類別。這些屬性類別可以使企業的決策者們能夠根據數據的分類進行相應營銷策略的制定和實施。
2.4 K-means聚類算法實現
本文采用C#語言對K-means算法進行實現,將表3所選取的50名消費用戶作為數據輸入建立用戶樣本數組,數組元素個數n=50;將所有數據劃分為5類,即簇數數組個數k=5;按照歐式距離公式將用戶劃分為最近的均值聚類中。然后進行遞歸,直到運算完成。算法流程圖如圖4所示。
程序運行開始后,首先調用子程序LoadPatterns(char*fname)進行裝載數據,同時將數據轉換成Pattern[i][j]數組;接著調用子程序InitClusters()進行簇中心的初始化過程,將選取數據樣本中的前k個樣本作為初始的聚類中心;然后程序將進入主控程序RunKMeans(),它將比較每個對象和各個簇中心的距離,將數據對象分配到與簇中心距離最短的簇中;然后再根據對象的分配重新計算簇的中心,如果簇中心不再發生變化,即ConFlag=True,則聚類已完成,否則繼續遞歸運算;最后運行子程序ShowCenters()和ShowCluster(),輸出聚類中心和每個簇成員的數目,程序結束。
3 數據測試及分析
通過對算法的實現發現將數據樣本輸入得出結果基本與分析一致,加大樣本數量對用戶進行分析,還可得出用戶消費能力和消費意愿,結果分布如圖5所示。
由圖5可見,用戶消費能力呈現平均分布情況,高端客戶平均分布在49元~73元之間,低端客戶用戶數分布最多的區間位于10元~12元之間。消費意愿普遍高于用戶消費能力,說明用戶具備極大的消費潛力。特別是高端用戶消費能力明顯增強。
4 結論
本文首先建立用戶維系挽留系統,并利用數據挖掘算法對用戶特征進行挖掘聚類。另外,對算法進一步實現,最后,采用運營商實際產生數據對算法進行驗證,表明分類結果真實可靠。
參考文獻
[1] 郭光亮.江蘇聯通客戶維系與挽留策略研究[D].上海:華東理工大學,2011.
[2] 沈偉,高尚,梅鋒.建立基于生命周期的維系挽留系統[J].通信企業管理,2013(1):76-77.
[3] 劉晨,孫秀杰,李響.電信企業客戶維系挽留應用數據挖掘探討[J].商場現代化,2008(24):29.
[4] 葉晟,龐貴泳.基于BCS數據倉庫的廣西聯通存量維系系統[J].廣西通信技術,2014(3):34-40.
[5] 劉志超,王雷,谷壘,等.基于數據挖掘技術的客戶流失預警模型[J].微計算機信息,2011,27(2):176-177.
[6] 文篤石.基于數據倉庫的客戶挽留系統[J].微型機與應用,2015,34(18):11-13.
[7] 張杰,卓靈,朱韻攸.一種K-means聚類算法的改進與應用[J].電子技術應用,2015,41(1):125-131.
[8] 黃海新,吳迪,文峰.決策森林研究綜述[J].電子技術應用,2016,42(12):5-9.
作者信息:
石元博1,張鑫明1,黃越洋2
(1.遼寧石油化工大學 計算機與通信工程學院,遼寧 撫順113001;
2.遼寧石油化工大學 信息與控制工程學院,遼寧 撫順113001)