亚洲色欧美色国产综合色,国产日韩欧美一区二区东京热,欧美精品欧美人与动人物牲交

移動用戶維系挽留系統中K-means算法應用

2019年電子技術應用第2期

石元博1，張鑫明1，黃越洋2

1.遼寧石油化工大學計算機與通信工程學院，遼寧撫順113001； 2.遼寧石油化工大學信息與控制工程學院，遼寧撫順113001

摘要： 4G網絡技術的成熟使得用戶對運營商的業務需求越來越高，如何維系用戶和通過對用戶屬性的研究來迎合用戶對業務的需求，建立方便快捷的體驗服務手段，建設維系挽留系統是我國通信運營商未來發展的重中之重。首先分析移動用戶維系發展現狀，提出用戶維系發展屬性。其次，采用數據挖掘方法建立以用戶穩定度和用戶價值評價為基礎的數據挖掘分析模型，并通過用戶數據進行驗證。最后，針對存量維系如何進行多渠道精準推送提出進一步展望。

關鍵詞： 4G網絡技術維系挽留系統數據挖掘用戶價值評價

中圖分類號： TP391
文獻標識碼： A
DOI：10.16157/j.issn.0258-7998.183235
中文引用格式： 石元博，張鑫明，黃越洋. 移動用戶維系挽留系統中K-means算法應用[J].電子技術應用，2019，45(2)：5-8.
英文引用格式： Shi Yuanbo，Zhang Xinming，Huang Yueyang. Application of K-means algorithm in mobile user retention system[J]. Application of Electronic Technique，2019，45(2)：5-8.

Application of K-means algorithm in mobile user retention system

Shi Yuanbo1，Zhang Xinming1，Huang Yueyang2

1.School of Computer and Communication Engineering，Liaoning Shihua University，Fushun 113001，China； 2.School of Information and Control Engineering，Liaoning Shihua University，Fushun 113001，China

Abstract： The maturity of 4G network technology makes users′ business demand for operators higher and higher. How to maintain users and cater to users′ business needs through the study of user attributes, establish convenient and fast experience service means, and build maintenance and retention system is the most important thing for the future development of China′s telecommunication operators. This paper firstly analyzes the current situation of mobile users to maintain the development, and puts forward the user maintaining development attributes. Secondly, a data mining method based on data mining is used to analyze the data mining model, which is based on the user′s stability and user value. Finally, further prospects are put forward on how to carry out multi-channel precise push for stock maintenance.

Key words : 4G network technology; retention system; data mining; user value evaluation

0 引言

伴隨移動運營商4G技術逐漸的應用成熟，運營商相互之間的競爭壓力日趨白熱化，存量用戶的爭奪逐漸成為運營商提規模、增效益的競爭核心^[1]。為了能將原有客戶順利轉化為新用戶，并根據客戶的特征和行為對客戶的保持程度進行預測，制定有效的客戶挽留和贏回策略并實現盈利是每一個運營商亟需解決的問題。

近年來，數據已經滲透到每一個行業和業務職能領域，逐漸成為生產經營的重要因素，數據挖掘、數據分析迅速成為各大行業的熱門詞匯。數據挖掘引發的用戶需求的極大滿足，使得傳統運營商發展模式面臨巨大挑戰和危機^[2]。

通過對用戶行為精準分析，搭建數據挖掘營銷模型對用戶進行聚類，實現網絡、終端、業務統一適配^[3]，有助于完善落實用戶全生命周期維系管理體系，加強用戶消費監控，協助用戶解決套餐消費不匹配問題，提升用戶對業務依賴性，提升用戶忠誠度和穩定度，提高用戶對移動服務的期望、提升用戶感知增強用戶黏性。

1 維系挽留系統模型建立

1.1 系統應用對象分析

用戶細分是對于用戶維系挽留的數據進行分析的一個必要手段，有利于后期數據矩陣的建立，用戶細分步驟如圖1所示。

在移動用戶營銷中，用戶價值和用戶的穩定程度是判斷該用戶維系的關鍵指標，因此在做用戶分類時以這兩個指標為用戶細分屬性，按照資源保障優先級由高到低的程度將用戶分為：黃金客戶、高位客戶、波動客戶、低端客戶、潛力客戶和跳騷客戶6類。通過聚類方法對移動用戶進行聚類，明確分群用戶及用戶資源配置原則，將有限的資源優先投放給最有價值的用戶，得出聚類后的用戶類別如表1所示。

隨著通信市場嚴重飽和，用戶流失較為嚴重，其主要原因表現在兩個方面：(1)各個運營商之間競爭以價格屬性特征競爭激烈；(2)用戶對業務模塊滿意程度不高。

1.2 數據準備

用戶在使用移動通信業務時，如在網上營業廳上進行費用詳單查詢、話費查詢、業務充值等，這些行為都會以半結構化的數據方式記錄在中央服務器的Web日志和交易記錄中，通過數據提取和預處理后建立數據倉庫，為用戶數據的分析和維系挽留系統的數據挖掘提供基礎數據。用戶數據分析主要采集的用戶數據信息包括：存量用戶的基本信息和用戶的交易記錄。數據屬性包括：(1)存量用戶基本信息，即用戶手機號、用戶姓名、用戶狀態、用戶入網時間、近3個月出賬收入等屬性信息；(2)用戶交易信息，即產品ID、用戶通信號碼、業務類型、預存交易金額、瀏覽次數等屬性信息。

當用戶數據屬性確定之后，按照屬性建立用戶數據矩陣，矩陣以價值作為主軸，結合穩定度，構建交叉矩陣，并以客戶編碼標識，結合用戶規模、收入規模占比分析，對交叉矩陣用戶進行合并，通過重要-緊急的矩陣管理，判定資源保障優先級。其中，存量用戶交叉矩陣如圖2所示。

矩陣數據形式如下：

(1)存量用戶屬性矩陣V_m×n

存量用戶信息矩陣主要包括用戶的自然屬性，代表了用戶的一般性質，其具體的表現形式為：

其中，v_i代表為一個可維系用戶，總共有m個可維系用戶；v_ij為可維系用戶i的第j個屬性，共有n個屬性。

(2)用戶興趣信息矩陣P_m×k

在用戶B2C模式下，用戶通過Web進行交易，交易及瀏覽的次數不同，代表了用戶的興趣度，分別為興趣度進行加權賦值，將興趣度分為三類：一般、有興趣、非常有興趣。通過用戶的興趣等級進行用戶興趣信息矩陣的建立。

其中，d_ij是第i個可維系用戶對第j次交易的感興趣等級程度，值為一般、有興趣、非常有興趣。通過以上的矩陣的構建可以將每一個用戶的情況唯一地表示成一個向量，可以通過向量的計算來分析用戶的性質。

1.3 基于B2C環境下的模型的建立

用戶行為分析是指企業通過對用戶的存量自然屬性、用戶興趣行為軌跡所表現的特征進行分析，來了解用戶的消費偏好，分析用戶流失的原因，判定用戶獲取渠道，管理用戶的滿意度及預測用戶的忠誠度，并制定用戶維系挽留計劃^[4-5]。

根據以上的定義，可以構建一個基于B2C模式下的用戶行為分析框架，如圖3所示，完整的用戶行為分析過程如下：

(1)用戶和電子商務平臺的交互過程；

(2)數據收集、整理過程；

(3)知識獲取過程；

(4)數據挖掘過程；

(5)決策優化過程；

(6)維系挽留系統。

建立一個可以可靠預測用戶行為的維系挽留模型，首先需要數據源并進行預處理分析，然后經過參數確定后進行預測識別，在識別的過程中進行聚類分析和數據挖掘，將預測結果建立決策樹，最終給出維系挽留的預測結果^[6]。

2 數據挖掘算法在系統中的應用

2.1 數據分析

在維系挽留中，數據挖掘的應用主要表現在以下幾個方面：

(1)獲得新用戶

通過數據挖掘可以針對不同用戶的興趣程度、消費習慣、消費傾向和消費需求等用戶購買屬性來對新用戶進行促銷。

(2)維系挽留住老用戶

數據挖掘技術中的分類算法則可以將所有的用戶分為不同的種類，可以完全做到為不同的用戶提供完全不同的產品服務來提高用戶的滿意度。

(3)對老用戶進行交叉銷售

對老用戶進行交叉銷售，預測用戶的下一個購買行為。

數據分類工作的目的就是學習訓練出分類模型，利用該模型可以將數據庫中的數據項目映射到預先設定好的某個類別中，具體來說：給定一個數據庫D={t₁，t₂，…，t_n}和一組類C={C₁，C₂，…，C_m}，分類問題是去確定一個映射f:D→C，每個元組t_i被分配到一個類中，一個類C_j包含映射到該類的所有元組，即C_j={t_i|f(t_i)=C_j，1≤i≤n，t_i∈D}。

2.2 K-means在維系挽留系統中的應用

K-means算法是一種得到廣泛應用的聚類算法，該算法也稱為k-均值算法^[7]。k-均值算法以k為參數，將n個對象分為k個簇，每個簇滿足低耦合高內聚的特性，即使得簇內部的屬性元素具有較高的相似度，而簇與簇之間元素的相似度較低^[8]。

2.3 數據準備

在維系挽留系統中，本文需要對用戶的消費習慣和行為等特征進行分析，進行聚類。本文利用運營商在某一階段的用戶數據對其進行學習，給出聚類數據樣本，如表2所示，為后續的數據細化分類工作的推進提供參考依據。

然后，從數據庫中選取數據樣本，如表3所示。

按照K-means算法對上面數據表中所給出的企業用戶進行聚類分析。在此實例中主要對用戶的收入、ARPU、是否合約捆綁、是否滲透和有效語音交往圈總人數進行分析，根據它們之間所存在的潛在關系得到相應不同的類，并且從結果當中得到相應的聚類規則。本文希望從分析的結果中能夠得到以下一些用戶的屬性類別：其他屬性和收入大體相關；合約捆綁和是否滲透基本一致等顯著特征的類別。這些屬性類別可以使企業的決策者們能夠根據數據的分類進行相應營銷策略的制定和實施。

2.4 K-means聚類算法實現

本文采用C#語言對K-means算法進行實現，將表3所選取的50名消費用戶作為數據輸入建立用戶樣本數組，數組元素個數n=50；將所有數據劃分為5類，即簇數數組個數k=5；按照歐式距離公式將用戶劃分為最近的均值聚類中。然后進行遞歸，直到運算完成。算法流程圖如圖4所示。

程序運行開始后，首先調用子程序LoadPatterns(char*fname)進行裝載數據，同時將數據轉換成Pattern[i][j]數組；接著調用子程序InitClusters()進行簇中心的初始化過程，將選取數據樣本中的前k個樣本作為初始的聚類中心；然后程序將進入主控程序RunKMeans()，它將比較每個對象和各個簇中心的距離，將數據對象分配到與簇中心距離最短的簇中；然后再根據對象的分配重新計算簇的中心，如果簇中心不再發生變化，即ConFlag=True，則聚類已完成，否則繼續遞歸運算；最后運行子程序ShowCenters()和ShowCluster()，輸出聚類中心和每個簇成員的數目，程序結束。

3 數據測試及分析

通過對算法的實現發現將數據樣本輸入得出結果基本與分析一致，加大樣本數量對用戶進行分析，還可得出用戶消費能力和消費意愿，結果分布如圖5所示。