文獻標識碼: A
DOI:10.16157/j.issn.0258-7998.2018.S1.058
0 引言
隨著人們用電需求的不斷提升和社會的快速發展,對供電企業的供電服務質量的要求越來越高。然而,目前大部分的電力企業在供電服務方面仍然存在許多不足,其中配網搶修作為影響用戶用電體驗的一項電力主營業務,仍然停留在傳統的以用戶為主要發起人的被動搶修模式。如何提前發現電網系統薄弱環節,提前精準預測配網搶修高危區域,采取相應措施有效降低配網故障率,事前做好搶修準備,是電力企業急需解決的一個問題。
為加快電網發展、全力確保電力可靠供應,本文深入研究配網故障預測理論方法,利用大數據挖掘技術,基于電力故障搶修歷史數據,以特殊時期、天氣、溫度、設備老化情況、負荷率等作為擾動因數,研究了一套基于具擾動特性的滾動基值法的配網搶修高危區域預測體系,并應用于國網山東省電力公司,對某一區域未來3天及某一特定時期的配網搶修工單數量進行預測,實現對配網搶修的提前預測。根據預測結果指導優化配網結構和配網搶修工作的精準化管理,切實促進電網發展,提升供電服務質量。
1 樣本數據預處理
從95598業務應用系統、營銷業務應用系統等電力業務應用系統中獲取原始數據,因原始數據存在數據缺失、數據不合規等問題,需要對數據做進一步的清洗,然后對數據進行分類與統計。
1.1 樣本數據部門范圍
樣本數據部門包括山東省17個市級供電公司、171個區縣級供電單位和394個工單數搶修部門。
1.2 樣本數據時間范圍
樣本數據時間范圍如表1所示。
因特殊時期搶修為活躍期,所以選取春節保電期間各部門的搶修單數量,時間范圍選取了3年的春節前后的2~3個月。
1.3 數據列名稱
原始數據中對項目研究有意義的列名稱有:統計周期、上級單位、供電單位、工單數原因、處理部門、工單數排除時間、是否退單。
1.4 樣本數量
(1)總樣本數量:根據設定的部門范圍和時間范圍,滿足條件的總樣本數量共計357 862條。
(2)壞樣本數量:將取值范圍異常、工單數原因為偶發事件的數據定義為壞樣本數據,這部分數據不可預測,也不應該包含在預測樣本中。
①是否退單字段值為審核不通過、退單、空白;
②工單數原因字段值為盜竊、計劃停限電、客戶誤報、鳥害等小動物、停限電、外部火災、外部異物外力破壞、外力因素、小動物、車輛、樹線矛盾、樹枝搭掛、自然因素、空白;
③搶修總時長字段值在小于5 min或大于1 440 min的。
據統計,該部分數據記錄共計73 343條,應該從樣本數據中剔除。
(3)有效樣本數量
有效樣本數量=總樣本數量-壞樣本數量=284 519條。
1.5 分部門樣本數量
(1)市級供電公司
山東省電網公司共設有17個市級供電公司,其有效樣本數據量如表2所示。
(2)區縣級供電公司
經統計,全省共171個區縣級供電單位含有效工單數據,由于篇幅限制,其數據的具體分布不在這里展示。
(3)處理部門
經統計,全省共394個搶修部門含有效工單數據,由于篇幅限制,其數據的具體分布不在這里展示。
2 數據分析及模型算法
2.1 數據分析
在研究數據分布及特點階段,嘗試了采用多種維度、多個方向的模型技術對數據進行分析,包括大數據模型等,結果顯示:部分模型由于模型本身限制不適用于該問題的解決,部分模型由于數據樣本不足限制了模型性能的發揮。
通過MATLAB軟件對各市級供電公司、區縣級供電單位以及搶修部門搶修工單進行的數據可視化分析,各單位的搶修工單數量總是在一段時間內圍繞某一基準進行小范圍波動,并不時有少部分波動范圍較大的點出現。
選取2015年除夕前后各7天的數據進行分析,其中部分單位數據變化情況展示如下。
(1)市級供電公司舉例
濟南供電公司工單數量變化曲線圖如圖1所示,數據統計表如表3所示。
分析得出,有70%~80%的工單數量圍繞在平均工單數量上下波動,波動值在平均工單數的上下20%~30%之間,另有部分波動值超過了30%,引起這種極端波動的主要原因是天氣惡劣、設備老化、用戶原因。
2.2 預測模型分析
根據2.1小節的數據分析可以得出如下結論:
(1)搶修單數量在某一時間段內通常會有一固定的均值;
(2)時間段不同,均值不同;
(3)通常情況下搶修單數量都在圍繞這一均值上下波動;
(4)在有惡劣天氣擾動情況下,搶修工單數量值會有一個大的波動,產生一個極值;
(5)如果有設備老化問題、用戶管理等問題,在遇到惡劣天氣時,極值的幅度通常會更大。
由上述結論,可以用如下模型來預測某一天的工單數量:
其中,Wpre為某一天的工單數量的預測值;Wba為樣本空間內剔除所有極值后的工單數量平均值;Wco為圍繞基值的隨機波動值;Qmax為樣本空間內所有極值的最大值;Dco為擾動系數,包括惡劣天氣、設備老化、用戶管理等問題引起的工單數變化。
上述模型被稱為具擾動特性的滾動基值法。擾動是指惡劣天氣、設備老化、用戶管理等擾動因素對預測結果有顯著的影響;滾動是指基于在一定時期內設備的狀態及管理水平等不會出現大的變化情況下始終使用前N天數據作為樣本空間;基值是指在無擾動情況下搶修工單的平均值。
2.3 算法分析
為便于工程計算,需要對具擾動特性的滾動基值法公式(式(1))、參數進行必要的說明和改進。
(1)基值Wba計算方法
① 預測日的前N天數據構建樣本空間,N>10。
② 計算樣本空間內工單數量平均值。
③ 定義工單數量超出平均值P%的數據為極值Q,統計出Q的個數T。
④ 從樣本空間中剔除這些極值數據Q,樣本空間的長度變為N-T。
⑤ 向前增加T天數據,補齊長度為N的樣本空間。
⑥ 返回步驟②繼續,直至樣本空間內不再有極值,此時的樣本空間稱為有效樣本空間。
⑦ 基值Wba等于有效樣本空間內工單數的算術平均值。
(2)隨機波動值Wco計算方法
① 在有效樣本空間內找出最大工單數,與基值的差記為D。
② 定義S是在[-1,1]區間上的隨機數。
③ Wco=D×S。
(3)Qmax極值的最大值計算方法
計算基值Wba時剔除掉的所有極值中最大值。當沒有極值時取Wba×(1+P%)作為Qmax。
(4)Dco:擾動系數計算方法
①擾動因素分析
影響搶修工單數量變化的擾動因素很多,天氣、氣溫、設備老化、負荷率、用戶設備、用戶管理等都能引起工單數量的波動,有時波動幅度甚至很大。在這些擾動因素當中,天氣和氣溫的影響最為明顯,而且還會擴大其他擾動因素的作用,例如,惡劣天氣會導致負荷增加,而負荷增加又會讓設備老化的問題更為嚴重,綜上分析,這里只討論天氣和溫度對工單數量的影響。
根據歷史天氣預報數據,單獨挑選出了惡劣天氣時的數據,如表4~表6所示,表中的變化率是惡劣天氣當天的工單數量與基值的比值,這里只列出了部分單位的統計結果。
· 市級供電公司
· 區縣級供電單位
· 搶修部門
由表可見,天氣變化對工單數量有著直接的影響,工單數量的變化與天氣惡劣程度相對應,天氣越惡劣,工單數量越多。
② 擾動系數Dco的計算
定義H為天氣惡劣程度,惡劣程度是雨、雪、風、氣溫的綜合考量,取值范圍為0~100,那么擾動系數Dco的計算公式為:
3 風險預警等級劃分
國家電網電力安全事故等級劃分是將電網運行風險預警分為4個等級:一級紅色預警、二級橙色預警、三級黃色預警和四級藍色預警。參照這一劃分原則,按照供電單位日搶修工單數量多少,對搶修工作所面臨的壓力進行風險預警,也可分為4個等級,分別是一級紅色預警、二級橙色預警、三級黃色預警和四級藍色預警。預警等級劃分的定義可以考慮兩種方式:正態分布劃分和絕對值分布劃分。
3.1 正態分布劃分
正態分布是自然界、人類社會、心理和教育等領域連續隨機變量概率分布的一種,尤其是從管理學角度來看,正態分布的兩端小、中間多的規律滿足人們的心理預期。根據正態分布原理,假定一級預警占比例a%、二級預警占比例b%、三級預警占比例c%、四級預警占比例d%,則17個市級供電單位預警情況如表7所示,171個區縣級供電單位預警情況如表8所示,394個搶修部門預警情況如表9所示。
3.2 絕對值分布劃分
絕對值分布劃分是根據日搶修單數量的絕對值多少劃分預警等級。表10~表12分別為地市級供電單位、區縣級供電單位和搶修單位等級劃分方法,其中Y為日搶修工單數量,N11、N12、N13、N21、N22、N23、N31、N32、N33為各等級區間邊界值。
4 算法模型驗證
為驗證預測算法的準確性,選取2017年除夕前后(2016年11月27日至2017年2月27日)的有效數據進行驗證。
4.1 地市級供電單位
按正態分布劃分預警等級,取a=20,b=30,c=30,d=20,分別預測2017年1月1日、2017年1月10日、2017年1月27日(除夕)和2017年2月22日的搶修工單數量,表13中的正確率是各等級預測值與當日實際值的比較。
4.2 區縣級供電單位
對部分區縣級供電單位進行預測,選取了除夕特殊日類型和晴天、惡劣天氣兩種不同的天氣類型,由于不是全部區縣,因此不能劃分預警等級,通過準確率函數來進行驗證,其計算為:
預測結果如表14所示。
4.3 搶修單位
搶修單位的預測驗證采用與區縣級供電單位相同的方法,結果如表15所示。
5 結束語
本文利用大數據挖掘分析技術研究了一套具擾動特性的滾動基值法的配網搶修工單預測算法,該方法利用歷史數據、天氣數據、特定時期等特征因子,通過算法模型的不斷訓練與完善,實現了對未來一天的搶修工單量的預測,準確率高達80%,對實際的電力故障搶修服務工作的開展起到了強有力的指導作用,是進一步提升電網企業供電服務質量的催化劑。
參考文獻
[1] 邵峰晶, 于忠清, 王金龍,等. 數據挖掘原理與算法[M]. 北京: 中國水利水電出版社,2005.
[2] 趙志剛,張文杰,安宏宇,等. 配網主動搶修關鍵技術研究與應用[J]. 科技創新與應用,2017(5):177.
[3] 蔡金錠,鄢仁武. 基于小波分析與隨機森林算法的電力電子電路故障診斷[J].電力科學與技術學報,2011,26(2): 54-60.
[4] (美)P.M安德遜. 電力系統故障分析[M]. 王際強,胡冰清,任震,等,譯. 電力工業出版社,1980.
作者信息:
刁柏青1,姚 剛1,潘 筠1,孟祥君1,于善海2,史雙雙2,李 劍2
(1. 國網山東省電力公司運監中心,山東 濟南 250001;
2. 山東魯能軟件技術有限公司,山東 濟南250001)