引言
預測性維護可以算是智能制造中比較火的應用場景了,其中涉及了以機器學習為核心的眾多先進技術惨恭。在這里做個科普講座,希望通過本文能夠幫助大家了解設備預測性維護的總體過程和原理登舞。
什么是預測性維護
首先看一下設備維護的四種方式菲驴,如下圖:
在這里道批,我們所要討論的預測性維護指的是利用設備運行的狀態(tài)信息错英、環(huán)境信息等各種數(shù)據(jù),主要基于數(shù)理統(tǒng)計模型隆豹,對故障進行預測椭岩。
預測性維護的重要意義在于避免過度維修,節(jié)約設備維護成本璃赡。
預測性維護的實施步驟
前提條件
要有一定的數(shù)據(jù)積累判哥。
這里所說的數(shù)據(jù)積累包括兩個方面:數(shù)據(jù)的種類和數(shù)量。
在種類方面碉考,至少要有兩類數(shù)據(jù)才能夠進行預測模型的建立和訓練捐顷,即故障數(shù)據(jù)以及設備運行的狀態(tài)數(shù)據(jù)走诞。在建立和訓練模型的過程中仍稀,前者是模型的輸出统诺,后者是模型的輸入。
在數(shù)量方面良蒸,究竟多少的數(shù)據(jù)量是足夠的呢?
答案可能會讓大家失望——在沒有建立和測試任何模型之前伍玖,是沒辦法確定最終需要多少數(shù)據(jù)的嫩痰,而且在這個階段幾乎也沒有太多簡單的經(jīng)驗規(guī)則可以參考。
因此窍箍,對于數(shù)據(jù)量來說串纺,只能是多多益善。并且椰棘,我們能夠確定的是纺棺,某些數(shù)據(jù)是需要盡可能多的數(shù)據(jù)量,比如邪狞,設備的故障數(shù)據(jù)祷蝌、在設備發(fā)生故障之前的一定時間窗口內(nèi)的設備狀態(tài)數(shù)據(jù)(電壓、電流帆卓、振動等等)巨朦。
不同的預測結果及建模方法
預測的結果可以分為以下兩種:
- 離散型的預測結果,即結果為一系列有限的值之一剑令,比如“是”或“否”糊啡。例如,在未來的一定時期內(nèi)吁津,設備是否會發(fā)生故障棚蓄。這里將采用分類模型進行建模。
- 連續(xù)型的預測結果,即結果為一個數(shù)值梭依。例如稍算,設備會在未來的什么時間點發(fā)生故障,或者說睛挚,設備剩余有效使用壽命是多少邪蛔。這里將采用回歸模型進行建模。
相比于回歸模型扎狱,分類模型雖然給出的預測結果相對簡單侧到,只有“是”或“否”,但是所需的數(shù)據(jù)量也要少一些淤击。
模型的評價指標
對于回歸模型匠抗,可以采用均方根誤差Root Mean Squared Error作為評價指標:
對于分類模型,可以采用準確率(accuracy)污抬,召回率(recall)等作為評價指標汞贸,大家可自行百度一下具體定義。
注:準確率描述的是如果這個模型總共做了N次的預測印机,那么共預測對了多少次矢腻,召回率描述的是在實際發(fā)生的N次故障中,該模型共預測對了多少次射赛。當然多柑,這兩個指標最后都是用比率來顯示的。
預測性維護建模的過程
預測性維護的建模過程與一般的預測分析是一樣的楣责。
假設我們已經(jīng)搜集到了一定量的歷史數(shù)據(jù)竣灌,包括故障數(shù)據(jù)以及設備運行狀態(tài)的數(shù)據(jù)。下面以回歸模型為例秆麸,對預測模型的建模步驟進行簡要介紹初嘹。當然,這部分核心工作就需要我們的數(shù)據(jù)科學家登場了沮趣。
在實際應用的過程中屯烦,下圖中虛線框中的幾個環(huán)節(jié)會迭代進行,直到獲得符合期望目標的預測模型兔毒。
1 選取模型
數(shù)據(jù)科學家首先會使用各種算法模型進行嘗試漫贞,對我們已有的數(shù)據(jù)進行擬合。在這個階段育叁,一般會先從簡單的模型開始嘗試迅脐,比如線性模型等,并以此作為與其他模型比較的基線豪嗽。
這里需要注意的是谴蔑,“選取模型”豌骏、“數(shù)據(jù)預處理”、“特征工程”隐锭、“超參數(shù)優(yōu)化”這四個步驟并不是瀑布式進行的窃躲,而是迭代進行的,最初選定的模型也有可能在后期發(fā)生改變钦睡。
2 數(shù)據(jù)預處理
這部分工作的目的是蒂窒,將原始數(shù)據(jù)轉(zhuǎn)換成模型輸入所需要的數(shù)據(jù)格式,包括對各類數(shù)據(jù)的度量單位的統(tǒng)一荞怒,或一些明顯有問題的數(shù)據(jù)的排除等等洒琢。當然,有些預處理工作也可以在模型選擇之間進行褐桌,比如對誤差數(shù)據(jù)的排除衰抑。
3 特征工程
如果我們把模型簡單理解為一個函數(shù)表達方式y(tǒng)=f(x1、x2荧嵌、x3.....)的話呛踊,那么,特征就是其中的自變量x1啦撮,x2......谭网。
特征工程可以理解為對模型輸入變量進行處理的過程。這個處理的過程分為兩種:
一種是增加特征赃春,也就是在原有的原始變量的基礎上蜻底,再應用各種方式生成新的自變量,比如x1和x2的平均值聘鳞。但是,需要注意的是要拂,生成的新的變量一定是在預測性維護的場景中有實際意義的抠璃。這就需要相關業(yè)務知識做基礎了。
另一種是減少特征脱惰。例如搏嗡,應用設備方面的知識,在眾多的輸入變量中選擇出與預測結果有密切關系的自變量拉一。
4 超參數(shù)優(yōu)化
超參數(shù)的優(yōu)化就是對我們所選取的模型的一些參數(shù)進行優(yōu)化采盒,使模型的預測性能指標更精確。
如果說特征工程是對自變量x所做的工作蔚润,那么超參數(shù)優(yōu)化就是對函數(shù)f做的工作——調(diào)整f的各種參數(shù)磅氨。
5 模型評估
在根據(jù)歷史數(shù)據(jù)建立好模型以后,我們需要對該模型進行評估嫡纠,也就是用另外一些在建模過程中沒有使用過的數(shù)據(jù)進行模型測試烦租,看看預測的效果到底怎么樣延赌。這部分測試模型的數(shù)據(jù)是一般在建立和訓練模型之前,從歷史數(shù)據(jù)中劃分出的一部分數(shù)據(jù)叉橱,通常叫做測試集數(shù)據(jù)挫以。
6 模型部署
模型建立好之后需要部署到實際的生產(chǎn)系統(tǒng)中運行,不斷地接收從設備層采集到的數(shù)據(jù)窃祝,進行預測分析掐松。
模型的部署涉及到了工業(yè)現(xiàn)場的數(shù)據(jù)采集、企業(yè)服務總線等技術粪小。
預測性維護(predictive maintanence)與基于狀態(tài)維護(condition-based maintenance)的關系
可以將二者相結合大磺,共同發(fā)揮作用。
“預測性維護”是基于數(shù)理模型的糕再,完全是從數(shù)據(jù)出發(fā)建立模型量没。而“基于狀態(tài)維護”是基于設備機理模型的,依靠的是對相關領域知識的理解突想。因此殴蹄,兩者充分結合,往往能夠發(fā)揮更好的效果猾担。例如袭灯,在特征工程中,往往會利用機理模型绑嘹,也就是設備的領域知識來產(chǎn)生有實際意義的新特征稽荧,加快模型建立與訓練的過程。
目前做預測性維護的困難
最大的困難是工業(yè)現(xiàn)場數(shù)據(jù)的缺乏工腋。
建立及訓練預測性維護的模型至少需要兩類歷史數(shù)據(jù)——故障數(shù)據(jù)(即計劃外停機的數(shù)據(jù))以及設備運行狀態(tài)數(shù)據(jù)(例如電壓姨丈、電流之類)。并且這兩類數(shù)據(jù)的數(shù)量要足夠大擅腰,這樣訓練出的模型才更為準確蟋恬。
但是很多設備的停機故障發(fā)生概率很低,可能一年也沒幾次趁冈,因此歼争,這類數(shù)據(jù)的收集就需要很長時間。
此外渗勘,很多工業(yè)現(xiàn)場并沒有完善的設備數(shù)據(jù)采集系統(tǒng)沐绒,或者即使有一些SCADA之類的系統(tǒng),也更多是完成實時狀態(tài)監(jiān)控旺坠,對于設備運行的狀態(tài)數(shù)據(jù)乔遮,只保存了很短的時間(如3個月),缺乏設備數(shù)據(jù)的長期保存取刃。
參考資料
本文參考了書籍《預測分析:R語言實現(xiàn)》申眼,以及一篇文章《Machine Learning Techniques for Predictive Maintenance》瞒津。
歡迎轉(zhuǎn)載,轉(zhuǎn)載請注明出處括尸。
如果想獲得更多關于智能制造以及物聯(lián)網(wǎng)方面的文章巷蚪,關注我的公眾號“聊聊智能制造那些事”,查看歷史消息即可濒翻。