1941年英國空軍發起預知保養,當時有速度規(類似早期的加速規)與溫度顯像儀,當然也有各類電表。主要思維是透過量測了解設備狀況,並且依據狀況決定是否需要進行修復。結果是更佳的妥善率並且降低了維護的資源花費。降低了資源的花費是可以理解的,也就是沒壞不要去修,妥善率為何增加?正常邏輯是妥善率好要花更多資源。重點在於最佳化維修品質,有了維修能力與最佳化維修品質才可以有效的優化維修排程,可以利用以下澡盆圖來解釋:
澡盆圖在維修後會有較高的故障率,表示很多是維修造成的故障。請注意用詞,Fault通常解釋為異常而不是故障(Failure):事故的阻礙,Fault在很多時候不會造成設備運行阻礙,直到嚴重後才會造成阻礙,因此Fault應該用異常來形容。民俗上說故障,通常意味著停工,如果用來解釋部件越來越嚴重的缺陷,會造成混淆,早期缺陷(異常)對於設備的影小於0.01%,不算是造成任何的運行阻礙。很多廠商故意不做區隔,意圖讓客戶以為異常都是隨機發生的,只能用機率去計算,不準確也很正常。
透過使用傳感器偵測可以在很多不同時間點了解設備的狀態,最重要的是能在維修後了解維修的品質,並且可以了解維修能力是否需要增加,可以量化維修能力與品質。
設備維修品質量化後,維修能力嚴重不足或是維修品質極端的壞就是第一次修了就報廢,如下圖黑色的曲線,維修能力或是維修品質不足就會造成紅色曲線,造成整體設備慢慢惡化,平均維修期間(MTBR:Mean time between Repair)降低,最後設備報廢。當維修能力足夠且維修品質最佳化,其實設備完全不會老化,也就是藍色的曲線,這不是無法達到,有很多的案例。要注意到以下是示意圖,實際的狀況下初期故障率高很多,且維修後的故障率與設備初期的故障率類似。
4. 美國有許多成功部屬預知保養的主管退休後出書都提到連鎖反應(Knock on effect),以下圖來看,綠色的虛線是超過1500萬筆馬達或設備出廠時的品管資料的平均值,(Artesis技術原本是用於馬達驅動設備出廠OQC Out-going Quality Control),等同於無限大的診斷視野,後來經由Bently nervada,全球設備狀態監控設備龍頭所改造用於預知保養,因此使用Artesis技術很容易觀察出連鎖反應。黃色虛線為偏離線性模型訊號2.5個標準差(異常訊號為非線性,偏離線性就是惡化的程度),通常代表著有異常發生,需要注意惡化的速度,通常都是超過一年的診斷視野,當紅色的異常(根因異常)惡化到偏離正常訊號的8個標準差,通常是診斷視野六個月,這時候很容易觸發其他異常,如下圖的二次傷害異常(A,B),我們稱這個區域為連鎖反應區(Knock on effect zone),這時候很容易觸發二次傷害的異常,最好要避免進入連鎖反應區,當惡化到連鎖反應區時,設備很難修復,這就是平常觀察到的設備"老化",如果避免進入連鎖反應區,設備幾乎不會老化,且因為異常到了六個月的診斷視野的惡化程度時,通常每個異常都會造成1%的額外能耗,當單一異常惡化到這個區域,雖然只有1%的額外能耗包含造成非線性負載影響廠內電力品質,很快地就會有其他異常產生額外的能耗,到了三個月的診斷視野可能高達6%。這麼長的診斷視野可以完全避免發展性異常造成停工的損失,因為診斷視野大於廠區大修的間隔,最有效益的維修排程是將廠區所有維修集中在廠區大修的期間,不在這個期間就會造成龐大的財損。綠色的箭頭是維修的品質,好的維修品質可以將設備回復到出廠品質,也就是將所有訊號降低於綠色虛線。如果診斷視野只有六個月(紅色箭頭),則維修品質最終會到診斷視野六個月的品質,因為如果維修能力即使可以修復到初廠狀態,通常會因為修這麼好也沒獎勵,反而會被冠上花費過多的罪名。
軍用的技術後來應用在生產業,生產可以分為批次性或是連續性,批次性的生產與古早的預知保養目的相似,但是連續性的就不同了,連續性的有停工的問題,避免停工是主要的預知保養目的。批次性生產如果停工,生產可以調配,降低甚至完全彌補停工的財損。連續性生產無法降低或彌補停工的財損。
由於批次生產(連續性批次生產屬於連續生產)與連續生產的預知保養策略不同,因此我們分為兩個獨立情境來討論。
連續性生產:
精準的三個月診斷視野:雖然能在三個月前知道會停工,3/4的機率會造成停工損失(假設歲修),MTTR平均修復時間縮短,但是縮短的時間有限,除非廠內沒備料,或是材料到貨期很長,不然能縮短MTTR的程度不高,對於客戶來說,如果業主三個月前跟客戶說,客戶會去找競爭對手補貨,可能喪失市場份額,如果突然跟客戶說,客戶可能來不及找競爭對手補貨,短期間不會喪失市場份額,但是會造成客戶停工,因此無法避免停工的損失,只能避免少部分損失。如果三個月診斷視野且不精準,反而可能會造成額外的錯誤示警停工現象。如果是六個月的精準診斷視野,也只能好一些。如果維修品質惡化到三個月診斷視野時的設備狀態,則很有可能很快又會發生停工事件。如果精準度不夠(高假陽假陰),反而會有反效果。
無限的精準診斷視野:完全避免停工事件,將維修集中在廠區大修的時段。並且可以大幅增加MTBR、降低異常連鎖反應造成的能耗與延長設備壽命,確保大修後的維修品質與安裝品質,如果品質不夠可以增加維修能力,確保可以撐到下次歲修,整年都可以安心地去做其他工作。如果精準度不夠(高假陽假陰),反而會有反效果。
批次生產:
精準的三個月診斷視野:批次生產通常只需要一個禮拜的診斷視野就可以避免停工損失,批次生產通長不太需要在乎MTTR,但是需要在乎MTBR(維修間隔),必須增加維修間隔才能達到有效降低維修保養費的效果,但是三個月診斷視野反而會造成維修品質降低,因為既然只看得到三個診斷視野,修太好也沒獎勵,反而可能被責怪花費過多。三個月的診斷視野反而可能比預防保養造成設備壽命降低,能耗增加並且維修保養費增加,後文會詳細介紹。如果精準度不夠(高假陽假陰),反而會有反效果。
無限的精準診斷視野:可大幅增加MTBR、降低維修保養的次數。主要原因是因為可以掌握維修品質與維修能力,並且可以知道是否需要增加維修能力或是改善維修品質,所進行的改善可以立即看到成效,增加改善維修品質的速度,並且可以立即得知所做的工作是否有效益,並且可以量化效益。如果精準度不夠(高假陽假陰),反而會有反效果。
由此可知預知保養成功與否,關鍵在於預知保養系統的診斷視野與其對應的精準度,有論文指出,當設運行時發生負載變化與操作變化時,如果預知保養系統沒有建立相關的準確數位模型,則其精準度與擲筊的精準度相當,這種狀況是不適用來進行預知保養。正確的作法是要根據系統操作與負載作變化而變化,如果在頻域分析,每個頻段皆要獨立計算不但要根據系統設計的正常狀態,還要根據操作負載變化。
以上描述預知保養看似簡單,其實不簡單,很多生產業的調查報告顯示成功率低於25%,這是歐美的調查報告,台灣成功率可能就更低。工業4.0藍圖內包含很多不簡單的技術,預知保養也是其中一個項目,因為要成功不簡單。
市面上很難找到如何成功預知保養的資訊,原因是這是公司競爭力的機密,通常不會寫出一篇文章完整的告訴競爭對手,甚至不會對官方透露,很多狀態下,每種生產線的手法也不同,但是我們可以從官方的報告去推敲,或是找到退休的員工為了賺外快寫的書。
首先我們先闢除業界迷思,預知保養不是裝一些加速規或是熱顯像儀就可以成功,也不是將這些訊號透過IOT整合,更不是將集中的資料進行AI處理。在美國,設備狀態監控業界普遍將上述的系統稱為保護系統,因為這些系統主要功能為在設備即將故障前(一個月~三個月前)示警,避免造成額外的災害,但是無法避免異常惡化對本身設備的傷害,因此無法達到25%的預知保養成功率。反過來推論,早在AI與IOT崛起之前就有25%的公司成功的部屬預知保養。證明IOT與AI不是預知保養成功的必要條件,不要再被騙了。
美國能源局與商務局做過詳細的預知保養成效調查:
以下為美國能源局報告內的數據: (Google: DOE O&M guide 3.0:網址經常變化)
投資報酬率十倍
減少保養費用:25%到35%
預防非計劃性停機:70%到75%
減少停機時間:35%到45% (他們指的是非計畫性停機的時間與計畫性停機的時間的總和)
增加生產:20%到25%
設備價格通常都是超過50,000美金(2010,如果計算通膨,等於大約3,000,000台幣)
商務局的報告包含很多批次生產的產業
軍方與NASA算是成功部屬預知保養的機關,軍方的文獻很難得手,如果經常閱讀NASA預知保養的相關文件,常常會看到預診或是診斷視野的名詞,診斷視野就是已故障的時間為觀察點,可以看到多久之前異常的訊號。這對於預知保養的成功很關鍵,後文會詳細解釋。
節省保養費用通常在批次生產較為顯著(批次連續性生產不屬於批次生產,是連續生產),保養費用通常都是勞力費用、材料費用,牽扯上需要修復的頻率,或是平均維修期間,又稱作MTBR(Mean time between repair)。MTBR與設備狀態監控的儀器好壞有關,好的儀器有助於增進維修品質與維修能力,畢竟通常要看得到異常才會去修,即使有更好的維修能力,通常維修品質會退化到看得到的惡化程度,換句話說就是受限於診斷視野的遠近或長短。
批次生產實際運行時間通常相較於閒置時間較短,使用一個月診斷視野的預知保養儀器即可避免停工。因此會著重於對於設備修復的花費。批次生產設備故障發生時間,對於修復所產生的勞力或是材料費用影響有限,因為通常沒有停工的壓力,批次生產通常生產量較小,停工損失有限,通常批次生產都是壞了再修,預防保養會是不錯的選擇,如果使用診斷視野有限的儀器(一個月或是三個月診斷視野)進行預知保養,其實效益有限。如果使用診斷視野很高的預知保養儀器,會不會產生效益?如果要討論,需要以下的一些資料輔佐,進行較準確的推估:
設備發生異常機率(故障率)為大於7%每個設備每年(根據IEEE對於馬達故障率調查),超過五百馬力的故障率超過三倍。簡單設備約略為10%~13%/設備/年。
先進預知保養較適合應用於發展性異常(Incipient Fault)。異常惡化為指數模型,在縱座標為Log時為直線上升的曲線。(NASA)
單一異常惡化到某種程度時會引發其他的異常,每種異常惡化的速度不同,代表著很多斜率不同的上升曲線,會在不同時間開始發展,根據經驗往往會在8~6個月診斷視野的時候發生(偏離系統正常時8個標準差附近)。通常會引發軸承的惡化,而軸承的惡化速度通常快很多。(這些屬於某公司機密,退休員工著作有提到,使用Artesis多年後量測超過200台機台也可以輕易發現)
接下來需要了解美國會計準則GAAP對於預知保養費用的規定,保養費用不只包含設備故障後進行維修,主要包含運行時消耗品與磨耗品,或是一些較為便宜的零件,主要為勞力工時,但是消耗品與磨耗品不在預知保養範疇,屬於預防保養範疇。保養費很多是資本支出的項目,像是建構設備,更換設備或是金額較大的零件。假設設備科目與紀錄都正確依照會計準則(GAAP),根據多數人家用汽車運行的維護費用(保養廠的帳單),故障後修復費用(不包含零件更換資本支出)通常與其他維修費用相當或是更少,這也取決於廠商收費與計價的方式不同。因此保養費的25%~35%約略佔超過一半的故障後修復費用。如果馬達故障率高於7%,則代表著有較多的進步的空間,設備故障率高於馬達,簡單設備約略為13%/設備/年,如果設備故障率較高也代表著有進步的空間。假設以上的估算成立,如果使用診斷視野小於三個月的預知保養系統,降低維修次數的效能有限(除非MTBR接近三個月),因為設備維修品質不好,且受限於診斷視野,往往無法偵測出根因,因此維修後異常會立即惡化,會發生的還是會發生,本來是非計畫性停工,使用後則是將非計畫性停工轉換成計畫性停工,只是描述的名詞換了,實質上對於除了避免批次性停工以外的保養花費沒有幫助,如果依照會計準則,頂多可以省下勞力與運輸趕工的費用與修復零件的庫存的保養費用(不到5%的帳上保養費用),遠小於5%整體故障修復費用,無法達到降低25~35%的帳上保養維修費用。使用三個月診斷視野的預知保養儀器很可能持續降低維修品質反而會增加維修保養費用,因為通常會看到哪裡修到哪裡,如果看不到異常反而會盡力修復,而如果預知保養如果不準確,假陽率過高,則反而會造成更高的維修保養費用。
假設使用六個月診斷視野的預知保養儀器,且維修品質受限於六個月診斷視野,也就是沒修好根因就復工,這時設備已經受到連鎖效應(Knock on effect)長期影響,因此修復後異常繼續惡化,發生機率可能較三個月診斷視野較小,造成MTBR降低如下示意圖的藍色曲線,上端的黑色虛線代表了故障(失效或停工)的閾值,底下紅線代表著六個月診斷視野時設備特定異常的訊號強度(偏離系統正常時八個標準差)。黃色線為十二個月診斷視野時設備特定異常的訊號強度。綠色線為設備出廠時的設備特定異常的訊號強度。假設這特定異常是軸承,軸承通常是更換,也就是修好到達出廠品質,但是如果軸承是二次傷害,且根因異常沒修復,這時候因為根因異常還是持續的惡化,因此很快就會再次引發軸承二次傷害(注意到根因還在持續惡化),且通常惡化速度較根因快,因此通常很接近以下圖示。如果想更深入了解診斷視野如何幫助維修品質,請參閱:診斷視野與預知保養
如果使用普通加速規進行單一物理量的監控,不分離各別異常訊號,真實狀況通常會看到類似以下的曲線,MTBR很明顯的逐漸縮短。
假設使用十二個月診斷視野的儀器,如下圖紅色的曲線,這時維修次數大幅度的降低,等同於增加一倍的MTBR。這時候還是假設看不到根因異常,但是通常十二個月的診斷視野,如果可以分離各別異常種類的異常訊號如Artesis技術,各別建立趨勢圖,通常都會很輕易地發現根因異常並且進行修復,因此下圖為最壞狀況,因此可以增加超過一倍的MTBR並且降低超過一半的維修保養花費,約略就是25~35%。
或許你會好奇,診斷視野如果看得到根因情境會是如何?以下為看得到設備出廠品質的診斷視野。可以看得到根因的輪廓,但是連鎖效應很可能超過兩個以上的異常。如果沒有分離各別異常種類還是很難去除根因。
如果有很強的分析能力同時進行定性與定量的分析(FFT不可以進行定量分析),可以辨識出根因。
如果可以分離各別異常的訊號,不但可以分辨出根因,並且可以估算各別異常惡化的速度。
使用Artesis技術各別異常種類有各別獨立的趨勢圖,可以有效增進各別異常維修的能力並且完善各別異常維修品質,並且觀察各種異常的相互關係。如果應用於連續性製程,可以準確估算需要進行維修的排程,有效集中所有維修,降低計畫性停工的時間,並且杜絕發展性異常造成的非計畫性停工。
如果有無限的診斷視野,且設備價格高、維修費昂貴,像是煉鋼廠等,最好避開連鎖反應區,因為可以看到並且修復根因,因此異常不會在修復後立即觸發或是惡化,不但有效增加MTBR,並且可以避免設備老化。如果像Artesis技術可以看到設備出廠品質狀態(原本是用於馬達驅動設備出廠品質監控,後來被GE Bently Nevada發現用於預知保養的潛力),可以更有效的增加MTBR,但是需要持續增進維修能力與維修品質,這是較為困難的瓶頸。對於批次生產或許這些花費太貴,無法達到最佳化預知保養,但是對於大部分的連續性生產,這是必備條件,有效完全避免發展性異常造成生產中的非計畫性停工或是計畫性停工。(如果對於批次生產預知保養有興趣請參閱: 批次生產製程預知保養)
能耗的部分,每種異常通常超過六個月診斷視野時都會造成1~1.5%的額外能耗,美國能源局之前有實際量測並且估算每種異常造成的能耗,Artesis就是依照這些結果進行計算,當設備長期處於連鎖反應區時,會引發其他異常,通常都會有超過三個其他異常,因此很容易的超過5%的額外能耗,並且造成區域性電力品質的問題(非線性負載,異常本身就有非線性的特性),因此美國很多電力公司提供預知保養設備的補助,通常超過500馬力的補助就足夠購買一台Artesis的eMCM。
上文應該解釋很清楚批次生產也可以透過預知保養降低花費。預知保養應用不限於連續性生產。很多批次生產是連續性的,這是屬於連續性的生產線。當然連續性的生產線如果生意不好長期停工,會比較像是批次生產。
上文提到預知保養適用於診斷發展性異常(Incipient Fault),Incipient Fault大約占所有異常的70%。還是無法避免隨機的突發異常或是間隔性異常。(後文會介紹發展性異常),預知保養系統主要是專注於偵測早期的發展性異常訊號,我們後文會詳細介紹。剩下無法避免造成停工的包含30%的突發性異常與間接性異常,之前所說的古早的預知保養所使用的加速規與溫度顯像儀系統稱為保護系統,通常量測單一物理量並且設定單一固定閾值,這是用於保護危險性機具或是處於危害區域的保護系統,這些系統的設計無法偵測早期的異常,但是對於保護安全有絕對的功能,可以用來應付突發性異常與間接性異常帶來的災害,其設計目的與功能與預知保養系統截然不同,因此無法互相取代。使用保護系統是無法達到降低非計畫性停工的,如果使用不當會造成停工的增加,因此有些場所會規定使用保護系統,這時候如果要部屬預知保養,必須額外增加專門用於偵測發展性異常的預知保養系統。預知保養系統不但有精準的診斷視野,且偵測範圍必須包含所有發展性異常種類,且必須考量並且監測會影響發展性異常的物理訊號像是電力品質等。我們下文會詳細討論。對於發展性異常有興趣可以參閱:轉動設備發展性異常
這裡需要注意到減少停機時間包含計畫性停工與非計畫性停工,如果沒有發生非計畫性停機,通常每年計畫性停機約略為7~14天。如果是7天,則表示避免掉2~3天的停機時間,這些可能是非計畫性停工,根據預防非計畫性停工,預知保養的極限是70%與75%,因此可以推敲預知保養必須能完全避免發展性異常造成的非計畫性停工。一個生產線通常有超過十台機台,假設會影響生產線的轉動設備有10台,假設故障率粗估為10%/機台/年,代表至少會有一台機台造成停工,修復的時間可能也是2~3天或是更長,如果與其他工廠有關聯,則可能會影響其他工廠生產的可能性,也可能會造成品質問題。 (這個條件不適用於批次生產,因為批次生產不會有停工損失)
這部分無法找到估算的資料,這是針對連續生產線,批次生產線很難有停工財損,所謂增加生產意思是輸出/輸入比例增加,預知保養無法增加生產,因此所謂的增加生產指的是避免生產線停工。經濟學的角度看生產,可以用生產量與勞力加上投入資本的比值(公式:生產=函數f(L勞力,資本),因此可以用生產量(輸出)/(勞力+資產)(輸入)來衡量,這比值需要增加20%~25%,也就是分子生產量增加的比值加上分母勞力與投入資本降低的比值要達到20%~25%。這些通常需要精算,但是五大國際會計公司都發表文章支持20%~25%,甚至有傳聞這些數據來自於這些會計公司。本來以工程師的角度計算,覺得不可能,但是看到這些會計公司的數據,只好查看美國商務局的預知保養資料推敲數據的來源。
要注意到不能使用"生產效率"喔要用"生產",生產效率=實際生產量/標準生產量,無法描述用更低的資源達到更高的生產量,且標準生產量很主觀,但是生產=勞力與資本的函數,因此用"生產"來描述比較適當!生產效率是用來描述生產線的改變造成的生產量的變化,不包含生產線變化引起的市場或客戶反映,以下的案例解釋了可能發生20~25%生產的狀況,但是同樣的狀況可能只提供了0.3%~1%的生產效率提升,0.3%提升可能比誤差還高,如果是業主可能對預知保養一點也沒興趣!如果是廠商宣稱的產品好處,通常是要遮蔽產品完全沒效益的事實。
輸出的部分
生產量的相對增加表示預知保養避免了停工的損失時間,我們用天數來計算,通常是生產線的複雜度(多少獨立的轉動設備)、保養的好壞(故障發生機率)、MTTR(Mean time to repair)平均修復時間、需求恢復時間(銷售,客戶採購其他競爭廠商產品),假設關鍵轉動設備有20台,假設都有1+1備載,根據澡盆圖1+1備載的故障率不是故障率平方,可能只有故障率的一半,因為大修復工時的故障率高很多,沒備載的故障率是大約13%/設備/年左右,備載故障率大約是6%/設備/年左右,MTTR估算一周(回復到製成穩定),但是因為客戶需要維持生產線運行,採購了競爭對手的產品,這時需求恢復需要一段時間,可能有最低採購量,估算為一個月。因此在生產端每年可能會因為設備故障造成8~12%的產能損失。但是也有可能直接失去客戶與市場份額,需要花更多資源開發新的客戶。除此之外7%的馬達故障率是包含成功的25%的預知保養公司,如果這些調查數據不包含這些成功的25%,馬達故障率會再增加17%(70%的25%)。
輸入的部分
通常能耗佔有20%的投入資金,預知保養可以節省5%左右的能耗,異常造成的1~2%能耗與停工時沒生產力的能耗,佔約1%,直接勞力約佔總成本的5%,停工也可能造成1%~2%的增加,原料大約佔30~50%的成本,停工時喪失機會成本與通膨,還會產生倉儲費用,大約是3%,Overhead general and administration營運開銷,約佔20%,在喪失產能時,這些是沒生產力的花費,加上機會成本,大約佔3%。目前已經累計9%,如果加上設備修復的重新建構花費,零件的採購等,加上公司名譽損失的補救,輸入的部分很輕易的達到10%,如果碰到失去客戶與市場份額,這時花費就很高了,對於簡單製成的生產,這部分的佔額較高。
為何大費周章去推敲這些數據呢?因為這些數據可用來作為衡量預知保養是否成功,是否可以做的更好?了解了細節可以根據上述的詳細情節去估算特定情節的變異,與可能偏離上述情節的程度。這預知保養的連續性生產特性需要配合行銷策略進行競爭力最大化,如果你產能低於80%,這對於銷售策略沒幫助,這需要配合價格vs銷售量曲線,預知保養可以在滿載時在毛利vs銷售量曲線上創造一個無彈性毛利區,在這個區域可以在固定獲利下痛宰對手。
報告提到預知保養系統價格通常都是超過50,000美金(2010,如果計算通膨,等於大約3,000,000台幣)這是很明顯的線索,從預知保養儀器來看,一定排除熱顯像儀與常規加速規,那這到底是什麼設備與軟體?軟體的部分Github可以找到很多分析的原始碼,包含頻譜、envelop、Kurtosis、Cepstrum等,也不需要額外的開發。因此絕對不是只使用加速規與溫度顯像儀。而是高精準度高診斷視野的儀器。
對於石化業(連續性生產)每小時停工平均財損為220,000USD來說,投資報酬率超過十倍,但是如果是批次生產,必須最佳化預知保養,便宜的加速規或保護系統即可避免停工,投資報酬率達到十倍。如果批次生產需要降低保養費25%~35%,必須詳細記錄相關花費,不限於保養費用,包含異常造成的額外能耗、資產建構的花費,還有MTBR,因此可以透過這些紀錄分析出最佳化的預知保養預算,在預算內找到診斷視野最高最準確的預知保養系統。
要達到目標首先要知道用預知保養系統量測什麼?如果不清楚量測目標,說再多也是廢話,台灣預知保養業界多數不清楚要量測什麼。預知保養的歷史接近一世紀,且持續的進步,因此複雜的程度很高,具有很高的專業性與經驗的累積,畢竟異常發生的機率很低,因此如果使用深度學習或是機械學習於各別設備是很沒效益的,很多廠商連要量測什麼也不清楚,像是沒看過魚的去參加釣魚比賽,你會下注他贏嗎?
NASA分類異常(Fault)為三種
發展性異常(Incipient Fault): 大約占設備異常65~75%
間接性異常(Intermittent Fault)
突發性異常(Abrupt Fault)
我們不提供相關連結,畢竟Google:Incipient Fault,就會有很多結果,讓第三方證實,我們是來自NASA的嫡傳弟子,首先深入研究異常的研發單位。
預知保養主要針對轉動設備的發展性異常。NASA發現發展性異常的惡化模型為指數模型。
根據美國應用於產業的預知保養經驗,轉動設備發展性異常惡化到某種程度會產生連鎖效應(Knock on effect),連鎖效應會造成MTBR(Meam time between repair)嚴重縮短,並且造成設備壽命降低與能耗的增加(1~6%),根據我們在現場測試超過兩百台設備,通常會發生在診斷視野八個月與六個月的時間,新的設備或新的工廠發生的診斷視野較短,少數不會發生(新工廠加上很好的設備)。因為預知保養的情境通常都是發展性異常,因此使用診斷視野較容易描述發生的現象過程。
發展性異常有三種特性:指數惡化模型、產生會惡化的訊號與特徵、訊號通常是非線性。Artesis 技術充分利用這三種特性偵測異常。 利用非線性的特性分離異常訊號,利用特徵分類與辨識異常,並且在可同時進行定量與定性的平台解析出單獨類別的異常訊號,用訊號建立單獨類別異常訊號的趨勢圖,再次確定是否是發展性異常,並且建立模型觀察模型參數的變化用於再次的確認結果的準確性。因此達到準確的高診斷視野,並且除了潤滑油、少數的增溫異常、非設備轉動的振動以外,都可以高診斷視野偵測,對於大部分品質較好的設備,診斷視野高達可以用於偵測設備剛出廠的品質。
多數轉動設備都是馬達推動,且馬達為異常較多的部件。IEEE與EPRI都有做過相關的調查。
診斷視野的廣度: (有沒有監控的意圖?)
是否涵蓋了設備可能發生的發展性異常?有些非發展性異常也會影響發展性異常,必須監控。通常SCADA系統有相當多的傳感器,很多傳感器足夠反映診斷視野小於三個月的需求,批次生產避免停工是足夠的,但是對於連續性生產卻一點也沒幫助。通常部屬預知保養時會有預算的阻力,因此建議以運用既有的資料為先,先去看看 SCADA有沒有可用的資料,接下來就是關連到設備狀態,之後由CP(Cost performance ratio:Performance/Cost)值高的開始部署,慢慢的覆蓋所有的發展性異常。如果沒有預算阻力,應該依照造成最大財損的異常所需的診斷儀器,依照診斷視野的需求進行排序部署。
診斷視野的深度: (有監控的意圖,但是有用嗎?)
深度通常會被雜訊所影響,最常見的就是被雜訊所遮蔽,所謂遮蔽就是雜訊遠大於異常訊號,以加速規來解釋,通常低頻診斷視野都在1~3個月,超過三個月的訊號很弱(發展性異常為指數模型的特性),且低頻的振動訊號傳遞距離很遠,因此低頻的雜訊高,解決方式是分析高頻的異常訊號諧波,之後可以使用Kurtosis、Cepstrum、Envelop等分析技術,傳感器的高頻響應精準度很重要,前提是加速規的規格與安裝符合預期的異常振動,不是很直覺簡單的,分析人員基本上可以算是數學家+物理學家+機械工程師。
MCSA技術不會被外界振動影響(如上圖),但是也量測不到環境振動,因此不適合應用為保護系統,但是很容易被電力的雜訊所影響,解決方式是跟加速規一樣,請一個數學家+物理學家+機械工程師,Artesis 開發了MCSA 3.0的技術,建立電力與轉動運動的整合數位模型,或是分離出發展性異常的訊號,因此只需要看PSD(Power spectrum density),等同於分析FFT資料,差別在於FFT不可以進行定量分析,而PSD可以同時進行定量與定性分析,因此只需要請一個工程師即可進行超過六個月診斷視野的分析。
Artesis後來與當時的業界龍頭GE合作,開發MCSA 4.0,提供自動分析技術,任何人都可以進行基礎的超過六個月診斷視野的分析,涵蓋80%左右的發展性異常。當然,發現問題時可以請工程師同事協助解決剩餘的部分,或是請原廠幫忙(多數情況下為免費支援),因為高診斷視野,因此沒有時間的壓力。如果你設備來的時候就有Proximity sensor可以去畫Orbit,恭喜你!這原理跟 MCSA差不多,可以偵測到早期的各種機械發展性異常,診斷視野超過六個月。但是如果需要知道電力與機械異常的關聯,可以額外加裝Artesis系統,因為設備一定不便宜,裝一個不貴的Artesis,可以有雙重的保護外加電力品質的監控,並且可以與機械異常相互關聯。相較於市面其他電力品質的儀器,Artesis效能會高許多,也準確很多,因為模型整合了轉動運動方程式,機電系統內,機械與電力會交互影響。
批次生產可以隨意調配生產,沒有停工的壓力,連續生產需要最少6個月的診斷視野,避免停工造成的損失,
而對於批次生產也不是沒有用,可以大幅增加(MTBR:Mean time between repair)並且可以有效延長設備壽命,並且可以降低異常造成的額外能耗(1~6%),但是最佳化預知保養反而是成功的關鍵,因為能省下的花費較低,必須有完整的花費紀錄,要確保預知保養預算能回收,批次生產停工的財損不高,且保養費通常不超過營收的五分之一,而預知保養只能省下這五分之一的25~35%,因此不會超過營收的5%,停工造成的財損可能不到2.5%。當然有例外,但是很多時候這些產品在市場上有足夠的優勢,可以將成本轉嫁給客戶。
通常使用加速規進行超過6個月的診斷視野需要在高頻進行分析,但是通常侷限於軸承發展性異常,通常會配合很高的維修能力與品質達到連續性生產的需求。主要原因是大多數的發展性異常都會引發軸承異常,甚至振動會造成隔壁的靜置軸承損壞(常見異常:False brinelling),軸承惡化速度快很多,如果維修能力夠,且維修品質好,通常其他異常在送修時會修復。如果維修品質不行,表示沒有使用儀器檢測到,安裝時也沒檢測,這時候還是會造成停工,維修工廠通常環境振動很小,不需要用到相對昂貴的儀器測試,但是也可以使用較便宜且功能強大的預知保養儀器線上監控,根據ISO20958所述,Artesis提供等同效能但是便宜許多的技術,根據中油煉研所實際訪查,Artesis技術便宜超過五分之一。
傳感器精準度
傳感器如加速規會被環境溫度等參數影響,並且響應靈敏度會衰退,約略為每年<0.5%,Artesis採用無傳感器技術(比流器與比壓器)因此完全沒有環境溫度等參數或是衰退的問題。雜訊干擾的部分,Artesis採用MCSA,MCSA不會受到環境振動雜訊干擾。
雜訊干擾
非持續性的突發雜訊(對於巡檢影響很大)
持續性的穩定雜訊,如微機電MEMS加速規本身的雜訊。(如果波幅不大影響有限,但是很可能遮蔽異常訊號)
設備本身的正常振動。
持續性的不穩定雜訊。(影響較大,很多時候是其他機台的異常訊號)
白色噪訊。發生在特定大範圍的頻段。(有些是發展性異常訊號,波幅不大的影響有限,通常是製程紊流或是懸吊平台沒調適好造成振動波亂竄)
異常偵測的假陰率
一、沒有進行偵測(請參閱”診斷視野的廣度”段落。)
二、進行偵測但是漏掉,可能是系統發生問題,或是偵測早期異常時異常訊號被遮蔽。
三、傳感器精準度問題
四、使用FFT進行定量分析 (FFT不可用於定量分析,無法解析波相(Phase))
五、操作與負載的不穩定,巡檢偵測時剛好負載或操作造成偵測點的扭力降低,導致於異常訊號降低。
六、高診斷視野因雜訊訊號遠大於早期異常訊號,無法偵測
異常偵測的假陽率
一、雜訊干擾
二、異常訊號重疊(如下圖)
三、操作與負載的不穩定
四、傳感器精準度問題
五、使用FFT進行定量分析(FFT不可用於定量分析,無法解析波相(Phase))
六、高診斷視野因雜訊訊號遠大於早期異常訊號,影響巨大,當操作與負載經常些微變化,準確度與擲筊相當,除非建立模型分離異常訊號。(有論文進行相關研究證實)
異常訊號重疊需要特別解釋,當有一個或多個異常同時發生在一個平台上,並且發生建設性或是破壞性干擾就是異常訊號重疊,如果使用加速規量測單一值的時候很容易產生訊號建設性干擾而產生錯誤示警,或是漏檢,最好是能利用頻域進行分析,但是要注意FFT無法進行定量分析(沒解析波相Phase),最好是利用PSD(譜密度分析進行分析),Artesis採用獨門技術RPSD(Residual Power Spectral Density)殘餘值譜密度分析,也就是已經處理了電力的雜訊。
異常訊號可能是本身的多種異常訊號在頻域重疊,經常發生隔壁機台的異常訊號在頻域重疊,或是常見的製程紊流(管壁或是葉片孔蝕異常)造成的訊號在頻域重疊,也有可能是電力品質造成的異常訊號在頻域與機械異常重疊,當設備惡化進入連鎖反應區時會引發其他異常的產生,通常會在頻域發生重疊現象,通常都會有建設性的干擾。(下圖假設異常發生在某極點(Pole)的頻段,因此閾值最佳的設計是偏離極點特定的標準差,因此為包絡線)
這裡所說的預診不是診斷視野三個月的,三個月的診斷視野通常較容易,因為已經到了異常的末期或是造成停工的條件,這時候大多數是軸承的異常,且因為惡化速度較其他異常快很多,因為異常惡化是指數函數模型,其他異常的振動對於軸承異常影響非常有限,通常都在1%左右,且軸承廠商都會提共準確的失效模型。以下所討論的是超過六個月的診斷視野,有研究報告指出,在負載與運行不穩定的狀態,直接量測並且分析六個月診斷視野的異常,準確度與擲筊相當,通常只有在實驗室會有穩定的運行與負載狀態。
目標系統的不確定性: 轉動設備通常都是預知保養的目標系統,不確定性很高,可能是燃油引擎驅動、可能是直流馬達驅動、可能是感應馬達驅動、可能處於懸吊系統、可能處於動態平台、負載變化很大(可能有時抽水、有時候抽泥、有時候運輸一個人、有時候運輸十幾個人)、電力品質經常改變,像是上班日與休假日、工廠附近有鋼鐵廠、火車經常經過、操作人員操作方式不同等。Artesis目標較為明確,用於三相感應馬達驅動設備,取得馬達設計資料(馬達名牌),有效大幅降低系統的不確定性。如客戶願意提供更多的設計資料或是設計圖,可以有效降低更多不確定性,有利於分析。客戶可以透過營運相關資料,在確定的系統上進行較準確的分析。在系統不確定的基礎下,能做的就是盡量找到可確定的範疇,以利建立較為可信的數位模型。感應馬達的模型較容易建立,主要就是電路與轉動運動,由於立即建立模型的重要性,且模型精準度與診斷視野足夠,因此建立模型選擇在七分鐘內完成。
模型基礎定義的不確定性: 預診通常需要數位模型去應付系統的不確定性,模型基礎不確定很難去應付環境與系統的變化。使用的模型基本上差異很大,如果使用確定性的物理模型可以有效降低不確定性,如果使用灰箱或是黑箱模型,需要清楚的定義模型基礎外,還需要龐大的資料進行學習解析。模型很簡單的解釋就是能夠依據輸入而產生正確的輸出,經過時間修正模型而達到準確,且需要一定的彈性去應付不確定性。Artesis使用白箱模型作為基礎(整合電路等同方程式與轉動運動方程式),建立灰箱模型,因此有效降低模型定異的不確定性,且降低學習時間7分鐘(巡檢)~10天(全時監控)。當沒有模型基礎時,無法設定有效的閾值。
系統惡化模型的不確定性:大部分廠商對於異常的認知有限,不清楚預知保養主要是針對發展性異常,因此通常會去學習並且建立異常的模型,這需要漫長的歲月,過程複雜,且在六個月診斷視野時,通常會面對連鎖效應造成的多種重疊異常,因此成功的機率不高。有些廠商甚至設法設法建立固定閾值去應付無法確定的異常惡化模型。惡化模型的確定,第一個步驟需要分類並且分離各別異常訊號,這會是使用AI的好時機。Artesis是由NASA研究異常的團隊所開發,很清楚發展性異常的模型。如果無法確定惡化模型,預診的準確度可信度低。
預測的不確定性: 通常黑箱模型會使用Particle filter,但是這種方法需要很龐大的數據,必須等到上述的各種條件都有足夠確定性後才能準確,當準確時,通常都是設備壽命的極限,這些數據是否適用於更換的新設備呢?異常發生機率約略是13~17%/設備/年,即使是簡單設備如風扇,異常訊號特徵超過100種。 複雜設備的特徵很輕易地超過200種。預測的不確定性是可以隨著時間改善,但是這是要依據特定設備去進行,因此最好是能夠將可確定的範疇進行確定,然後根據這些取來的資訊建立特定各別設備的模型。
Artesis 與GE合作開發MCSA 4.0,主要是GE提供了當時為設備監控龍頭的經驗,結合了NASA的異常診斷技術、透過系統鑑別技術降低預測的不確定性,並且提供可靠的資訊給客戶進行進一步的建立各別設備客製惡化模型。
失效閾值不確定性:由於轉動設備通常在頻域進行分析,因此如果要在頻域進行分析必須要使用可以定性與定量計算分析的平台像是PSD,FFT不是可以定量分析的平台,Artesis系統每個頻段的閾值必須根據馬達模型參數而變化:電流電壓增益、功率因子、頻率等變化等。由於工廠運行的需求,這些參數每個時段都不同,因此Artesis閾值也會隨時間與各別異常種類而改變。利用異常訊號為非線性與指數惡化模型分離異常訊號,不會被線性訊號干擾。當建立起可靠的系統數位模型,則以數位模型作為閾值設定的標準,通常都是以偏離模型多少個標準差而設定,如果是在頻域,會碰到目標設備的極點(Pole)跟零點(null),通常因為參數不夠,會將極點移位到座標的零點,建立模型後再移回去,建立起線性的模型,偏離線性模型就是異常訊號,非線性的程度越高,表是異常狀態越嚴重,但是因為參數太多與不確定性太高,且惡化後會有更多外界的額外參數產生,因此如果要連結到診斷視野,必須要有準確的基點,唯一準確的基點是設備失效時,但是這會與客戶需求衝突,但是由於客戶需求應該是比免連鎖效應(上文已經處介紹),因此可以選擇連鎖效應發生的時間取代設備失效時間,這樣就可以滿足大部分客戶的需求,通常都發生在偏離線性模型8個標準差的時候。
很多AI或是SCADA廠商以為可以利用IOT蒐集很多資料就可以利用AI建立起有用的數位模型,在沒有洞悉客戶需求與實際狀況時,只要運算的速度夠快,或是時間夠久,這是肯定的。但是很難有實際的效能,並且不符合客戶需求。舉很簡單的例子,異常發生的機率與頻率不高且種類眾多(150~200種特徵),而且即使同款的設備同樣的操作與負載,都會有差異很大的數位模型,因此學習的速度通常受限於異常發生的機率與頻率,且通常異常發生率最高的是剛建構安裝完成或是大修復工的時候,而這些系統在這時候無法產生任何效益。假設AI模型可以立即偵測異常,但是如果使用的傳感器無法偵測早期的異常,使用診斷視野低於三個月的儀器無法預診超過三個月,這時候無法達到成功的預知保養效益,通常只會證實垃圾輸入得到垃圾輸出的分析定理。最近看到很多IT廠商宣傳ARC所做的調查發現82%故障(是隨機的),18%是因為老化,首先,ARC屬於顧問公司,對於保養的經驗不多,可能比很多IT廠商還少,他的意思是只預防保養只對18%老化故障有用,82%隨機故障需要使用預知保養。根據IEEE與 EPRI對於馬達的報告上通常都有原因,沒原因的只有10%,沒有對設備進行調查的原因是因為設備太多種,但是設備通常老化都是繞線的絕緣層才會說是老化,大約是11%的故障率,他們認為因為82%是隨機的所以需要使用他們的預知保養系統。如果最複雜的馬達的異常模式都可以分類,不清楚他們調查哪些設備有82%無法分類,並且是隨機的?如果老化不是隨機的話,預知保養應該用於18%老化的啊?82%天曉得發生什麼事,所以需要用IT系統進行研究?結果發現是個騙局,連結沒有文件,不信自己試試:https://www.arcweb.com/lists/posts/post.aspx?ID=260,你要使用有接近半世紀經驗的Bently nevada與NASA的結晶,還是要從頭學習設備異常?想吃麥當勞漢堡買外賣回家吃就好,沒必要把所有麥當勞設備搬到家裡自己做一個漢堡。故障發生時間不是隨機的,但是造成故障的異常種類是隨機的,很多時候這些IT產業連故障與異常都沒辦法區別。
ESA不需要安裝感測器或傳感器,只需要安裝比流器,電壓通常只需要直接擷取,中高壓的現場會有比壓器、比流器,這時候只需要連接二次側即可,安裝非常簡單。電壓量測不太需要解釋,只是要確定精準度最少要Class 1,如果是Class 0.5是符合基本要求的,比流器也一樣,比流器用的導線要注意,最好是遮蔽絞線,遮蔽只能接地一端,不能接地兩端。如果沒接地最少要用絞線,每個相用一組獨立絞線。如果現場有比壓器與比流器,要確保這些是量測型的,如果是保護型的可能會損傷儀器,且必須確保運行電流通常都在量測精準範圍。如果現場只有兩個比流器,可以使用Aaron連接。MCSA通常不量測電壓,通常只量測一個相,這樣無法避免電壓雜訊,同個線路附近如果有非線性負載(變頻器或是有異常的馬達等),或是線路不良,如局部放電或、端子鬆動、電容器問題等,都會有雜訊,如果量測三相電流與電壓就是ESA,ESA只需要建立精準的數位模型即可排除電壓雜訊,MCSA與ESA本身量測不到環境振動,因此不會被環境振動干擾!除非振動造成軸與定子的相對振動或是錯相振動。因此MCSA不量測三相或是電壓,在工廠的環境下診斷視野有限!當負載變化與操作變化時MCSA與振動規的高診斷視野(六個月)的精準度趨近於擲筊。
加速規就很複雜,通常要考慮到與軸承的距離,如果有特定的目標異常,要確保加速規的訊號方向性,或是加速規的數目或是量測維度,如果需要高於三個月診斷視野,加速規與目標物的介面也很重要,最好是鑽洞安裝,安裝的位置也很重要,很多位置會共振,有些位置會因為螺絲鎖緊的程度而大幅變化,有些位置振動訊號甚至無法傳遞到。如果要精準量測到高診斷視野(六個月),必須利用高頻傳遞的距離進行選擇性量測,也就是量測異常訊號的高頻諧波,異常的覆蓋範圍可能有限,且會因負載變化與操作變化而嚴重影響。
麥克風取得聲音訊號就比較困難如果需要高診斷視野會是個很困難的挑戰。去除雜訊不是不可能,但是很可能費用相當昂貴。高診斷視野(六個月)幾乎是不可能的任務!
溫度量測只需要確認是否目標物量測是否會被環境影響,診斷視野通常有限。溫度量測基本上不適用於預知保養,但是卻是檢查電路與保護系統的必要手段。低診斷視野的異常偵測範圍最廣!
檢測手法,巡檢或是全時間測,巡檢的精準度會相對高很多,尤其使設備負載變化與操作變化頻率高,很容易造成錯誤示警或是漏檢,如果頻率低,無法辨識發展性異常的訊號。
預知保養系統即使有無限的精準診斷視野,如果沒有維修能力是注定無法達到預知保養效益的,最糟糕的是無法看到修理的品質,這時候維修能力會不斷的退化,也就是維修品質的惡化。以我們碰過的經驗通常都是看到哪裡修到哪裡,所謂的看得到不見得需要使用系統儀器,即可提升維修品質,但是會被診斷視野所限制。預知保養能成功必須與維修能力配合,當維修品質可以管控時,維修能力才會有進步的動力。Artesis技術是開發用來管控馬達驅動設備出廠的品質,因此等同於無限的診斷視野,Artesis不但分類各別異常種類(分類九種異常),還提供各種異常偏離模型的標準差,並且提供平均設備出廠的平均值(超過一千五百萬筆資料),作為維修品質管控的依據。由於系統還是有不確定性,因為可確定的範疇有限,且每台設備的環境、操作與負載在固定時間內都不同,因此準確性也受限,無法超過80%。超過80%的準確性還是需要有經驗的分析人員。
ESG改善
ESG(Environment, Social and Governance)的改善不是預知保養的主要目標,其實不應該談到的(提到這部份的原因是因為Search engine AI認為應該有幫助,可見AI其實還有許多進步的空間),談到ESG必須有個前提,就是公司做到ESG基本的準則,應該是由公司文化著手,不然預知保養其實沒有幫助,在台灣談到公司文化,通常會被嘲笑,普遍不相信這一套。或許我們需要假設公司文化達到ESG的要求,在這前提下預知保養可以提供額外的好處。環境的部分可以降低能耗,通常單一異常超過六個月的診斷視野會產生1%額外的能耗,除此之外也能降低停工時沒有生產力的能耗,可以延長設備壽命,降低設備重製的碳排與廢棄物的產生。可以改善製程與產品品質,降低碳排與廢棄物的產生,甚至可以降低停工造成排放的罰款。社會責任的部分可以降低部分的工廠災害發生,安全的部分對於ESG一定是正面的,在美國設備振動監控分為保護系統(量測單一物理量,單一固定閾值)與預知保養系統(各別異常種類精準且高診斷視野,複雜閾值系統),保護系統對於預知保養沒實質幫助,預知保養系統對於安全而言不夠全面,但是都對於員工與周遭社區的安全有一定的貢獻,但是安全是一種養成的習慣,不是買了些設備就可以達到。預知保養也可以提供高品質的產品避免產品瑕疵造成的安全問題,或是停工造成的員工額外的工作壓力。聽起來好像對ESG都是正面的,但是診斷視野如果不到三個月,精準度不高的預知保養系統,反而會有反效果,如果業界75%都是預知保養失敗,這證明預知保養對ESG其實是負面的,成功的預知保養對於ESG一定是正面的嗎?其實也未必,預知保養的目的不是都是跟ESG的目的一樣,MTBR增加為降低保養費的主要目標,MTBR的無限增加反而對ESG是負面的,節省保養費用去犧牲設備壽命與能耗。正確的是應該根據公司的價值觀順序進行預知保養與ESG之間的平衡。
對於公司治理也有幫助,假設股東投資維修廠商(這現象還蠻常見的),通常喜歡靠謊報設備狀態進行假維修,如果使用準確性高的預知保養系統可以杜絕這類的活動,並且可以確保設備購買時的品質或是安裝完成的工程品質,並且對於維修訂定出清楚的標準,並且可以清楚了解設備的維修品質,很多狀況是維修只是將設備螺絲鎖緊,應付設備上的加速規,並且宣稱已經更換零件。如果使用準確度低的且經常錯誤示警的預知保養系統反而是火上添油,廠商可樂壞啦,不需要作假,預知保養系統幫廠商製造假的維修機會(這時候就是與ESG對立囉)。廠商的立場永遠是跟業主對立,廠商希望每天都有維修的機會,業主希望永遠不要有維修的機會,因此,診斷視野高且精準的預知保養系統可以成為公正的第三方,不但可以改善業主與廠商的關係,並且可以增加維修品質與製程品質,創造有價值的雙贏。
數據驅動
先說個故事,綠色生產力基金會想要確認Artesis技術的能力,帶我們到大成飼料廠進行驗證(台南某交流道旁邊),經過大約七個設備的測試,我們發現這個廠的廠長可以用手準確的判定設備的好壞,他的診斷視野大約是六個月,剛好足夠避開連鎖反應區,我們很吃驚認為這是特異功能,他也認為我們設備很準確。因此只要用心做,用手就可以達到很好的程度,他的右手勝過台灣市場上超過九成號稱預知保養系統,因此我們不認為數據驅動、IOT、AI為預知保養的必要條件。
如果設備是被馬達驅動,為何不使用現成的馬達設計資料建立模型?如果不是就會有很大的目標系統的不確定性,如果需要時間去建立精準的模型,對於新的設備無法監控失效率最高的Infancy failure。效能大打折扣。
我先聲明,對於一個工廠而言,SCADA遠比預知保養系統重要,SCADA可以與簡單的傳感器配合成為很好的保護系統,但是預知保養是很專門的行業,需要長期的經驗累積與學術的挑戰,如果認為預知保養很直覺很簡單,這是那些75%預知保養失敗的盲點,這也是為何工業4.0列為挑戰項目之一,一定不簡單,早在超過半世紀前NASA就在使用類神經網路了,AI是有極限的,不是所有問題都只需要靠AI解決。
執行轉動設備預知保養最好是由轉動軸採集資料,如果可以從定子採集轉子的振動資料則不會被外界雜訊所干擾。如果不是這樣採集資料,診斷視野很難達到六個月的診斷視野,如果無法達到六個月的診斷視野,則無法達到成功預知保養的標準(加速規量測高頻就是採集由轉動軸傳遞到軸承的訊號,但是已經遞減了許多,因為高頻傳遞的距離有限,遞減的很快)。溫度偵測的效應有限,如果使用解析度很高的熱顯像儀則單價非常昂貴。聲音很容易被環境噪音與雜音干擾,無法達到三個月的診斷視野。如果只使用電流不去量測電壓,在工廠環境下會有很多非線性附載,造成很多電壓雜訊引發的電流雜訊,且電壓與電流經常變化,更不用說操作的變化還有負載的變化。根據美國能源局調查的數據,發展性異常惡化到六個月的診斷視野時,異常通常不會產生超過1%的額外能耗,不是所有製程都能控制在0.1%的變異範圍內,0.1%是因為異常惡化是指數模型,通常要惡化超過六個月的診斷視野才會有較顯著的額外能耗,如果所有傳感器的精準度要求都很高,價格會相當昂貴。這樣花費的效益絕對不會比買一個可以偵測到六個月診斷視野的預知保養系統。最重要的是這無法幫助改善維修品質與維修能力。就像是帶著弓箭去幫忙釣魚,或是帶著釣竿去幫忙打獵。如果目標是要達到六個月的診斷視野,這就會是所謂垃圾輸入造成垃圾輸出的數據分析定理。如果是三個月內的診斷視野成功率會較高,但是要能剔除垃圾訊號。這樣推導可能沒感覺,這樣說好了,曾經跟在NASA研究異常偵測的專家聊過,他很自豪他能利用所謂的SCADA資料加上一些專門的傳感器量測到火箭的3%的變異,0.1%基本上是不可能的,除非很用力地除去影響的因素。這個專家就是Artesis技術的發明人。他很清楚需要掌握精確就要犧牲範圍,也就是剔除輸入的垃圾,無法掌握環境變異,就放棄環境的偵測,選擇使用MCSA,無法掌握電壓變化造成的電流變化,就建立模型去除電壓的變化,無法掌握模型的變化,就將目標系統專注於有設計資料的馬達,無法掌握模型的變化,就將極點設定在原點,無法掌握設備狀態的變化,就分離出異常訊號,無法掌握到連鎖效應的變化,就分離出各別異常的訊號,無法掌握住所有異常的惡化模式,就專注於偵測較高發生機率的發展性異常。現在算一算,其實覆蓋範圍足夠應付所有的發展性異常外加監控系統的輸入與輸出(電壓、電流與電力品質)。因此Artesis可以很輕易的收斂數據,如果不清除垃圾,數據很容易就發散了。AI廠商利用了公司的盲點與資訊不對稱的環境下跟你說AI辦的到,這也是事實,只是沒跟你說要花多少錢,如果是持續的增加花費超過你公司的資本,因為分析發散系統的成本也是發散的,這樣還用談嗎?因此數據分析不是預知保養的核心,預知保養的核心在取得與早期發展性異常有關連的訊號、透過傳感器的選擇、數據的處理,取得沒有雜訊的資料,如果有這些資料分析就很簡單,數據分析時分為前段與後段,前段為取得標準品的大數據,使用AI進行分析建立小數據供預知保養系統使用,後段的分析主要為了進行自動化的分析,這樣應用才能達到AI的目的,取代分析人員。分析平台最好使用可以同時在頻域同時進行定量與定性的分析。FFT不能進行定量分析。如果使用FFT為定量分析平台,這種系統不建議使用。
應用:
製造業:製造業很多是批次生產,也有很多是連續性的批次生產(這屬於連續生產),連續性生產不是以優化設備的維護為重點,而是優化生產,不是提高生產效率。生產效率是實際輸出/標準輸出,很難用於量化預知保養的好處,但是生產是勞力量加上資本量,比較適合用來描述預知保養的好處,主要是使用高診斷視野的預知保養系統將維修工作集中在配合員工與客戶的生活習性的年度大修,避開所有發展性異常引發停工所造成的嚴重後果,並且降低MTTR。如果是批次生產,主要目標才是優化生產線設備的維護,主要是增加維修能力與維修品質,使用無限診斷視野的預知保養輔佐,增加MTBR或是MTBF。
能源業:機載的部分要分別安裝保護系統與預知保養系統,石化業要符合API保護系統規格,由於除了再生能源以外都是連續生產,因此主要是使用高診斷視野的預知保養系統將維修工作集中在配合員工與客戶的生活習性的年度大修,避開所有發展性異常引發停工所造成的嚴重後果,並且降低MTTR。再生能源本來就是VIP,靠禱告發電,由天所主宰,因此同時有連續生產與批次生產的特性,必須看氣象決定應對策略。需要有靈活的應對策略。GE營運與建造的電廠都是採用Artesis系統,使用二代eMCM(anomalert)。核能電廠的水泵因為會破壞加速規,且無法維修,可採用Artesis的技術。
交通運輸業:必須達到零故障,這是安全問題,預知保養不適用,必須升級成可靠性保養,並且設計時必須採用1+N備載,像是飛機供電有三種備載,左右各為備載發動機都失效了還有RAT,引擎1+1備載還不夠,居然171班機還鬧鬼關了兩個發動機的油筏。飛行器為極端的澡盆圖,Infancy failure rate (起飛)與wear out failure rate (下降)的機率較其他時候高很多,也證明了1+1備載的故障率不是故障率的平方。其他較不重要但是會造成旅客不便的地方可以勉強使用預知保養,像是傳輸帶,手扶梯等。但是很多地方有安全顧慮的,像是很長的隧道的通風扇,可以像日本一樣採用Artesis技術。船艦與潛艇上有許多的泵,由於出海的時間較長,因此需要採用診斷視野較高的系統,美國海軍採用Artesis技術,eMCM (MCM)的第一代有NATO code,目前已經推出第三代。
化學業: 化工業是製造與設計建造工廠的,像是Linde、KBR等,這些工廠是化學業,化學業要注意工廠是否有危害物,是否有危險機具,如果有的話,應該以安全為優先,安裝保護系統,如果是批次生產,主要目標才是優化生產線設備的維護,主要是增加維修能力與維修品質,使用無限診斷視野的預知保養輔佐,增加MTBR或是MTBF。如果是連續生產,主要是使用高診斷視野的預知保養系統將維修工作集中在配合員工與客戶的生活習性的年度大修,避開所有發展性異常引發停工所造成的嚴重後果,並且降低MTTR。
半導體業:這個行業比較特殊,設計的時候就需要採用高可靠度策略,工廠內到處都是自燃、腐蝕或是毒性的危害性氣液體管線,因此預知保養也不適用,很多狀況下應該採用可靠度保養。接下來就是造成Defect或是影響良率的因子,由於造成的財損嚴重(高階製程一片超過一萬塊美金、一條生產線每個月生產五萬片,通常是25片一個單位在機台間穿梭著,來來回回幾十遍)因此或許使用可靠度保養比較合適。當你蒐集了所有製程設備的資料與WAT與Failure bin去進行Defect AI分析(尋找Commonality,或是 Machine learning),常常會看到某些Single shot defect,跟所有資料對不起來,這時候或許可以跟設備狀態對應,目前為止沒看過半導體廠有進行設備狀監控,即使有,好像只有對薄膜製成的氧化爐的真空泵進行。其實HVAC空調無塵系統也需要監控,很容易造成局部的顆粒堆積,真空泵應該也要監控,PCW水泵跟Chiller也應該要監控。屋頂上的動態不斷電系統也應該監控。黃光顯影機台上面的不到0.1馬力的風扇也需要監控。半導體最怕的是可靠度問題,跟製程溫度控制有很大的關係,這些溫控系統用很多的泵。
食品業:食品業通常如果可以用SOP去應付停工,其實不需要用到預知保養,預防保養或許就足夠了,需要進行成本分析才能斷定。
水產業: 國外的水產業是預知保養最大的市場,因為如果產生停工的問題,需要賠償客戶,台灣好像不需要賠償,如果不需要賠償就不需要使用預知保養,除非少數維修費很高的設備。廢水的部分如果停工造成的罰則不高,也不太需要使用預知保養。沉水泵不適合安裝加速規,可採用Artesis技術。
水泥產業:國外第二大的預知保養市場,目前台灣因為產能過剩(連續性生產稼動率低時等同批次生產),目前不太需要使用預知保養儀器,如果產能稼動率恢復,則需要使用預知保養避免停工發生。目前大部分都採用直流電馬達,但是直流電馬達可靠度低,目前正在轉換使用感應馬達。
鋼鐵產業:現場的狀況惡劣,安裝的加速規的壽命都不長,可以採用Artesis的技術,但是由於很多都不是運行在穩態,因此會有許多挑戰。處於穩態的如運輸系統,當單一馬達故障時,會刮損鋼板,造成嚴重的損失。很多泵與鼓風機或是壓縮機都可以使用Artesis系統。
紡織業:紡織業的壓縮機可以使用精準高診斷視野的預知保養系統避免停工事件。
紙業與橡膠業:可以使用精準高診斷視野的預知保養系統避免停工事件。
可靠度保養
這是由NASA所發起的,通常用於航太業,根據NASA 2000的文件,主要是靈活應用預知保養(沒影響性能不修護)、預防保養(不管性能如何,定期修護)與被動式保養(影響性能才修)。但是可靠度保養(可靠度中心保養)會對每次性能降低進行根因調查,且每次提出改善計畫與策略,進行設計的改善或備載的增加,達到0事故,也就是對於突發性異常與間隔性異常也進行防護(超出預知保養範疇)。從文件上的保養等級表(如下表),可以清楚的了解各種保養的應用。
補充一下DOE的O&M guide提到預防保養很適合非連續性運行的設備,前提是維修能力充足,因此批次設備如果維修能力不足,最好還是安裝預知保養系統。
Artesis 技術
Artesis技術源自NASA異常研究團隊,結合了GE的Bently nevada、電廠與馬達生產的經驗。改良MCSA(Motor current signature analysis)馬達電流頻譜與ESA(Electric signal analysis)技術,目前已經達到MCSA四代ESA三代、可以精準的自動診斷分析80%的發展性異常。(會隨設備的複雜度而降低)
主要用於三相感應馬達驅動設備。量測三相電流與電壓,每60~90秒取樣一次,每次六秒,取樣時如果電流變化超過15%將刪除,直到取樣到變化小於15%的六秒電流數據。可監控負載端包含但不限於泵、傳送帶、壓縮機、真空機、風扇等。
建立模型時以馬達設計資料為模型建立基礎:輸入馬達額定電流、電壓、轉速、頻率與連接模式(Delta wye configuration),如馬達為中高壓,用開口式比流器10A/100mA勾掛既有量測型比流器(非保護型),既有比流器精度要求為Class 1,Class 0.5會較為精確。
量測機械發展性異常:零件鬆動、基座鬆動、不平衡、不對心、傳動系統(軸、耦合器、皮帶、齒輪等)、軸承、轉子、定子。各別異常種類提供獨立的異常訊號趨勢圖。
線路量測:定子、端子鬆動、絕緣、線路品質、電容器等,分類為外部線路與馬達內部線路,有個別的訊號趨勢圖。
(除了趨勢圖為直接屏幕截圖,由於軟體沒有繁體中文,因此我們都會定期幫客戶整理資料順便翻譯)
順便監測電力品質: 電流電壓值、平衡。功率因子、實功率、虛功率,總電壓諧波,與單獨單數的1~11諧波。各別項目提供各別趨勢圖。
診斷品質:針對發展性異常的異常訊號的準確度高,診斷視野可監控設備出廠品質,高診斷視野時準確性高。
數據處理:採用ESA技術,有效去除環境振動雜訊,建立等同線路與轉動運動的合併模型(理論模型非線性模型與線性模型),與單獨等同線路模型,分離異常訊號。
數據分析:主要為頻域同時定量與定性分析平台RPSD(Residual power spectral density),採用Neural network(AI)快速建立系統鑑別(System identification)模型,模型建立時間為七分鐘,數據分析採用回歸分析Regression。
ISO20958內容所指的模型式電流頻譜分析技術就是Artesis的技術,Reference 內的Ahmet Duyar 就是他們的參考文獻,還描述有效的去除雜訊,效果好,使用簡易,可取代昂貴的儀器,價格便宜,使得預知保養技術可用於非關線性的設備,意思就是很適合用於批次生產。
注意到綠色的包絡線為偏離線性模型2.5個標準差,紅色的包絡線為8個標準差,轉子的惡化速度較快,且很容易造成連鎖效應,因此應該避免超過6個標準差。
小心詐騙廠商:
常見詐騙用語:
"系統可以偵測故障(Failure)",預知保養系統應該是偵測異常(Fault),請問偵測故障需要額外購買系統嗎?都不運轉了還要系統偵測?預知保養自從1941年到現在都是偵測設備的狀態,偵測狀態大部分是時間偵測到的應該都是好的狀態,如果都是不好的狀態代表著維修品質有問題,偶爾10%左右機率會偵測到發展性異常(Incipient Fault)也就是大約是70%的所有異常,30%偵測不到或是即使偵測到也沒用的異常,如果是發展性異常,通常不應該等到設備故障前幾個禮拜才去維修,因為很可能會觸發30%偵測不到的異常,造成無法避免的突發性異常造成的故障而導致停工,或是造成設備嚴重老化,應該是在異常連鎖效應發生前進行維修,因此在異常發生初期就應該排程在最佳化的時機維修。因此預知保養應該預期偵測的是設備狀態,但是因為只能偵測到發展性異常,因此為了簡化溝通就稱為偵測異常。偵測故障的是所謂的保護系統,這些系統在設計時就沒有預知保養的功能。
"系統有效降低稼動率"。稼動率的公式是不去計算非計畫性停工的,因此如果系統造成半年的停工反而稼動率增加,因為剩下來的半年要全力趕貨。
"系統有效增加生產效率",生產效率的公式=實際生產量/標準生產量,因此很可能錯誤示警一堆,造成每天都在花一堆沒意義的資源關注著生產線,當然生產量會高阿,但是可能花了五倍的資源!我們本來也不清楚,早期的文章中有造成誤導,在這裡致歉!
"預知保養系統一定要用機械學習與AI",預知保養是1941年開始的,80年代用於生產,且已經有25%的預知保養成功的公司,現在還停留在25%的成功率,請問AI與機械學習有用嗎?
"預知保養能避免過度維修,只在必要時進行維修,減少零件更換和維修工時。",意思是不要修太好,該換零件的時候不要換!他們的系統無法有效的最佳化維修品質,無法有效的降低維修的次數。
"預知保養馬上用馬上有效果"這是錯誤的,預知保養重點在保養,預知只是個形容詞,如果維修保養的能力與品質不佳,即使看得到異常或是設備狀態也無法有效的幫助,預知保養只是協助量化設備狀態,幫助了解並且量化目前的維修能力與品質,如果不提升維修能力,也只是眼睜睜的看著設備造成損害,還不如看不到。對於連續生產則是提供額外的行銷策略,低價競爭的能力驟然增加,這都不會是幾年內看得到的,至少也要五年以上、甚至十年才會理會到所有預知保養帶來的利益。對於目前嚴峻的關稅,如果是大宗連續性生產的產品,碰到韓國對手最好立即在不可抗力的環境下立即啟動退場機制,韓國大企業2000年初就重視預知保養,很有競爭力的韓鋼就是Artesis的代理,目前Artesis eMCM也是在韓國代工製造。
"使用Markov chain Machine learning或neuronetworks 直接解析異常大數據"這一定是騙人的,70%的發展性異常有未來狀態與目前狀態產生Feedback loop,Close loop的特性,因此根本不適用,準確性很低,只適用於剩餘的30%突發性與間接性異常較為準確,並且需要龐大的數據才會準確。Markov chain主要是用一個模型描述目前與未來的狀態,如果未來與目前狀態有關連性,這模型會是個隨機動態模型,收斂出來的數據與事實不符,明顯的衝突,當負載變化與操作變化影響單一動態模型時,會無法收斂。這時候如果用白箱模型像是迴歸曲線會很簡單與精準。如果用Markov chain用好的狀態去估算發展性異常反而是較好的方式,但是會被傳感器的精準度所限制,很難達到診斷視野六個月,且計算的數據非常龐大。假設使用很多種傳感器蒐集數據,當設備部件惡化到連鎖反應區,這時使用Markov Chain去預測會比較準確,但是在診斷視野六個月前(設備出廠~6個月診斷視野),或是診斷視野一個月後(一個月診斷視野~設備故障或停工),這時候用迴歸曲線會準確很多,診斷視野一個月後適合用於批次生產保護系統或是避免停工事件,診斷視野六個月前適用於所有的預知保養應用,使用Markov Chain對於預知保養的效果遠不及使用精準無雜訊的傳感器與迴歸曲線。更不用說如果使用設備好的狀態所需要用大量不同的精準傳感器群,這會造成龐大的無意義費用,而迴歸曲線只需要用如Artesis等級的精準靈敏無雜訊的類傳感器。補充一下,如果能使用Markov Chain去準確預測失效,理論上肯定可以預測地振囉?地球上有超多傳感器量測地震的喔,包含量測太陽的太陽風,地球的自然頻率、地震儀、大氣離子、電漿等,當Markov chain可以用於地震預測時才代表著Markov Chain對於預知保養有用。
當你看完了這些資訊,如果還相信0故障這種詐騙,那我們很確定的救不了你。要隨時提高警覺,你們的公司安全文化需要大幅改善。
2025/10/25
Google AI overview:
預知保養(Predictive Maintenance, PdM)是一種以數據為基礎的設備維護方式,透過感測器監測設備的即時運轉狀態(如振動、溫度、聲音、電流等),並利用數據分析預測設備何時可能發生故障,以便在故障發生前安排維護,從而避免非預期停機與延長設備命。
預知保養很多時候跟數據一點關係都沒有,跟感測器也沒有一定的關係。大成飼料廠的廠長,不知道退休沒有,他用手去感測的診斷視野高達六個月,準確度80%,比業界的傳感器或是數據分析強許多。預測何時可能發生故障?預知保養的預知是在拆開設備前就知道的預知,跟預測何時故障無關,故障發生前安排維護不就是廢話?避免非預期停機可能是唯一正確的,延長壽命不見得,如果你用三個月診斷視野(就是三個月不會有錯誤示警)你的設備壽命反而很可能縮短,錯誤示警會導致你增加人為疏失的風險,且三個月診斷視野,會給你一個設備狀態很好的假象,讓設備處於異常連鎖反應的狀態!
預知保養的關鍵要素
數據收集:: 透過感測器持續收集設備的各種運行參數。
剛剛提到數據收集基本上不是預保養關鍵要素,預知保養是1941年的名詞,那時候是手動紀錄!
數據分析:: 利用軟體和演算法(如機器學習)分析這些數據,偵測異常並預測故障時間。
蒐集到的數據只能找到最高相關性的機率,還需要驗證!驗證過後要確定異常失效的模型!
預測性維護:: 在設備真正損壞前,安排維護工作,這能避免過早維護浪費,也能預防因設備故障造成的意外損失。
當然在損壞前,廢話充版面,過早維護浪費?很可能是錯誤示警,所有都是浪費吧?看後面那句就知道了,如果使用的是保護系統而不是預知保養系統,這兩種系統的設計觀念是背道而馳的,保護系統重視零漏檢率與運作範疇、犧牲錯誤示警、犧牲精準診斷視野,預知保養重視的是零錯誤示警、精準的長診斷視野,犧牲運作範疇,但是在範疇內零漏檢率。功能強的預知保養系統不見得能作為保護系統,很安全的保護系統往往沒有預知保養的功能!至少目前沒有!
預知保養的優點
減少非計劃性停機:
預測性地安排維修,可大幅降低設備在生產過程中突然停擺的機率。
前提是使用預知保養系統而不是保護系統,且能大幅降低設備停工時間,預測性低安排維修能省的資源有限!集中維修能省的才多!除非是批次生產!
延長設備壽命:
早期發現並處理問題,避免小故障演變成重大損壞,有助於延長設備使用年限。
之前才提到的避免過早維護浪費,現在馬上就推翻囉,要早期發現並處理問題,小故障如果是發展性異常一定會越來越嚴重,重點是要提到異常的連鎖反應,要避免設備惡化到連鎖反應才能延長設備使用年限!
最佳化維護成本:
避免因設備損壞而產生的額外維修和生產損失,並能更精準地規劃維護週期,減少不必要的維護開支。
預知保養是要根據設備狀態安排維修,如果是週期性的就是防護性維修,不知道怎麼會說到其他的保養思維?如果診斷視野低又不準確,不可能減少維護開支!
預知保養的應用
傳統設備:
適用於馬達、齒輪、軸承等轉動設備,這些設備是預知保養的主要應用對象。
主要應用對象?應該是異常發生率較高的設備吧?而且限於發展性異常?如果要估算失效時間的話!
先進系統:
隨著電腦算力的提升,預知保養已能應用於更複雜的系統,甚至整合AI 技術,例如分析紅外線熱影像來偵測異常。
總之,預知保養就像是在設備出現重大問題前就透過「健康檢查」提前發現警訊,從而能提早做出對策,這比傳統的定期保養或事後維修更有效率和經濟。
健康檢查?不是巡檢喔!巡檢的錯誤示警很高,是保護系統在用的應該要全時間測!如果預保護系統做預知保養,會比定期或事後維修損失更多的資源,因此根據歐美的調查,生產工業的預知保養失敗率高達75%。台灣的轉動設備廠商愛死Google AI 讓他們賺大錢!
Google AI 蒐集了市場所有的觀點,代表著75%,因此看Google AI的進行預知保養的失敗率會超過75%,可能是100%!
Bing AI 的內容相對很謹慎,少可是準確很多!不像Copilot,結果沒什麼可以挑剔的,Copilot幾乎沒有是對的,因此如果是要看大家都在想什麼就用Google AI,專業性比較高的還是用Bing AI copilot 如下:
預知保養(Predictive maintenance)是一種維護策略,旨在通過數據分析來預測設備何時會故障。其主要目的是在設備發生故障之前進行維護,以避免停機和損壞。預知保養通常包括以下幾個步驟:
透過感測器和分析軟體收集設備狀態數據。
根據數據進行定量分析,預測設備的維護需求。
在設備出現初期異常時進行系統性檢測和修正。
這種方法不僅能提高設備的運行效率,還能節省維護成本。
沒有好挑剔的,還特別提到出期異常,進行系統性檢測!驗證後再維修!還提到定量分析!