(浙江浙能鎮海發(fā)電有限責任公司,浙江 寧波 315208) 崔振武,丁永君
崔振武(1967-)男,浙江寧波人,技師,從事熱工自動(dòng)化工作。
摘要:本文對鎮海電廠(chǎng)分散控制系統(簡(jiǎn)稱(chēng)DCS)運行中發(fā)生的DCS軟、硬件故障進(jìn)行了歸類(lèi)分析,交流了這些故障的處理方法。為減少因控制系統故障引起的機組跳閘次數,本文從提高熱工自動(dòng)化系統的可靠性著(zhù)手,提出了一些防范措施,供同行參考。
關(guān)鍵詞:DCS;故障;分析;技術(shù)措施
Abstract: The paper analyzes in detail the failures which have occurred in the DCS of Zhenhai Power Plant, which mainly includes the primary controller and module failures, server failures, network failures of software control and other factors, and present the treatment options to the failures. For reliability of the DCS, we also give some technical measures to prevent similar accidents.
Key words: DCS; fault; analysis; technical measures
1 概述
鎮海電廠(chǎng)#3~#6 215MW機組從1998年開(kāi)始進(jìn)行自動(dòng)化改造,選用國產(chǎn)的DCS系統,2007年起各臺機組陸續進(jìn)行升級改造,目前已完成三臺機組的升級工作。鎮海電廠(chǎng)DCS的網(wǎng)絡(luò )結構由上到下分為監控網(wǎng)絡(luò )、系統網(wǎng)絡(luò )和控制網(wǎng)絡(luò )三個(gè)層次,如圖1所示。其中監控網(wǎng)絡(luò )中的工程師站、操作員站、高級計算站等和系統網(wǎng)絡(luò )中的現場(chǎng)控制站通過(guò)系統服務(wù)器實(shí)現互連;控制網(wǎng)絡(luò )由Prof iBus-DP構成,實(shí)現現場(chǎng)控制站與過(guò)程I/O單元的通訊。該系統可由多組服務(wù)器組成,由此可將系統劃分為多個(gè)域。鎮海電廠(chǎng)215MW機組的DCS均劃分為兩個(gè)域,即主機域和輔機域。每個(gè)域由獨立的服務(wù)器、系統網(wǎng)絡(luò )和多個(gè)現場(chǎng)控制站組成,域內的數據單獨組態(tài)和管理,完成相對獨立的采集和控制功能;兩個(gè)域共享監控網(wǎng)絡(luò )和工程師站,操作員站等則通過(guò)域名登錄到不同的域進(jìn)行操作。
圖1 鎮電DCS網(wǎng)絡(luò )結構圖
鎮海電廠(chǎng)DCS系統在升級改造前故障率相對較高,經(jīng)過(guò)對歷年來(lái)故障統計的分析,主要故障有主控制器故障、I/O模件故障、服務(wù)器故障、控制網(wǎng)絡(luò )故障和其它因素等引起,以2006年度為例,#3~#6機組共發(fā)生DCS相關(guān)故障39起,其中主控制器故障13起,模件故障8起,占故障總數的53.8%,因此控制系統故障是熱工系統故障的主要因素,其分類(lèi)統計情況,如圖2所示。
圖2 控制系統故障的分類(lèi)統計情況
2 DCS故障現象及其分析
根據上述DCS系統所發(fā)生的主要故障發(fā)生類(lèi)型,下面對鎮海電廠(chǎng)近年來(lái)應用DCS過(guò)程中比較典型的軟、硬件故障進(jìn)行分析。
2.1 主控制器故障
主控制器故障在鎮海電廠(chǎng)DCS故障中占有較大比例,而且引起主控制器故障的原因也各不相同,部分故障在單純復位或重新啟動(dòng)后能夠恢復正常,部分故障則對機組運行產(chǎn)生了嚴重影響。
(1)異??刂破鞑荒茏詣?dòng)切換
2009年8月31日,現場(chǎng)檢查時(shí)發(fā)現#5機#11I/O站和#26I/O站主控器故障,均為A主控故障燈閃亮,雙機冗余通訊燈不亮,B主控備用。從工程師站上查看,主控制器顯示A主控為主,B主控備用,狀態(tài)顯示正常;查閱DCS歷史記錄,無(wú)相關(guān)故障記錄;相關(guān)I/O站內各參數采集、控制設備動(dòng)作均正常。經(jīng)分析,認為主控制器當前仍正常運行,但雙機冗余的同步性存在問(wèn)題,如果這時(shí)發(fā)生主控切換將會(huì )出現較大擾動(dòng)。而在這之前異??刂破鞑荒苋哂嗲袚Q故障已發(fā)生過(guò)多次,如#3爐DCS系統曾發(fā)生一次風(fēng)壓自動(dòng)調節偏差大于360Pa時(shí),運行人員手動(dòng)干預操作送風(fēng)機勺管調節執行機構無(wú)效,急忙至就地進(jìn)行手操。熱工通過(guò)工程師站,檢查對應的#12I/O站,發(fā)現A主控離線(xiàn),B主控備用,在I/O站上查看A主控系統燈1和系統燈2均不亮,故障燈未亮,表明該主控已失去與系統網(wǎng)的數據交流,但主控未實(shí)現冗余切換。另#3爐#23I/O站也曾發(fā)生過(guò)A主控故障離線(xiàn),故障燈與雙機冗余數據交換燈均不亮,主控制器未自動(dòng)切換。這些故障案例表明,MACS系統主控制器冗余切換功能不完善,某種故障狀態(tài)下該功能失效。
(2)散熱風(fēng)扇故障導致主控制器故障
主控制器內的散熱風(fēng)扇如果故障,將使主控制器故障率大大增加。自2005年以來(lái),鎮海電廠(chǎng)統計的因主控制器內散熱風(fēng)扇異常導致的主控制器故障共計13次(這類(lèi)故障的主控制器內散熱風(fēng)扇均有一個(gè)或幾個(gè)運轉不正?;蛲耆贿\轉,一般在更換散熱風(fēng)扇后仍能恢復正常運行)。
(3)電子室環(huán)境對主控制器的影響
電子室內的溫、濕度對主控制器有一定影響,特別對于需要強制散熱的主控制器影響更大。溫、濕度過(guò)高不一定使主控制器立即發(fā)生故障,但長(cháng)期處于這種環(huán)境下必定會(huì )使主控制器故障率增高,而且從我們的統計來(lái)看,濕度的影響比溫度的影響更大。
根據2005年以來(lái)的統計,每年3~6月份的主控制器故障次數約占到全年總數的1/3到一半多,這段時(shí)期正值南方濕熱的雨季,中央空調往往會(huì )補充大量的新風(fēng),電子室內濕度會(huì )有所增大。這種情況下發(fā)生的主控制器異常,一般均通過(guò)復位或重新啟動(dòng)后可以恢復,只有個(gè)別需要更換新的主控制器。
2.2 模件故障
與主控制器故障相比,模件故障相對容易解決,一般通過(guò)模件復位和更換模件就能恢復正常。但有些故障由于受其它因素影響,比較特別。
(1)外部干擾引起I/O模件離線(xiàn)
2007年1月,#5機組按計劃轉入小修。停機過(guò)程中,運行人員投微油點(diǎn)火裝置助燃,不久發(fā)生用于微油燃燒器壁溫測量的熱電偶測量模件故障,微油燃燒器壁溫顯示無(wú)效。熱工人員對模件復位后恢復正常。之后在小修和開(kāi)機過(guò)程中多次發(fā)生該模件故障,均能夠通過(guò)復位得以解決,期間也更換過(guò)模件,但故障依舊。機組復役后該模件運行穩定,直至3月4日再次發(fā)生該模件故障。經(jīng)現場(chǎng)檢查,接入該模件的二支熱電偶元件安裝位置與微油點(diǎn)火槍距離過(guò)近,當微油點(diǎn)火槍點(diǎn)火時(shí)高能電磁干擾通過(guò)電纜串入模件中,造成模件離線(xiàn),并在試驗后得到確認。在調整熱電偶與點(diǎn)火槍的安裝位置后,此故障排除。
(2)單一通道的故障
模件故障有硬性和軟性二種,需通過(guò)更換模件來(lái)解決的我們稱(chēng)之為硬性故障,而通過(guò)對模件進(jìn)行復位可以解決的故障,我們稱(chēng)之為軟故障,這種故障也有可能只反映在其中的某一個(gè)通道上,可以通過(guò)實(shí)際測量來(lái)判定。如2007年1月15日,#5機化補水調節閥不能開(kāi)啟,無(wú)論DCS中給出的指令是多少,現場(chǎng)測量電流值始終為4mA。之后對該模件進(jìn)行復位后控制恢復正常。另有一次#4爐定排疏水電動(dòng)門(mén)開(kāi)啟且無(wú)法關(guān)閉?,F場(chǎng)檢查對應的開(kāi)關(guān)量輸出模件,第一通道輸出為“1”(對應該電動(dòng)門(mén)的開(kāi)指令),而DCS中查看該通道的狀態(tài)為“0”,更換模件無(wú)效,對主控制器進(jìn)行下裝后控制恢復正常。
2.3 服務(wù)器故障
鎮海電廠(chǎng)DCS的監控網(wǎng)絡(luò )和系統網(wǎng)絡(luò )通過(guò)服務(wù)器實(shí)現互連,因此服務(wù)器故障將使處在上層監控網(wǎng)絡(luò )操作員站失去對下層系統網(wǎng)絡(luò )中的運行參數和控制設備的監視和控制,給機組的安全穩定運行造成嚴重的影響。2007年6月11日,#6機主機域主服務(wù)器故障,服務(wù)器未能自動(dòng)切換,所有操作站上參數失效,控制失靈,運行人員依靠DEH和后備儀表維持機組運行。熱工人員在手動(dòng)切換到B服務(wù)器后DCS恢復運行,但從系統狀態(tài)圖中查看A服務(wù)器連接系統網(wǎng)的下層網(wǎng)絡(luò )仍然處于故障狀態(tài),本地網(wǎng)絡(luò )沒(méi)有連接,重新啟動(dòng)服務(wù)器后網(wǎng)絡(luò )連接恢復。之后#6機又多次發(fā)生同類(lèi)故障,檢查服務(wù)器主機及網(wǎng)卡均未發(fā)現異常,也更換過(guò)服務(wù)器,但至今原因不明。目前采取定期切換、重啟服務(wù)器的方法,有一定效果。
2.4 控制網(wǎng)絡(luò )故障
一般來(lái)說(shuō),DCS網(wǎng)絡(luò )故障多發(fā)生在網(wǎng)絡(luò )設備如交換機、光端機的故障,往往在更換硬件后故障現象能得到解決。2007年1月29日,#3機一臺交換機故障導致監控網(wǎng)B網(wǎng)離線(xiàn);之前#3機一臺交換機死機,導致系統網(wǎng)A網(wǎng)離線(xiàn); #5機一臺光端機故障,導致#30站遠程I/O站離線(xiàn);這些故障均在復位或更換網(wǎng)絡(luò )設備后恢復正常。
由于DCS的控制網(wǎng)絡(luò )連接主控制器和過(guò)程I/O模件,控制網(wǎng)絡(luò )故障對系統的影響范圍較大,往往是一段鏈路中的多個(gè)模件同時(shí)離線(xiàn),其原因具有多樣性:
(1)網(wǎng)線(xiàn)連接配件故障
2007年2月5日,#3機組正常運行,#20I/O站內多個(gè)參數顯示無(wú)效,控制設備操作失靈?,F場(chǎng)檢查,#20I/O站A主控運行,B主控備用,A列模件運行正常,B列、C列模件均離線(xiàn)。在做好必要的安全措施后切換主控制器,則B列、C列模件大部分恢復運行,個(gè)別仍有間歇性離線(xiàn),而A列模件則都出現間歇性離線(xiàn),間隔時(shí)間在幾秒到幾分鐘不等。查明的原因是B主控控制網(wǎng)的DP線(xiàn)插頭故障(DP插頭內部配有終端電阻,是否使用可選擇),導致鏈路中斷或阻抗不匹配,更換DP插頭后恢復正常。之后類(lèi)似故障#3機還發(fā)生過(guò)兩次,均在更換DP頭后得以恢復,于是在機組檢修期間,我們對所有同類(lèi)型的DP插頭進(jìn)行了更換。
(2)DP總線(xiàn)“虛接”
鎮海電廠(chǎng)DCS遠程I/O站的控制網(wǎng)絡(luò )采用底座串接的方式擴展I/O模塊,這種連接方式靈活度高,便于分散連接,但同時(shí)存在DP通信的故障點(diǎn)多,通信總線(xiàn)的特性阻抗不穩定等缺點(diǎn)。
2006年4月,#4機組發(fā)電機溫度測量遠程柜自第二個(gè)模塊以下全部離線(xiàn),在按壓或觸碰這幾個(gè)模件后則能夠恢復,之后多次發(fā)生類(lèi)似故障,基本以同樣方式解決。經(jīng)分析,這類(lèi)故障原因是因為垂直安裝的模塊底座受機械振動(dòng)引起觸點(diǎn)松動(dòng)和現場(chǎng)環(huán)境不佳如濕熱等將引起觸點(diǎn)氧化,會(huì )造成DP總線(xiàn)的“虛接”,特性阻抗不匹配。這類(lèi)故障在安裝于現場(chǎng)的遠程I/O柜發(fā)生較多,而安裝于電子室內的I/O站則基本未發(fā)生。#4機發(fā)電機溫度柜在機組檢修時(shí)更換了所有底座并重新安裝后,這類(lèi)情況有了較大好轉。
(3)故障模件對DP總線(xiàn)的影響
一段DP總線(xiàn)上幾個(gè)模件的通訊接口故障時(shí),可能會(huì )引起一段DP鏈路上的所有模塊離線(xiàn)。如#4機給泵溫度遠程I/O柜內曾發(fā)生多個(gè)模件頻繁離線(xiàn),離線(xiàn)間隔時(shí)間短則幾秒鐘,長(cháng)則幾分鐘甚至更長(cháng),DP總線(xiàn)無(wú)虛接現象。采取下裝主控、更換模件等手段均無(wú)效。在插拔模件的過(guò)程中,當拔到某一個(gè)模件則DP鏈路恢復正常,再插回則又有模件開(kāi)始離線(xiàn),因此判斷是模件故障引起整個(gè)一段DP鏈路上模件離線(xiàn)。通過(guò)逐一排除的方法共查到有一塊模件故障,事后拆開(kāi)模件肉眼能看到有電容元件不同程度爆裂的跡象。
模件故障影響一段DP總線(xiàn)上模件離線(xiàn)的故障點(diǎn)較難判斷,離線(xiàn)的不一定是故障模件,故障模件也不一定會(huì )離線(xiàn),但沒(méi)有好的測試手段,只能用逐一排除法來(lái)進(jìn)行故障點(diǎn)的判斷,在機組運行時(shí)有一定的難度和風(fēng)險。但這種總線(xiàn)故障在只有一個(gè)模件故障時(shí)不會(huì )出現,而且模件內的故障點(diǎn)能用肉眼觀(guān)察到,因此機組檢修時(shí)可以對模件拆開(kāi)檢查,能起到很好的預防效果。
2.5 其它因素引起的故障
(1)GPS時(shí)鐘對DCS的影響
鎮海電廠(chǎng)DCS的系統時(shí)鐘是由服務(wù)器通過(guò)與GPS電子鐘通訊進(jìn)行校時(shí)的。2006年9月17日,#4機組正常運行時(shí)發(fā)生DCS操作員站均離線(xiàn)退出運行,主機域和輔機域兩個(gè)冗余服務(wù)器中的主服務(wù)器均離線(xiàn)退出運行,工程師站離線(xiàn)退出運行,主機域和輔機域的冗余服務(wù)器自動(dòng)切換成功。正在現場(chǎng)的熱工人員立即啟動(dòng)工程師站,運行人員通過(guò)工程師站維持機組運行。經(jīng)現場(chǎng)分析,由于GPS電子鐘故障,DCS系統時(shí)鐘被錯誤地校成了2178年,而因此造成操作員站離線(xiàn)則應是系統程序的bug。在恢復系統時(shí)鐘后,逐一啟動(dòng)操作員站和服務(wù)器,DCS恢復正常運行。
(2)控制系統邏輯不完善
控制邏輯組態(tài)的不完善,很難通過(guò)正常的試驗發(fā)現,正常運行中也不會(huì )有問(wèn)題,但在某種特定條件下會(huì )影響到機組安全穩定運行,甚至聯(lián)鎖保護誤動(dòng)。如#5機組215MW滿(mǎn)負荷運行,甲給水泵運行,乙給水泵備用時(shí),甲泵前置泵流量超限報警(超量程上限800t/h),隨后甲泵再循環(huán)調節閥自動(dòng)開(kāi)啟,給泵出口壓力低報警,汽包水位低至-120mm。經(jīng)檢查設主給水最大設計流量為680t/h,前置泵流量變送器量程設置為0~800t/h。DCS組態(tài)中,前置泵流量的判斷使用“幅值報警”模塊來(lái)實(shí)現,該模塊低報警、低低報警值均設置為200,高報警、高高報警值則均設置為800,當前置泵流量前置泵流量小于200t/h(給水泵小流量保護)或超過(guò)800t/h時(shí),均聯(lián)鎖開(kāi)啟給泵再循環(huán)調節閥。這種組態(tài)沒(méi)有考慮極端情況,后改為“比較器”模塊,只發(fā)出單一判斷信號。
(3)維護措施不當
不適當地使用超級權限,可能會(huì )導致控制器邏輯運算錯誤。如#3機組曾因RB邏輯不完善,熱工技術(shù)人員使用超級用戶(hù)權限在線(xiàn)修改定時(shí)器類(lèi)型時(shí),定時(shí)器輸出變位而觸發(fā)機組RB保護動(dòng)作。實(shí)際上超級用戶(hù)權限是DCS廠(chǎng)家限制使用的權限,有其不確定性,在安全措施不完善的情況下極易引發(fā)事故,因此其使用要非常慎重。
3 提高DCS可靠性的技術(shù)措施
隨著(zhù)DCS在火電廠(chǎng)中的廣泛應用,其在機組安全穩定運行中所占據的主導地位愈加突出。由于DCS設備軟硬件的可靠性、控制邏輯的完善和合理性、熱工人員維護和檢修水平等諸多因素的影響,使機組誤跳閘事件仍時(shí)有發(fā)生。因此進(jìn)行有效的技術(shù)管理和正確的檢修維護,保持火電機組DCS的穩定、可靠運行也就日漸成為熱工人員日常管理、維護的重點(diǎn)。為此筆者結合上述案例分析,從提高控制系統可靠性著(zhù)手,提出一些防范措施供檢修維護中參考:
(1)對DCS設備和檢修維護實(shí)行全過(guò)程管理,盡早發(fā)現缺陷并及時(shí)處理。完善DCS自診斷和故障報警功能,對DCS運行狀況的實(shí)時(shí)監控不僅要監視主控制器的狀態(tài),還要監視主控制器網(wǎng)絡(luò )的狀態(tài)。
(2)制定合理的定期維護制度,詳細規定檢查維護的內容、方法和周期,并對檢查結果進(jìn)行分析,采取針對性的預防措施。鎮海電廠(chǎng)自從試行這項制度以來(lái),有效地控制了DCS故障的發(fā)生。
(3)制訂DCS應急預案和典型故障處理方案,防止因維護不當引起的DCS故障。
(4)選用品質(zhì)較好的備品配件,如主控制器的散熱風(fēng)扇、DP插頭等,對于易損部件實(shí)行定期更換。
(5)對電子室的環(huán)境溫度進(jìn)行遠程監測,接入DCS顯示,實(shí)時(shí)掌握電子室環(huán)境溫度的變化。使用中央空調的電子室還應注意濕度的控制,如有必要應增裝獨立的空調或除濕裝置。
(6)檢修時(shí)對模件電路板外觀(guān)進(jìn)行檢查,能起到很好的預防效果。
(7)深入了解DCS軟件性能,采取合理的組態(tài)方法防止極端工況下的誤動(dòng);禁止使用“超級用戶(hù)”等不規范的手段進(jìn)行軟件修改。
其他作者:丁永君(1968-),男,浙江寧波人,高級工程師,從事熱工自動(dòng)化工作。
參考文獻:
[1] 孫長(cháng)生. 浙江省火電廠(chǎng)2007年熱控系統考核故障原因分析及技術(shù)措施[J].北京: 中國電力, 2008, 5.
[2] MACSTM組態(tài)手冊[M].
摘自《自動(dòng)化博覽》2010年第八期