摘要:崖城氣田南山基地的ESD系統是基于Rockwell Allen-Bradley PLC5來(lái)實(shí)現,該系統的可靠性和穩定性密切關(guān)系到南山基地的安全生產(chǎn)。近來(lái)南山ESD系統多次出現故障,該故障直接導致全廠(chǎng)區緊急關(guān)停,對安全生產(chǎn)造成了一定的影響。通過(guò)全面收集故障現象,深入分析故障現象,最終找到了原因,在不停輸的情況下,在線(xiàn)更換卡件,解決了該故障。關(guān)鍵詞:PLC;遠程I/O 鏈路;ASB 模塊;不停輸
1 背景介紹
中海油崖城氣田是目前國內最大的海上氣田,三亞南山基地是其陸地油氣處理基地,負責把海上送下來(lái)的油氣進(jìn)行處理和銷(xiāo)售。整個(gè)基地處理高度集成,自動(dòng)化控制程度很高。自動(dòng)化控制系統由集散控制系統(DCS),緊急關(guān)斷系統(ESD)火警系統組成。ESD系統是氣田緊急關(guān)斷系統(Emergency shut down),也是設施保護系統,是基地油氣處理設施的重要組成部分,對于氣田的安全生產(chǎn)起到至關(guān)重要的作用。按照安全獨立原則要求,獨立于DCS集散控制系統,其安全級別高于DCS。
2010年初,南山發(fā)生生產(chǎn)關(guān)斷和緊急關(guān)斷。維修儀表人員前往中控室,上線(xiàn)ESD系統PLC 程序,發(fā)現在程序中輸入點(diǎn)從I:71/00---I:71/17;I:72/00---I:72/17;I:75/00(生產(chǎn)報警),I:75/01(撤離),I:75/02(緊急集合),I:75/03(緊急關(guān)停),---I:75/17 共3組數據48個(gè)開(kāi)關(guān)輸入點(diǎn)的值大部分為0,如一些液位開(kāi)關(guān)信號,來(lái)自倉庫火警系統關(guān)停信號。該3組數據均來(lái)自其對應的所有3塊數字輸入模塊,故產(chǎn)生了誤關(guān)停。根據生產(chǎn)恢復的需要,儀表在ESD系統PLC程序中將相關(guān)的開(kāi)關(guān)量輸入點(diǎn)進(jìn)行了邏輯強制,操作并對相關(guān)模擬量的輸入點(diǎn)在旁通操作站進(jìn)行了旁通,按照程序進(jìn)行了記錄。至此,生產(chǎn)關(guān)斷和緊急關(guān)斷得以復位。因為,控制斷塞流捕集器和減壓站上兩個(gè)SDV-2102和SDV-2123的輸出點(diǎn)是掛在ESD系統遠程I/O機架的輸出模塊上的,當遠程I/O適配器ASB模塊與PLC處理器通訊故障時(shí),輸出點(diǎn)無(wú)法帶電,只能到現場(chǎng)進(jìn)行操作,兩閥打開(kāi)。而銷(xiāo)售計量撬 SDV-4033能夠正常打開(kāi),因為控制SDV-4033的輸出點(diǎn)是掛在另一個(gè)遠程I/O機架輸出模塊上的,這個(gè)遠程I/O機架和PLC 處理器通訊正常?;謴蜕a(chǎn)后,現場(chǎng)人員對有通訊問(wèn)題的遠程I/O機架進(jìn)行了斷電,然后上電的復位操作后,兩塊輸出卡上電,程序里輸入點(diǎn)的值與現場(chǎng)輸入卡的點(diǎn)的狀態(tài)一致,PLC處理器掃描到了遠程機架 I/O中的輸入輸出,遠程適配器ASB 模塊ACTIVE狀態(tài)燈由閃綠變?yōu)槌>G,及時(shí)恢復了ESD系統。
類(lèi)似故障現象在2008年和2009年也出現過(guò)多次,同一遠程機架 I/O不定期失效的根本原因還有待進(jìn)一步排查。
2 故障現象收集
2.1 故障現象一
遠程 I/O 機架適配器ASB模塊上的三個(gè)狀態(tài)指示燈的狀態(tài)分別為:
ACTIVE:綠色閃爍;
ADAPTER FAULT:滅;
I/O RACK FAUL:滅。
查找PLC 手冊,該警報描述為:Remoteadapter not actively controlling I/O; 引起該警報可能的原因:Processor is in program or testmode; Scanner is holding adapter module in faultmode.
正常的狀態(tài)應分別為:
ACTIVE:常綠;
ADAPTER FAULT:滅;
I/O RACK FAUL:滅,如圖1所示。
圖1 ASB remote I/O adapter 模塊
2.2 故障現象二
通過(guò)檢查遠程I/O機架輸出卡輸入卡件狀態(tài),發(fā)現說(shuō)明其對應的來(lái)自現場(chǎng)的變送器模擬信號,液位開(kāi)關(guān),壓力開(kāi)關(guān),手動(dòng)按鈕,SDV的限位開(kāi)關(guān),來(lái)自倉庫火警系統 PLC關(guān)停警報信號在卡件上的顯示燈均正常,為閉合帶電狀態(tài)。但是在PLC 程序數據文件中,發(fā)現其對應的值卻為0,正常應為1。說(shuō)明現場(chǎng)的設備本身均為正常,只是PLC處理器無(wú)法掃描到這些遠程I/O,在程序數據表里值為0。
2.3 故障現象三
通過(guò)檢查遠程I/O機架輸出卡上的輸出點(diǎn)對應的紅色狀態(tài)燈全部為滅的狀態(tài),說(shuō)明沒(méi)有電壓信號輸出到閥門(mén)和馬達。但是在程序數據表中發(fā)現這些輸出點(diǎn)對應的值為1。說(shuō)明遠程I/O機架輸出卡無(wú)法通過(guò)remoteI/O 鏈路通訊電纜接收到處理器中這些狀態(tài)為“1“的輸出指令,如圖2所示.
圖2 故障時(shí)的遠程I/O機架輸入輸出卡
2.4 故障現象四
在PLC程序中發(fā)現:channel status的1B口的Rack7和Rack10顯示F, F即表示該 Rack為fault。有故障的遠程I/O機架均為Rack7和Rack10。1B口為remote I/O scanner通信口,連接的為remote I/O 適配器。并發(fā)現Rack7和Rack10有很多的retries,其他的rack均為0 個(gè)retries,如圖3所示。
圖3 故障時(shí)在FPS 程序中顯示的scanner channel的狀態(tài)
2.5 故障現象五
恢復生產(chǎn)后,PLC 處理器上的CH1的1B通信口的狀態(tài)燈為“綠色閃爍” 。正常應該為常綠。1B通信口是用來(lái)連接remote scanner 和remote I/O adapter 的,如果出現“綠色閃爍” ,說(shuō)明at least one remote adapter is faulted or failed。hhhhhhhh可能的原因:power off at remote rack or communication cablebroken。在做好相關(guān)的旁通和邏輯強制后,對故障遠程I/O 機架進(jìn)行斷電然后上電的復位操作后,以上的故障現象立即消失,ESD系統工作正常。
根據以上的5個(gè)最直觀(guān)的現象,現在可以得出的結論是:故障遠程I/O 機架的輸入和輸出卡是完全正常的。問(wèn)題就在于PLC處理器掃描不到故障遠程I/O 機架致使處理器和該遠程I/O 機架無(wú)法通訊,導致了緊急關(guān)?!,F在要做的工作就是查找,故障遠程I/O 機架間接性出現故障的根本原因。
3 故障分析
可能處理器和故障遠程I/O 機架 remote I/O鏈路通信出現了故障。有可能是受到了一些噪聲干擾,比如大功率的馬達或者電焊機突然啟動(dòng)或者通信電纜信號屏蔽線(xiàn)損壞等。這個(gè)可能性還是存在的。驗證該可能性是否存在,只要調查當天發(fā)生故障時(shí)該區域進(jìn)行的相關(guān)作業(yè)就可以。通過(guò)檢查歷史作業(yè)記錄,發(fā)現發(fā)生故障時(shí)并沒(méi)有類(lèi)似的操作。并且故障時(shí),發(fā)現Rack10和Rack11 remoteI/O 工作正常。因為所有的rack是前后串接,所以就說(shuō)明通信電纜是沒(méi)有問(wèn)題的。至于終端電阻,標準配置為82歐姆,與處理器掃描器處的終端電阻相等。終端電阻大小選擇與通信波特率、通信距離以及處理器的版本系列號等因素有關(guān)。終端電阻是為了消除在通信電纜中的信號反射,保證信號的通訊質(zhì)量。在remote I/O鏈路通信過(guò)程中,有兩種原因導致信號反射:阻抗不連續和阻抗不匹配。阻抗不連續,信號在傳輸線(xiàn)末端突然遇到電纜阻抗很小甚至沒(méi)有,信號在這個(gè)地方就會(huì )引起反射。這種信號反射的原理,與光從一種媒質(zhì)進(jìn)入另一種媒質(zhì)要引起反射是相似的。消除這種反射的方法,就必須在電纜的末端跨接一個(gè)與電纜的特性阻抗同樣大小的終端電阻,使電纜的阻抗連續。由于信號在電纜上的傳輸是雙向的,因此,在通訊電纜的另一端可跨接一個(gè)同樣大小的終端電阻。引起信號反射的另個(gè)原因是數據收發(fā)器與傳輸電纜之間的阻抗不匹配。這種原因引起的反射,主要表現在通訊線(xiàn)路處在空閑方式時(shí),整個(gè)網(wǎng)絡(luò )數據混亂。要減弱反射信號對通訊線(xiàn)路的影響,可以通過(guò)在兩端跨接兩個(gè)匹配的終端電阻來(lái)消除。前兩次出現故障時(shí),均是更換了終端電阻,給故障機架進(jìn)行斷電,然后上電復位后上述故障現象消失。作為一個(gè)功率為0.5W的金屬鍍膜的電阻,才更換4個(gè)月左右的時(shí)間就會(huì )壞,這種可能性還是很小的,并且為什么2008年之前十幾年了沒(méi)有壞,最近今年卻連續“壞了”3次。所以從某種程度上來(lái)說(shuō),這三次故障和終端電阻沒(méi)有什么直接的關(guān)系。還存在更深一層次我們沒(méi)有發(fā)現的根本原因。每次更換終端電阻不能解決根本問(wèn)題。
如果故障遠程I/O 機架適配器ASB模塊自身不穩定,會(huì )造成這種故障。ASB 模塊本身就是介于故障遠程I/O 機架與處理器之間。以串行方式接收來(lái)自處理器的數據和向處理器發(fā)送數據;支持半槽、單槽,二槽I/O尋址,掃描機架里的槽位信息?;谇懊嬖敿毩信e的5個(gè)故障信息,都足以說(shuō)明是該適配器 ASB 模塊出現了故障。該5種故障現象與ASB 模塊的功能是完全匹配的。第5個(gè)故障現象就說(shuō)明了問(wèn)題在于其中某一個(gè)remote I/O,否則我們還會(huì )花更多的精力和時(shí)間去排除鏈路上的其他設備,或者處理器或者UPS電源等;現場(chǎng)的輸入信號均為1,但是輸入卡的信號無(wú)法發(fā)送到處理器,導致程序中對應的輸入點(diǎn)為0;程序中通過(guò)邏輯運行的輸出值與現場(chǎng)輸出卡對應的輸出點(diǎn)的狀態(tài)不相匹配,如程序中輸出為1,現場(chǎng)輸出卡卻為0;更直觀(guān)的是捕捉到了ASB模塊的故障診斷燈出現了綠色閃爍這一現象,說(shuō)明問(wèn)題的確是出在A(yíng)SB 模塊;第4個(gè)故障現象也說(shuō)明了就是該Rack7和Rack10出現了fault,三次故障時(shí)均有該警報出現在程序中;綜合對以上5個(gè)故障信息的分析,基本上我們可以得出故障就位于已經(jīng)使用了十幾年的適配器 ASB 模塊上。至于A(yíng)SB 模塊的故障是何引起,我們調查了這三次故障的共同歷史背景信息,大概判斷可能是由于室內工況溫度較高,導致ASB模塊某些電子元件受高溫老化,工作穩定性下降。目前室內冷凝器工作正常,溫度控制恢復正常。
4 故障解決方案
故障原因確定后,接下來(lái)的工作就是解決該故障??紤]到之前室內工況溫度較高,并且ESD 系統的重要性以及不影響生產(chǎn)的前提下在線(xiàn)更換ESD系統卡件的復雜性,現場(chǎng)計劃更換ASB 適配器模塊,同時(shí)一起更換已經(jīng)使用超過(guò)17年的機箱和電源模塊,確保ESD系統工作的高度可靠性和穩定性。由于A(yíng)B產(chǎn)品不支持熱插拔作業(yè),所以該工作必須在遠程I/O機架完全斷電的前提下才能進(jìn)行;并且現有的新的ASB 適配器模塊均是E系列版本,在線(xiàn)使用的是D系列版本。換上新的機箱和ASB模塊,不能確定處理器能夠掃描到rack7和rack10。不同版本的硬件開(kāi)關(guān)組態(tài)又有不同的標準,如果硬件開(kāi)關(guān)組態(tài)不正確,將會(huì )導致ESD 系統無(wú)法工作。
圖4 機架背板開(kāi)關(guān)組態(tài)設置方法
鑒于以上3點(diǎn)考慮,得出該項工作有3個(gè)最大的技術(shù)難點(diǎn):
(1)保證整個(gè)機箱斷電后,生產(chǎn)和設備運行不能受到影響。因為斷電后,會(huì )導致此機箱內所有I/O置0,從而導致全廠(chǎng)區關(guān)停。
(2)由于A(yíng)SB模塊系列版本號升級后,其中硬件開(kāi)關(guān)組態(tài)標準發(fā)生了變化。機箱母板和ASB 模塊等的硬件開(kāi)關(guān)設置比較復雜。
(3)如果換上去新的ASB模塊,出現處理器無(wú)法掃描到這張卡件的情況,就必須得在PLC程序中將其模式切換到PROGRAM來(lái)進(jìn)行AUTO CONFIGURE,這樣就會(huì )出現整個(gè)ESD系統輸出置0,全廠(chǎng)區關(guān)停。這個(gè)風(fēng)險我們必須考慮并準備有控制措施。
針對以上3個(gè)技術(shù)難題,我們的解決方案是:
(1) 為了保證生產(chǎn)的穩定和連續,對于輸入信號,我們可以在PLC 程序中進(jìn)行邏輯強制和旁通,對于輸出信號,由于失電,對于比較重要的關(guān)斷閥,可以在現場(chǎng)進(jìn)行手動(dòng)強制打開(kāi);對于比較重要的需要一直運轉的馬達聯(lián)鎖信號,可以在MCC開(kāi)關(guān)柜里面將繼電器進(jìn)行臨時(shí)跳接。對于消防泵,由于失電,可能會(huì )誤啟動(dòng),可以將其中切換到OFF狀態(tài),現場(chǎng)守候。為了保證不遺漏任何一個(gè)輸入輸出點(diǎn),打印出來(lái)所有I/O點(diǎn),核對每一個(gè)點(diǎn)并和操作一起檢查其旁通、邏輯強制等措施。同時(shí),由于該區域保護系統已經(jīng)臨時(shí)失效,需要有專(zhuān)門(mén)人員進(jìn)行巡檢,并隨時(shí)與中控溝通。
(2) 嚴格按照AB 手冊對其進(jìn)行硬件開(kāi)關(guān)組態(tài)設置。其設置方法如圖4圖5所示。其中圖4為機架背板開(kāi)關(guān)組態(tài)設置方法,圖5為ASB模塊S1&S2開(kāi)關(guān)組態(tài)設置方法。
(3)通過(guò)認真研究AB手冊以及和Rockwell 廠(chǎng)家溝通,最終確認,如果是增加或者減少一個(gè)機箱的話(huà),的確要在PROGRAM的模式下進(jìn)行AUTO CONFIGURE,將會(huì )導致整個(gè)ESD系統關(guān)停。我們本次作業(yè)時(shí)更換ASB模塊,沒(méi)有改變其在remote I/O通訊鏈路上的rack地址,也沒(méi)有增加或減少機架,不需AUTOCONFIGURE。在驗證該結論的過(guò)程中,所投入的精力最多,也是當時(shí)最難確定的。
最終落實(shí)以上3個(gè)技術(shù)方案后,于2010年3月30日在連續生產(chǎn)的前提下,成功地對更換了故障遠程I/O機架的機箱,ASB和電源模塊。至今,ESD系統工作正常,沒(méi)有出現類(lèi)似故障。
圖5 ASB模塊S1&S2開(kāi)關(guān)組態(tài)設置方法
5 結論
ESD系統再沒(méi)有出現類(lèi)似故障,說(shuō)明故障得到徹底解決,也證明只要有正確的方法,深入細致的故障診斷和充分的準備,在不停輸的情況下可以做到在線(xiàn)更換AB PLC-5 遠程I/O 機箱卡件。
參考文獻:
[1] Cat. No 1771-ASB Series D Remote I/O Adapter Module User Manual,ALLEN-BRADLEY[Z].ROCKWELL INTERNATIOANL COMPANY, 1995
[2] Cat. No 1771-ASB Series E Remote I/O Adapter Module User Manual,ALLEN-BRADLEY[Z].ROCKWELL INTERNATIOANL COMPANY, 2000
[3] PLC-5 Family Programmable Controllers Hardware Installation Manual,ALLEN-BRADLEY[Z].ROCKWELL INTERNATIOANL COMPANY, 2000
[4] Data Highway/ Data Highway Plus/ Data Highway II Cable InstallationManual, ALLEN-BRADLEY[Z].ROCKWELL INTERNATIOANLCOMPANY, 1994
黃若平(1982-)
男,湖北荊州人,本科,2005年畢業(yè)于長(cháng)江大學(xué)自動(dòng)化專(zhuān)業(yè),工學(xué)學(xué)士學(xué)位,現任中海油崖城氣田高級儀表師,主要從事于作業(yè)公司儀表和控制系統的現場(chǎng)技術(shù)工作。
王回綏(1984-)男,甘肅靜寧人,本科,現任中海油崖城氣田中級儀表師,主要從事于作業(yè)公司儀表和控制系統的現場(chǎng)技術(shù)工作。
摘自《自動(dòng)化博覽》2011年第十一期