• <blockquote id="fficu"><optgroup id="fficu"></optgroup></blockquote>

    <table id="fficu"></table>

    <sup id="fficu"></sup>
    <output id="fficu"></output>
    1. ACS880-07C
      關(guān)注中國自動(dòng)化產(chǎn)業(yè)發(fā)展的先行者!
      橫河電機-23年10月11日
      2024
      工業(yè)智能邊緣計算2024年會(huì )
      2024中國自動(dòng)化產(chǎn)業(yè)年會(huì )
      2023年工業(yè)安全大會(huì )
      OICT公益講堂
      當前位置:首頁(yè) >> 資訊 >> 行業(yè)資訊

      資訊頻道

      服務(wù)器運維和巡檢工作之我見(jiàn)
      • 作者:鄭邦甲
      • 點(diǎn)擊數:2724     發(fā)布時(shí)間:2021-06-26 10:59:33
      • 分享到:
      服務(wù)器和相關(guān)設備的運維巡檢工作是一項綜合性很強的工作,需要服務(wù)器運維人員全身心投入,認真做好各方面的工作。需要關(guān)注服務(wù)器硬件及軟件運維巡檢的注意事項,在巡檢過(guò)程中發(fā)現的故障和問(wèn)題要及時(shí)解決。需要遵循公司為保障運維巡檢有序進(jìn)行而制定的規章制度。 服務(wù)器運維人員要做好巡檢工作,還必須保持學(xué)習。
      關(guān)鍵詞: 服務(wù)器 , 運維 , 巡檢

       摘要:服務(wù)器和相關(guān)設備的運維巡檢工作是一項綜合性很強的工作,需要服務(wù)器運維人員全身心投入,認真做好各方面的工作。需要關(guān)注服務(wù)器硬件及軟件運維巡檢的注意事項,在巡檢過(guò)程中發(fā)現的故障和問(wèn)題要及時(shí)解決。需要遵循公司為保障運維巡檢有序進(jìn)行而制定的規章制度。 服務(wù)器運維人員要做好巡檢工作,還必須保持學(xué)習。

      關(guān)鍵詞:服務(wù)器;運維;巡檢

       Abstract: In order to do a good job in the operation and maintenance  inspection of servers and related equipment, the server operation and  maintenance personnel need to do a good job in all aspects of the  work, which is a highly comprehensive work and requires wholehearted  devotion and conscientious completion. Attention should be paid to the  precautions of server hardware operation and maintenance inspection.  The faults and problems found in the inspection process should be solved  in time and the rules and regulations formulated by the unit to ensure the  orderly operation and maintenance inspection should be followed. And  for the sever operation and maintenance personnel, only through lifelong  learning can the inspection work be better completed.

      Key words: Server; Operation and maintenance; Inspection

      服務(wù)器巡檢是一項非常重要的工作,是維護服務(wù) 器、是現代信息行業(yè)的基石,是一切基于其之上服務(wù)穩 定運行的基本保障。

      作為一家為各個(gè)企業(yè)和一些合作單位提供服務(wù)器運維和巡檢的計算機企業(yè),公司有著(zhù)齊全的計算機設備,多個(gè)機房分布在本市多處。這些都需要運維人員做好對這些服務(wù)器的運維和巡檢相關(guān)的工作。企業(yè)離不開(kāi)服務(wù)器,服務(wù)器離不開(kāi)運維人員?,F就服務(wù)器運 維巡檢工作中的幾項注意事項,試與同行進(jìn)行探討和 交流。

      1 服務(wù)器硬件運維巡檢的相關(guān)注意事項

      服務(wù)器硬件是企業(yè)對外提供服務(wù)所必須的基礎設施,如機房建筑結構上的等電位保護措施、防雷設施、 等電位連接設施、機房防雷裝置、機器自身的防雷和防靜電接地線(xiàn)等防雷裝置,UPS冗余電源和機器自身的雙電源甚至更多電源的冗余電源裝置,精密空調和冷風(fēng)通 道、散熱風(fēng)扇和導風(fēng)條等冷卻散熱系統,環(huán)境監控系 統、視頻監控系統,機房門(mén)禁系統和七氟丙烷氣體滅火 系統等環(huán)境、監控、門(mén)禁和防火系統等。這些關(guān)聯(lián)在一 起,以保證機房硬件設施的安全穩定。

      服務(wù)器機房硬件運維和巡檢十分重要。當運維人員進(jìn)入機房以后,要及時(shí)觀(guān)察機房環(huán)境。發(fā)現問(wèn)題或故障要及時(shí)記錄,并及時(shí)做出響應。

      機房環(huán)境是否有故障以及故障情況,運維人員在巡檢時(shí)要及時(shí)填入服務(wù)器巡檢表格,以備今后查看和存檔。

      確認機房安全狀態(tài)后,運維人員應及時(shí)巡檢自己職責范圍內的服務(wù)器、交換機、路由器等一系列硬件設施,觀(guān) 察指示燈狀況是否正常,是否有硬盤(pán)故障、網(wǎng)線(xiàn)故障、電 源故障等,是否有異響異味甚至其他危險征兆。

      出入機房要用門(mén)禁卡來(lái)驗證,必須做好門(mén)禁卡分發(fā)和管理的工作,門(mén)禁卡由公司專(zhuān)人負責。外來(lái)人員進(jìn)入機房辦事,必須由負責此項工作的運維人員帶領(lǐng)進(jìn)去并全程陪同,以保證人員和設備的安全,離職員工門(mén)禁卡權限應當及時(shí)注銷(xiāo)。

      在機房進(jìn)行運維和巡檢時(shí),運維人員必須要預防觸 電事故,盡可能地減少和避免熱插拔和非正常關(guān)機等非正常操作,避免不遵守操作規程的做法和行為,將可能對服務(wù)器硬件造成的損傷和破壞降到最低。

      硬件巡檢看似簡(jiǎn)單重復,但必須有強烈的責任 心,專(zhuān)注地做好,絲毫不能懈怠,這樣才能最大限度地 保證機房和服務(wù)器設施以及巡檢人員自身的安全。

      2 服務(wù)器軟件方面巡檢的注意事項

      運維人員除了負責機房及服務(wù)器硬件設施的運維和巡檢,還要遠程連接到服務(wù)器上進(jìn)行服務(wù)器軟件設施等軟件方面的運維和巡檢。

      服務(wù)器軟件雖然沒(méi)有實(shí)體,但它也在為用戶(hù)提供服務(wù)。本公司的遠程巡檢原來(lái)是通過(guò)系統遠程登錄進(jìn)行的,只要知道用戶(hù)名和口令,運維人員就能夠輕松登錄上去,操作較為方便。但原先在公司以外的外網(wǎng)以及公司內部某些區域是直接用云桌面或VPN或跳板機來(lái)登錄的,有一定安全風(fēng)險。

      近年來(lái)為保護關(guān)鍵公司的重要數據安全,國家加強了等級保護等措施。筆者所在公司作為重要國企, 對這方面的安全進(jìn)行升級,統一采用堡壘機進(jìn)行安全登錄,實(shí)施任何遠程運維操作,都必須通過(guò)堡壘機作為跳 板,而不是遠程桌面直連。

      堡壘機可以記錄下每個(gè)用戶(hù)登錄的全部過(guò)程,以便在出現問(wèn)題時(shí)進(jìn)行追溯和理清責任。

      運維人員進(jìn)行在線(xiàn)或機房軟件巡檢時(shí),應按規定進(jìn)行,并及時(shí)做好記錄。

      巡檢中發(fā)現問(wèn)題,要第一時(shí)間和相關(guān)負責的同志以及相關(guān)領(lǐng)導同事進(jìn)行溝通交流,如有必要,共同開(kāi)會(huì )研究解決方案。

      3 在巡檢過(guò)程中發(fā)現的故障和問(wèn)題要及時(shí) 處理

      運維人員在進(jìn)行服務(wù)器硬件設備和軟件系統的巡 檢時(shí),不僅是為了巡檢而巡檢。更是要帶著(zhù)讓系統更安全更穩定和保證系統安全穩定運行的目的去進(jìn)行巡檢。

      運維人員在進(jìn)入機房巡檢時(shí),應當全神貫注地注意每個(gè)細節。在遠程進(jìn)行服務(wù)器軟件巡檢時(shí),應當注意軟件系統的各個(gè)細節,如服務(wù)器的CPU使用率、內存使用率、磁盤(pán)空間使用率、各硬件溫度等,一旦發(fā)現異?;虺鲩撝稻鸵皶r(shí)處理。

      在公司的巡檢工作過(guò)程中,筆者曾多次在第一時(shí)間發(fā)現服務(wù)器系統出現故障,并及時(shí)將其解決,以及聯(lián) 系其他同事和領(lǐng)導討論和啟動(dòng)應急預案解決問(wèn)題。巡檢工作過(guò)程中及時(shí)發(fā)現、及時(shí)響應,避免了公司的損失。

      在巡檢中發(fā)現問(wèn)題,接下來(lái)解決這些問(wèn)題。如發(fā)現的是簡(jiǎn)單的小問(wèn)題,可以按照慣常的操作方法來(lái)解 決。如冗余電源和網(wǎng)線(xiàn)亮紅燈插拔、機器死機故障重啟等,及時(shí)做好故障處理記錄。

      當暫不能解決問(wèn)題,就需要自行研究解決方法, 嘗試排除故障,并且和相關(guān)同事或領(lǐng)導等人一起研討解決方案,緊急處理,持續跟進(jìn),直到把問(wèn)題徹底解決。 并記錄解決此類(lèi)問(wèn)題的方法和過(guò)程,以為今后解決同類(lèi)問(wèn)題提供經(jīng)驗。

      而當遇到超出常規的特殊故障,運維人員會(huì )動(dòng)用應急預案及時(shí)進(jìn)行處理和解決。應急預案規定了各個(gè)系統恢復響應所需的時(shí)間限額,在這范圍內解決故障可以有效保證系統的正常運行,把故障造成的損失降到最低限度。

      當運維人員需要和廠(chǎng)商、供貨商,以及外單位人員等外部力量來(lái)解決問(wèn)題時(shí),則由運維人員或公司領(lǐng)導聯(lián)系他們進(jìn)行確認,說(shuō)明問(wèn)題或需求,并通過(guò)遠程和機房現場(chǎng)連接測試以及現場(chǎng)測試等,對這些故障進(jìn)行跟進(jìn)處理。

      服務(wù)器運維巡檢操作如果涉及到對現有配置的修 改,在工作時(shí)間不得影響用戶(hù)業(yè)務(wù)和發(fā)生重大事故,對于影響用戶(hù)業(yè)務(wù)的操作應遵守如下運維操作紀律和規范:

      三個(gè)禁止:

      · 禁止白天對設備進(jìn)行中斷業(yè)務(wù)的操作;

      · 禁止沒(méi)有方案下進(jìn)行中斷業(yè)務(wù)的操作;

      · 禁止沒(méi)有通知上級領(lǐng)導私自進(jìn)行中斷業(yè)務(wù)的操作。

      七個(gè)必須:

      · 操作必須得到業(yè)務(wù)組長(cháng)的確認;

      · 操作前必須對當前配置進(jìn)行記錄或備份;

      · 操作過(guò)程中必須確認操作的準確性;

      · 操作后必須進(jìn)行業(yè)務(wù)驗證和相應測試;

      · 操作后必須監控設備運行狀態(tài),存在新增告警或異常的需進(jìn)行記錄和分析原因;

      · 操作后出現業(yè)務(wù)中斷2小時(shí)以上且不能恢復業(yè)務(wù)的,必須上報領(lǐng)導說(shuō)明情況;

      · 操作后必須及時(shí)反饋并記錄操作結果。

      服務(wù)器巡檢操作應準備充分,包含以下要求:

      (1)穩定的網(wǎng)絡(luò )環(huán)境:服務(wù)器巡檢應盡量在公司內網(wǎng)進(jìn)行,對于中斷業(yè)務(wù)的操作,原則上不可通過(guò) VPN進(jìn)行遠程操作;

      (2)被批準的操作方案:對于重大操作影響或中斷業(yè)務(wù)的,方案中應包括應急回退方案;

      (3)登入設備的用戶(hù)賬號和權限:操作前需確保開(kāi)通登入相關(guān)設備的用戶(hù)賬號和相應權限;

      (4)進(jìn)入機房的權限申請:如有必要,需提前向設備所屬物業(yè)公司申請進(jìn)入許可,進(jìn)入時(shí)需攜帶相關(guān)證件;


      (5)其他外部設備:根據業(yè)務(wù)需要應提前準備相關(guān)外設,包含不限于筆記本電腦、U盤(pán)、Console連接 線(xiàn)、USB-網(wǎng)口轉換線(xiàn)、網(wǎng)線(xiàn)測試儀、網(wǎng)線(xiàn)和網(wǎng)線(xiàn)鉗等。

      除此之外,公司還根據客戶(hù)需要在多個(gè)客戶(hù)公司派駐了運維人員,并對托管機房的服務(wù)器進(jìn)行巡檢。

      托管機房所在地常常遠離日常工作地點(diǎn),公司會(huì )定 期指派工程運維人員定期趕往這些機房進(jìn)行巡檢,由于 巡檢是在不影響其他工作正常開(kāi)展的情況下進(jìn)行,這對外派運維人員的業(yè)務(wù)能力也有更高的要求。

      外派的運維人員一旦遇到無(wú)法解決的非常規超常規 的問(wèn)題,必須第一時(shí)間和公司其他運維人員以及領(lǐng)導聯(lián) 系,共同解決問(wèn)題。

      運維巡檢工作看似簡(jiǎn)單重復,實(shí)際上也會(huì )有突發(fā)情況。發(fā)現問(wèn)題不但要及時(shí)解決,還要和其他人員共同解決,并做好各項記錄。

      凡事預則立,只有事先做好了應急預案,才能更好地解決突發(fā)問(wèn)題。

      處理巡檢中發(fā)現的故障和問(wèn)題,維護系統有序運 行,是運維人員的職責所在。

      4 應當遵循公司制定的運維巡檢工作相關(guān)的規章制度  

      運維人員開(kāi)展工作要遵循公司的規章制度。制定和遵循這些規章制度是為了更好、更有條理、更有序地完 成企業(yè)的工作。

      公司已經(jīng)制訂的各項規章制度,有時(shí)也會(huì )根據業(yè)務(wù)的變化來(lái)進(jìn)行修改。隨著(zhù)業(yè)務(wù)的發(fā)展,公司的客戶(hù)數量不斷增加,需要新增服務(wù)器、新增精密空調,增大精密空調的功率、配電柜的功率,以及增加機柜和機房的數量和容量。這些設備擴容時(shí)需要停止部分服務(wù),業(yè)務(wù)暫時(shí)縮減,要拆除服務(wù)器或把服務(wù)器另做他用。在這些過(guò)程中有時(shí)需要幫客戶(hù)搬遷機器,以及搬遷公司自己的機房機器,比如2018年的某企業(yè)服務(wù)器大搬遷,從吳涇地區搬到了上海金山石化區。

      過(guò)程中牽涉到機器設備安全、數據安全、人員安全等一系列問(wèn)題。服務(wù)器在搬遷過(guò)程中不能受到過(guò)大的震動(dòng),過(guò)大震動(dòng)會(huì )導致硬盤(pán)損壞或內存條松動(dòng)影響開(kāi)機,甚至丟失用戶(hù)數據。在搬遷之前要備份部分用戶(hù)關(guān)鍵數據。 這一切都必須遵循公司的規章制度有序開(kāi)展業(yè)務(wù)。

      公司的機房設備增減以及機房擴容等牽涉到硬件安全、成本的計算、人員的管理等,這都需要一系列制度來(lái)進(jìn)行保障。

      服務(wù)器機房是一個(gè)龐大復雜的系統,它的穩定運行需要嚴格遵循規章制度的建設來(lái)規范人/物等各方面因素,從而推進(jìn)這些工作的順利和有序進(jìn)行。

      公司規章制度《信息系統運維管理辦法》,其中包括信息系統運維支持組織和職責、信息安全管理、關(guān)鍵崗位管理、賬戶(hù)和權限管理、密碼口令管理、網(wǎng)絡(luò )和訪(fǎng)問(wèn)管理、配置和備份管理、資產(chǎn)安全和備件管理、安 全審計等。

      5 運維人員要做好巡檢工作,需要終身進(jìn) 行學(xué)習

      計算機行業(yè)變化發(fā)展很快,新技術(shù)、新方法、新 設備層出不窮,計算機硬件行業(yè)的快速發(fā)展,也帶動(dòng)了軟件行業(yè)的快速發(fā)展。服務(wù)器領(lǐng)域各種設備每隔幾年就會(huì )更新一代。由于服務(wù)器設備的壽命很長(cháng),持續使用時(shí)間很長(cháng),公司里既有老的服務(wù)器也隨時(shí)會(huì )增加新的服務(wù)器,新老服務(wù)器之間協(xié)同工作可以達成性能和成本的最佳平衡。服務(wù)器運維人員為了做好運維工作,既需要掌握老服務(wù)器的運維知識,也需要掌握新服務(wù)器的運維知 識。

      人的年齡在增長(cháng),隨著(zhù)終身學(xué)習知識和積累經(jīng)驗,運維人員進(jìn)行運維工作的理論和實(shí)踐經(jīng)驗只會(huì )越來(lái)越豐富,從而更好地進(jìn)行運維工作,把公司的業(yè)務(wù)做得更好。

      服務(wù)器運維人員做好巡檢工作,需要關(guān)注服務(wù)器硬件運維巡檢的注意事項,軟件在巡檢過(guò)程中發(fā)現的故障和問(wèn)題要及時(shí)解決。需要遵循公司為保障運維巡檢有序進(jìn)行而制定的規章制度,還必須終身進(jìn)行學(xué)習。

      服務(wù)器運維和巡檢看似很簡(jiǎn)單,但實(shí)際上卻并不容易。維護服務(wù)器作為現代信息行業(yè)的基石,是一切基于其之上服務(wù)穩定運行的基本保障。

      作者簡(jiǎn)介:

      鄭邦甲(1984-),男,江蘇贛榆人,學(xué)士,現就職上海華誼信息技術(shù)有限公司,研究方向是計算機。

      摘自《自動(dòng)化博覽》2021年5月刊

      熱點(diǎn)新聞

      推薦產(chǎn)品

      x
      • 在線(xiàn)反饋
      1.我有以下需求:



      2.詳細的需求:
      姓名:
      單位:
      電話(huà):
      郵件:
      欧美精品欧美人与动人物牲交_日韩乱码人妻无码中文_国产私拍大尺度在线视频_亚洲男人综合久久综合天

    2. <blockquote id="fficu"><optgroup id="fficu"></optgroup></blockquote>

      <table id="fficu"></table>

      <sup id="fficu"></sup>
      <output id="fficu"></output>