摘要:簡(jiǎn)要介紹機器視覺(jué)系統的構成,機器視覺(jué)系統圖像處理與模式識別的基礎、研究進(jìn)展,最后通過(guò)實(shí)例分析機器視覺(jué)系統的應用。
關(guān)鍵詞:機器視覺(jué);模式識別;圖像
Abstract: This paper describes the machine vision system briefly, including the theories and basis of the image processing and pattern recognition. Also the research development is introduced. In the last part, an application system is analyzed.
Key words: Machine vision; Pattern recognition; Image
1 機器視覺(jué)基礎概述
機器視覺(jué)是研究計算機模擬生物宏觀(guān)視覺(jué)功能的科學(xué)和技術(shù),即用攝像機和計算機等機器代替人眼對目標進(jìn)行測量、跟蹤和識別,并加以判斷。主要應用于如工業(yè)檢測、工業(yè)探傷、精密控制、自動(dòng)生產(chǎn)流水線(xiàn)、郵政自動(dòng)化、糧食優(yōu)選、顯微醫學(xué)操作,以及各種危險場(chǎng)合工作的機器人等[1]。機器視覺(jué),是人工視覺(jué),又可稱(chēng)作工業(yè)視覺(jué),或計算機視覺(jué),與人類(lèi)視覺(jué)或動(dòng)物視覺(jué)有著(zhù)本質(zhì)的不同。也有人認為機器視覺(jué)是計算機視覺(jué)工業(yè)應用的一個(gè)分支。但無(wú)論怎樣理解,機器視覺(jué)系統主要有三個(gè)部分:圖像獲取、圖像分析和處理、輸出顯示或控制,如圖1所示。
圖1 機器視覺(jué)系統模塊構成
1.1 圖像獲取 表1 線(xiàn)陣CCD參數
圖像的獲取,是任何機器視覺(jué)的基礎,實(shí)際上是將被測物體的可視化圖像和內在特征轉換成能被計算機處理的一系列數據。場(chǎng)景中設置的攝像機提供了一維的或二維的圖像信息,調制后提供給圖像采集裝置,在計算機中形成為數字圖像信息或數據。圖像獲取裝置主要是由攝像機、圖像傳輸變換系統和圖像的計算機采集裝置等構成。從所使用的攝像機來(lái)分類(lèi),則主要由CCD[3]、CMOS等光學(xué)敏感原理構成的圖像傳感器構成,從圖像獲取的形式來(lái)看,主要有線(xiàn)陣、面陣兩種類(lèi)型。
圖像獲取,由三部分組成:照明系統、圖像聚焦光學(xué)系統、圖像敏感元件和視頻調制。
照明和影響機器視覺(jué)系統輸入的重要因素,因為它直接影響輸入數據的質(zhì)量和至少30%的應用效果。通用的機器視覺(jué)照明設備難以形成,在工業(yè)應用中,針對每個(gè)特定的應用場(chǎng)景,選擇相應的照明裝置。最初的機器視覺(jué)系統用可見(jiàn)光作為光源,常用的可見(jiàn)光源是日光燈、水銀燈、白熾燈和鈉光燈。但是,這些光源的一個(gè)最大缺點(diǎn)是光能不能保持穩定,且環(huán)境光將改變這些光源照射到物體上的總光能。以日光燈為例,在使用的第一個(gè)100小時(shí)內,光能將下降15%,隨著(zhù)使用時(shí)間的增加,光能將不斷下降。對于某些要求高的工業(yè)檢測任務(wù),常采用X射線(xiàn)、超聲波[2]等不可見(jiàn)光作為光源,單波長(cháng)的激光也已得到大量應用,不過(guò)價(jià)格較高。
圖像聚焦光學(xué)系統,即被測物的圖像通過(guò)一個(gè)光學(xué)系統,透鏡聚焦在敏感元件上。機器視覺(jué)系統使用CCD、CMOS等圖像傳感器來(lái)捕捉圖像,傳感器將可視圖像轉化為電信號,便于計算機處理。
圖像敏感元件是一個(gè)光電轉換裝置,將傳感器所接收到的物體成像,轉化為計算機能處理的電信號?,F代工業(yè)、民用主要使用CCD、CMOS等攝像機。主要將在成像單元上形成的光學(xué)信號轉換為電信號,成像單元可以線(xiàn)陣列或面陣列構成,通過(guò)按一定順序每個(gè)單元的電荷輸出,實(shí)現將成像單元上的光信號轉換成電信號的目的。輸出的像元序列電荷,可以直接調制成標準的PAL、NTSC等制式的電視信號,即視頻信號,視頻信號可傳輸到標準的電視接收機顯示或通過(guò)圖像采集裝置把視頻信號變換為離散的陣列數字信號,存入計算機中,進(jìn)行后續處理。
在某些工業(yè)應用中,使用攝像機陣列,形成多攝像機或雙攝像機的多目或雙目視覺(jué)系統,從而得到絕對的深度信息。
1.2 圖像分析和處理
機器視覺(jué)系統中,主要強調用計算機實(shí)現人的視覺(jué)功能,視覺(jué)信息的分析與處理技術(shù)主要使用圖像對象。所以機器視覺(jué)需要運用圖像分析、處理以及圖像理解方法這三個(gè)層次的多種技術(shù)手段,它包括圖像增強、數據編碼和傳輸、平滑、邊緣銳化、分割、特征抽取、圖像識別與理解等內容。經(jīng)過(guò)這些處理后,輸出圖像的質(zhì)量得到相當程度的改善,既改善了圖像的視覺(jué)效果,又便于計算機對圖像進(jìn)行分析、處理和識別。在建立視覺(jué)信息系統,用計算機協(xié)助人類(lèi)完成各種視覺(jué)任務(wù)方面,圖像理解和視覺(jué)都需要用到攝影幾何學(xué)、概率論與隨機過(guò)程、人工智能等理論。例如,它們都要借助兩類(lèi)智能活動(dòng):① 感知,如感知場(chǎng)景中可見(jiàn)部分的距離、朝向、形狀、運動(dòng)速度、相互關(guān)系等;② 思維,如根據場(chǎng)景結構分析物體的行為,推斷場(chǎng)景的發(fā)展變化,決定和規劃主體行動(dòng)等。最終,完成工業(yè)控制的目的。
1.3 輸出顯示或控制
視覺(jué)信息處理的目標往往圍繞一定的工業(yè)控制進(jìn)行的,在對距離、尺寸、形狀、姿態(tài)、顏色、速度等做出判別后,進(jìn)而根據判別的結果來(lái)控制現場(chǎng)的設備動(dòng)作。如,姿態(tài)調整、零件剔除、速度調節等。實(shí)現控制,是機器視覺(jué)的根本目標。
2 機器視覺(jué)的研究和發(fā)展動(dòng)態(tài)
機器視覺(jué)的研究、發(fā)展和應用還遠沒(méi)有達到成熟的程度。機器視覺(jué)從誕生到今天才只有短短的三十多年時(shí)間,在機器視覺(jué)中承擔“大腦”作用的圖像分析處理、圖像理解和模式識別理論和技術(shù)基礎還非常不完善[4]。甚至,機器視覺(jué)的圖像獲取系統也存在許多局限,比如高速圖像采集實(shí)現困難、價(jià)格過(guò)高,圖像分辨率、靈敏度等不高,敏感元件的制造困難,視覺(jué)系統的體積較大,自適應的圖像獲取無(wú)法實(shí)現等。
本文從這幾個(gè)方面介紹機器視覺(jué)的最新發(fā)展情況:圖像獲取、圖像處理與模式識別理論。
2.1 圖像獲取技術(shù)的最新發(fā)展
圖像獲取技術(shù)的發(fā)展迅猛,CCD、CMOS等固體器件已經(jīng)變成成熟應用的技術(shù)。首先來(lái)看,線(xiàn)陣圖像敏感器件,像元尺寸不斷減小,陣列像元數量不斷增加,像元電荷傳輸速率得到極大提高。如表1所示,為一種高性能線(xiàn)陣CCD器件的參數[5]。從中可以看到,目前的線(xiàn)陣器件的性能和參數發(fā)生了根本的變化,主要表現在像元數和數據率得極大提高,而且器件設計集成了新的功能,具有可編程能力,如增益調整、曝光時(shí)間選擇、速率調節,以及維護等。在機器視覺(jué)中,高速器件應用的場(chǎng)合在不斷拓展,如高速掃描圖像獲取,在集成電路檢查、零件姿態(tài)識別、快速原型中的逆向工程、紡織、色選等,都是高速器件的用武之地。
在線(xiàn)陣器件性能提高的同時(shí),高速面陣圖像器件性能也在快速提高。某種超高速面陣CCD器件,允許的最大分辨率達1 280×1 024像素,最大幀率1MHz時(shí)可采集4幀圖像,且像素靈敏度達12bits。
在提高諸如分辨率、速率、靈敏度等性能的同時(shí),也在發(fā)展一些用途和使用場(chǎng)合特殊的器件,如對紅外敏感的或微光攝像機,對其他射線(xiàn)和超聲波敏感的器件等。
此外,其他類(lèi)型的圖像獲取器件的研究也展露頭角,比如,光纖視覺(jué)傳感器,結合其他光電技術(shù),以及構成陣列器件已經(jīng)有報道。
作為圖像獲取裝置的組成部分,嵌入式系統、DSP對圖像獲取起著(zhù)圖像采集與時(shí)序控制的作用。大量的工業(yè)圖像處理系統中采用嵌入式系統或DSP,也有部分系統采用工業(yè)PC機作為主控機器,完成圖像采集、處理和識別,并完成控制的功能。嵌入式系統或嵌入式微控制器(Embedded MCU)芯片技術(shù)發(fā)展迅速,主要的工業(yè)應用采用8位、16位芯片,高端應用已經(jīng)采用32位芯片。在高精度的運動(dòng)檢測和控制領(lǐng)域,32位嵌入式微控制器應用報道也不鮮見(jiàn)。在機器視覺(jué)系統中,對嵌入式系統性能的要求比一般的工業(yè)控制、機器人控制等場(chǎng)合要高。如,某種32位嵌入式微控制器芯片,內嵌大容量的Flash ROM和SRAM,其主頻達到700MHz,帶豐富的DSP指令系統,高速并行接口、通信接口齊備,提供可視化編程,支持匯編、ANSI C以及Visual C++等語(yǔ)言編程,支持在線(xiàn)仿真和調試等,使得開(kāi)發(fā)應用的周期大大縮短。
2.2 圖像處理、圖像理解與模式識別理論研究及最新發(fā)展
前面已經(jīng)述及,機器視覺(jué)是針對工業(yè)應用領(lǐng)域。但作為視覺(jué)系統,所采用的圖像處理、圖像理解與模式識別的基礎理論和技術(shù)是相同的。
數字圖像處理、圖像理解與模式識別,這是當今計算機視覺(jué)研究的熱點(diǎn)。這既表明,圖像處理與模式識別在現代信息技術(shù)中的重要作用,同時(shí)也說(shuō)明,該研究領(lǐng)域仍然存在大量沒(méi)有解決的研究難題。
圖像的增強、圖像的平滑、圖像的數據編碼和傳輸、邊緣銳化、圖像的分割等在不同的研究目標和應用中會(huì )采取不同的方法,也在不斷出現新的研究成果,本文不述及。作為機器視覺(jué)能否得到應用,關(guān)鍵在于圖像的識別。
圖像的模式識別過(guò)程實(shí)際上可以看作是一個(gè)標記過(guò)程,即利用識別算法來(lái)辨別景物中已分割好的各個(gè)物體,給這些物體賦予特定的標記,它是機器視覺(jué)系統必須完成的一個(gè)任務(wù)。什么是模式和模式識別?廣義地說(shuō),存在于時(shí)間和空間中可觀(guān)察的事物,如果可以區別它們是否相同或相似,都可以稱(chēng)之為模式;狹義地說(shuō),模式是通過(guò)對具體的個(gè)別事物進(jìn)行觀(guān)測所得到的具有時(shí)間和空間分布的信息;把模式所屬的類(lèi)別或同一類(lèi)中模式的總體稱(chēng)為模式類(lèi)(或簡(jiǎn)稱(chēng)為類(lèi))。而“模式識別”則是在某些一定量度或觀(guān)測基礎上把待識模式劃分到各自的模式類(lèi)中去[6]。
模式識別的方法,即數據聚類(lèi)、神經(jīng)網(wǎng)絡(luò )、統計分類(lèi)和結構(句法)模式識別方法。用于圖像識別的方法主要分為決策理論和結構方法。決策理論方法的基礎是決策函數,利用它對模式向量進(jìn)行分類(lèi)識別,是以定時(shí)描述(如統計紋理)為基礎的;結構方法的核心是將物體分解成了模式或模式基元,而不同的物體結構有不同的基元串(或稱(chēng)字符串),通過(guò)對未知物體利用給定的模式基元求出編碼邊界,得到字符串,再根據字符串判斷它的屬類(lèi)。這是一種依賴(lài)于符號描述被測物體之間關(guān)系的方法。
廣泛應用于統計模式識別中密度估計的方法之一是基于混合密度模型的。根據期望最大(EM)算法得到了這些模型中有效的訓練過(guò)程。按照共享核函數可以得出條件密度估計的更一般的模型,類(lèi)條件密度可以用一些對所有類(lèi)的條件密度估計產(chǎn)生作用的核函數表示。提出了一個(gè)模型,該模型對經(jīng)典徑向基函數(RBF)網(wǎng)絡(luò )進(jìn)行了修改,其輸出表示類(lèi)條件密度。與其相反的是獨立混合模型的方法,其中每個(gè)類(lèi)的密度采用獨立混合密度進(jìn)行估計。提出了一個(gè)更一般的模型,共享核函數模型是這個(gè)模型的特殊情況。
在20世紀70年代,波蘭學(xué)者Pawlak Z和一些波蘭的邏輯學(xué)家們一起從事關(guān)于信息系統邏輯特性的研究。粗糙集理論就是在這些研究的基礎上產(chǎn)生的。1982年,Pawlak Z發(fā)表了經(jīng)典論文Rough Sets,宣告了粗糙集理論的誕生。此后,粗糙集理論引起了許多科學(xué)家、邏輯學(xué)家和計算機研究人員的興趣,他們在粗糙集的理論和應用方面作了大量的研究工作。1991年,Pawlak Z的專(zhuān)著(zhù)和1992年應用專(zhuān)集的出版,對這一段時(shí)期理論和實(shí)踐工作的成果作了較好的總結,同時(shí)促進(jìn)了粗糙集在各個(gè)領(lǐng)域的應用。此后召開(kāi)的與粗糙集有關(guān)的國際會(huì )議進(jìn)一步推動(dòng)了粗糙集的發(fā)展。越來(lái)越多的科技人員開(kāi)始了解并準備從事該領(lǐng)域的研究。目前,粗糙集已成為人工智能領(lǐng)域中一個(gè)較新的學(xué)術(shù)熱點(diǎn),在模式識別、機器學(xué)習、知識獲取、決策分析、過(guò)程控制等許多領(lǐng)域得到了廣泛的應用。
參考文獻[7]提出了一種模式識別理論的新模型,它是基于“認識”事物而不是基于“區分”事物為目的。與傳統以“最佳劃分”為目標的統計模式識別相比,它更接近于人類(lèi)“認識”事物的特性,故稱(chēng)為“仿生模式識別”。它的數學(xué)方法在于研究特征空間中同類(lèi)樣本的連續性(不能分裂成兩個(gè)彼此不鄰接的部分)特性。文中用“仿生模式識別”理論及其“高維空間復雜幾何形體覆蓋神經(jīng)網(wǎng)絡(luò )”識別方法,對地平面剛性目標全方位識別問(wèn)題作了實(shí)驗。對各種形狀相像的動(dòng)物及車(chē)輛模型作全方位8 800次識別,結果正確識別率為99.75%,錯誤識別率與拒識率分別為0與0.25%。
在特征生成上,發(fā)展出許多新的技術(shù),包括基于小波、小波包、分形的特征,以及獨立分量分析。其他研究,也都取得了長(cháng)足的進(jìn)展,諸如關(guān)子支持向量機,變形模板匹配,線(xiàn)性以及非線(xiàn)性分類(lèi)器的設計,包括貝葉斯分類(lèi)器、多層感知器,決策樹(shù)和RBF網(wǎng)絡(luò ),獨立于上下文的分類(lèi),包括動(dòng)態(tài)規劃和隱馬爾科夫建模技術(shù)。
2.3 機器視覺(jué)領(lǐng)域應用的拓展
機器視覺(jué)的應用研究,已經(jīng)拓展到幾乎每個(gè)可能的工業(yè)領(lǐng)域。最主要的應用行業(yè),為汽車(chē)、制藥、電子與電氣、制造、包裝/食品/飲料、醫學(xué)等。在現代工業(yè)自動(dòng)化生產(chǎn)中,涉及到各種各樣的檢查、測量和零件識別應用,例如汽車(chē)零配件尺寸檢查和自動(dòng)裝配的完整性檢查、電子裝配線(xiàn)的元件自動(dòng)定位、飲料瓶蓋的印刷質(zhì)量檢查、產(chǎn)品包裝上的條碼和字符識別等。這類(lèi)應用的共同特點(diǎn)是連續大批量生產(chǎn)、對外觀(guān)質(zhì)量的要求非常高。這種帶有高度重復性和智能性的工作,過(guò)去是靠人工檢測來(lái)完成。人工執行這些工序,在給工廠(chǎng)增加巨大的人工成本和管理成本的同時(shí),仍然不能保證100%的檢驗合格率(即“零缺陷”)。0.1%的缺陷的存在,對企業(yè)在市場(chǎng)上的競爭也是極為不利的。有些時(shí)候,如微小尺寸的精確快速測量、形狀匹配、顏色辨識等,用人眼根本無(wú)法連續穩定地進(jìn)行。機器視覺(jué)的引入,代替傳統的人工檢測方法,避免了人眼的視覺(jué)疲勞。由于機器視覺(jué)系統可以快速獲取大量信息,而且易于自動(dòng)處理,也易于同設計信息以及加工控制信息集成,因此,在現代自動(dòng)化生產(chǎn)過(guò)程中,機器視覺(jué)系統廣泛地應用于工況監視、成品檢驗和質(zhì)量控制等領(lǐng)域。機器視覺(jué)系統的特點(diǎn)是提高生產(chǎn)的柔性和自動(dòng)化程度。在一些不適合人工作業(yè)的危險工作環(huán)境或人工視覺(jué)難以滿(mǎn)足要求的場(chǎng)合,常用機器視覺(jué)來(lái)替代人工視覺(jué);同時(shí)在大批量工業(yè)生產(chǎn)過(guò)程中,用人工視覺(jué)檢查產(chǎn)品質(zhì)量效率低且精度不高,用機器視覺(jué)檢測方法可以大大提高生產(chǎn)效率和生產(chǎn)的自動(dòng)化程度。而且機器視覺(jué)易于實(shí)現信息集成,是實(shí)現計算機集成制造的基礎技術(shù),極大地提高了投放市場(chǎng)的產(chǎn)品質(zhì)量,提高了生產(chǎn)效率。典型的線(xiàn)徑的在線(xiàn)檢測與控制,如被加工工件的直徑測量、銅線(xiàn)的拉線(xiàn)線(xiàn)徑測量與控制,傳統的接觸式測量方法存在缺陷,人工在線(xiàn)測量是不可能的。采用線(xiàn)陣CCD線(xiàn)徑測量方法,是較早期機器視覺(jué)成功應用的例證。機器視覺(jué)的特點(diǎn)是自動(dòng)化、客觀(guān)、非接觸和高精度,與一般意義上的圖像處理系統相比,機器視覺(jué)強調的是精度和速度,以及工業(yè)現場(chǎng)環(huán)境下的可靠性。機器視覺(jué)極適用于大批量生產(chǎn)過(guò)程中的測量、檢查和辨識。線(xiàn)陣CCD在連續、掃描在線(xiàn)測量中的應用非常具有優(yōu)勢,如面積測量[8],不僅得到的結果準確,而且實(shí)時(shí)、快捷。再如,零件裝配完整性、裝配尺寸精度、零件加工精度、位置/角度測量、零件識別、特性/字符識別等。在零售業(yè)界,POS的終端設備,如條碼識讀機,也是線(xiàn)陣CCD在機器視覺(jué)上的典型應用。連續流動(dòng)流體測量,如,透明管道水的澄清度、異物測量,為自來(lái)水、工業(yè)污水水質(zhì)測量與控制,江河污染監測;此外,如在線(xiàn)食用油品油質(zhì)監測,為保證生產(chǎn)出合格的油品提供保障。
隨著(zhù)圖像處理和模式識別理論研究的進(jìn)展,采用二維圖像的機器視覺(jué)系統在最近幾年得到了成功應用。如指紋、掌紋、虹膜和人臉等食物特征識別的機器視覺(jué)系統,已經(jīng)在機場(chǎng)、車(chē)站安檢、考勤、門(mén)禁認證、海關(guān)通關(guān)等場(chǎng)合使用;在恐怖主義威脅下,不僅對人的識別更加重視,貨物運輸中也逐步考慮使用更加先進(jìn)的機器視覺(jué)系統,如,采用計算機斷層掃描技術(shù)的貨物安檢和成分識別研究正在開(kāi)展。
在醫學(xué)診療過(guò)程中,病癥的識別離不開(kāi)機器視覺(jué)系統的使用。如,超聲波、CT、磁共振、基于CCD的內窺鏡等裝備,在大、中型醫院已經(jīng)獲得普遍推廣。
目前,國際上視覺(jué)系統的應用方興未艾,國內,機器視覺(jué)系統也進(jìn)入應用的快速發(fā)展期,主要的視覺(jué)系統采用進(jìn)口,不同類(lèi)型的應用,均可以采取購買(mǎi)成熟系統的方法。國內形成產(chǎn)品的視覺(jué)系統主要有,用于糧食的色選機、線(xiàn)徑測量系統等。
3 機器視覺(jué)系統及典型應用分析
機器視覺(jué)系統形式多樣,在不同的場(chǎng)景中應用所采用攝像裝置也是不同的。主要區分為,線(xiàn)陣和面陣兩類(lèi)。工業(yè)視覺(jué)大多數使用線(xiàn)陣系統。下面列出部分使用線(xiàn)陣和面陣視覺(jué)系統的應用。
3.1 機器視覺(jué)的典型應用
(1) 紡織與服裝
? 斷紗檢測;
? 織染檢測;
? 布料、皮革形狀檢測。
(2) 食品與糧食
? 糧食異物檢測、分揀與色選;
? 飲料液位檢測;
? 生產(chǎn)日期、保質(zhì)期字符識別;
? 灌裝線(xiàn)上空瓶的破損、潔凈檢測。
(3) 特種檢驗
? 纜繩磨損與破損檢測;
? 容器與管道探傷;
? 游樂(lè )設施速度檢測;
? 危險裝備的在線(xiàn)狀態(tài)檢測。
(4) 包裝
? 外觀(guān)完整性檢測;
? 條碼識別;
? 嘜頭、密封性檢測。
(5) 機械制造
? 零部件外形尺寸檢測;
? 裝配完整性檢測;
? 部件的定位與姿態(tài)識別;
? 零件、發(fā)動(dòng)機、底盤(pán)等編號的同色凹字符識別。
(6) 郵政分揀
? 郵政編碼識別;
? 包裹物品檢測。
(7) 海關(guān)與口岸
? 指紋、掌紋、虹膜與人臉識別;
? 貨物識別;
? 安檢危險物品檢測。
此外,機器視覺(jué)還廣泛應用于集成電路檢測、航空航天、軍事國防、消防和公路交通等。下面通過(guò)一個(gè)具體的視覺(jué)系統來(lái)說(shuō)明。
3.2 機器視覺(jué)在汽車(chē)輔助自動(dòng)駕駛中的應用
在汽車(chē)的輔助自動(dòng)駕駛中,機器視覺(jué)系統的典型應用,如圖2所示。機器視覺(jué)系統在其中的主要任務(wù)在于,完成對車(chē)輛前方、車(chē)輛后方和兩側,以及車(chē)內駕駛員行為等各種視覺(jué)信息的獲取和處理,并完成輔助駕駛指令的發(fā)出。其中前方車(chē)輛和路況信息對安全駕駛起著(zhù)關(guān)鍵作用。汽車(chē)輔助自動(dòng)駕駛,是未來(lái)發(fā)展智能汽車(chē)的前提和基礎。
著(zhù)重介紹該立體視覺(jué)系統,該系統已經(jīng)完成實(shí)驗室研究[9]。示意圖如圖3所示。在車(chē)輛前向對稱(chēng)位置,左右裝置雙目視覺(jué)的立體視覺(jué)系統。獲取前方的車(chē)輛和路況信息,也包括道路標志信息。其基本原理是用兩臺CCD攝像機以不同角度獲取物體圖像,通過(guò)空間物點(diǎn)在兩幅圖像中對應像點(diǎn)之間的幾何位置關(guān)系來(lái)重構該物點(diǎn)的空間三維坐標。根據本車(chē)的速度和與前方車(chē)輛的相對位置或距離,不斷檢測前方視場(chǎng)范圍內的車(chē)輛和環(huán)境信息,得到前方車(chē)輛的速度、車(chē)輛的高寬尺寸,并獲取前方路況其他信息,如道路標志信息,路面障礙物信息等。根據得到的綜合信息,輔助駕駛人員采取安全、有效的操控方式。達到高精度三維定位的一個(gè)關(guān)鍵前提是特征向量的選取以及高精度立體匹配。
圖2 輔助自動(dòng)駕駛的路況示意圖
過(guò)程如下:首先完成對采集到的圖像進(jìn)行灰度變換、直方圖增強、平滑濾波等必要的預處理。需要指出的是,由于序列圖像本身含有各種噪聲干擾,且當目標運動(dòng)速度過(guò)快時(shí)可能產(chǎn)生圖像的“拉毛”現象,所以需要對圖像進(jìn)行平滑濾波。應用較多的高斯濾波器雖然能抑制高斯噪聲,但它不能消除任何毛刺現象??紤]這種情況,系統采用了快速中值濾波(FM)算法。它的思想是,把數字圖像中一個(gè)像素點(diǎn)的灰度值,用該點(diǎn)鄰域中各點(diǎn)的中值替代,其中每次窗口沿著(zhù)行平移一列后進(jìn)行排序時(shí),實(shí)際窗口內容變化的只是丟棄了最左側的列取而代之的是一個(gè)新的右側列,而其余的窗口下的像素值沒(méi)有改變。該算法是一種很好的非線(xiàn)性濾波方法,可極大減小運算量,能消除脈沖干擾造成的孤立噪聲,以及疊加白噪聲和長(cháng)尾疊加噪聲,并可克服線(xiàn)性濾波器濾波結果中細節模糊的問(wèn)題,能較好地保護邊界信息。經(jīng)過(guò)預處理后的圖像序列成為可供計算機分析處理的圖像。
圖3 輔助自動(dòng)駕駛的立體視覺(jué)系統示意圖
接下來(lái)是圖像分割。主要實(shí)現運動(dòng)區域、前方各種目標信息的檢測。圖像采集是在自然條件下進(jìn)行的,考慮圖像采集時(shí)間間隔短且總的采集時(shí)間不長(cháng),因此可以忽略視場(chǎng)內光線(xiàn)、背景等變化因素的干擾。實(shí)際工作中對于精確性和實(shí)時(shí)性的要求,采用了計算量小并且檢測結果不受運動(dòng)目標速度限制的差影法來(lái)進(jìn)行運動(dòng)檢測,再利用迭代求得最佳灰度閾值對結果幀分割并二值化。
分割后的圖像仍有可能含有少量的背景噪聲干擾,進(jìn)一步用形態(tài)學(xué)方法對其進(jìn)行去噪。采用的結構元素是3×3的中心對稱(chēng)結構。經(jīng)過(guò)先閉后開(kāi)(經(jīng)實(shí)驗驗證:這比先開(kāi)后閉得到的圖像目標連通區域更光滑)的運算后的圖像中基本上只留下完整的運動(dòng)目標。
還需要通過(guò)提取適當的特征向量以及立體匹配來(lái)實(shí)目標的精確定位。主要步驟如下:
特征提取和目標分類(lèi),先采用串行邊界分割技術(shù)對圖像中所有連通器區域進(jìn)行邊界跟蹤運算,再求出各個(gè)連通區域的外接矩形和灰度面積等參數。對于多個(gè)運動(dòng)目標的檢測,可在求外接矩形的過(guò)程中,根據實(shí)際目標的形狀大小、外接矩形尺寸和灰度面積進(jìn)行匹配,以區分不同物體;
立體匹配是立體視覺(jué)中最重要,也是最困難的步驟,是個(gè)不適定問(wèn)題。當空間三維場(chǎng)景被投影為二維圖像時(shí),同一景物在不同視點(diǎn)下的圖像中會(huì )有很大的不同。為了求解對應,人們通過(guò)增加適當的約束條件(如外極線(xiàn)約束、一致性約束、唯一性約束、連續性約束等)來(lái)減少誤匹配。本系統,在外極線(xiàn)約束的條件下再給出兩個(gè)約束:
? 方向性約束 由立體成像的幾何特性知,對于場(chǎng)景中的同一空間物體點(diǎn),其在左圖像中的透視投影將相對于右圖像水平方向移動(dòng)距離d?;谠撎匦?,在尋求左(右)圖像中各特征點(diǎn)在右(左)圖像中的對應點(diǎn)時(shí),只需在右(左)圖像中其對應的外極線(xiàn)上,向左(右)一定范圍內搜索。而由于攝像機位置及其方向的測量誤差和不確定性,匹配點(diǎn)可能不會(huì )準確地出現在右(左)圖像平面中的外極線(xiàn)上,因此有必要在外極線(xiàn)的一個(gè)小鄰域內進(jìn)行搜索。
? 視差范圍約束 在運動(dòng)檢測之前的攝像機現場(chǎng)標定環(huán)節中,利用每個(gè)標定點(diǎn)在左右圖像中形成的視差,可以得到一個(gè)大致的視差范圍,從而給出一個(gè)視差范圍約束。倘若特征點(diǎn)的視差超出這一范圍,就認為是誤匹配加以舍去。
有了以上幾個(gè)附加約束,就可以把每一時(shí)刻物體在左右攝像機中的信息綜合起來(lái),圖像中對應的一小段極線(xiàn)附近搜索匹配點(diǎn),而不是在整個(gè)對應圖像上搜索。這樣可以有效避免誤匹配,縮短匹配時(shí)間。
4 結語(yǔ)
機器視覺(jué)是圖像技術(shù)、模式識別技術(shù),以及計算機技術(shù)發(fā)展的新的產(chǎn)物,是實(shí)現智能化、自動(dòng)化、信息化的先進(jìn)技術(shù)領(lǐng)域。機器視覺(jué)系統的應用,大大提高裝備的智能化、自動(dòng)化誰(shuí)拼,提高裝備的使用效率、可靠性等性能。隨著(zhù)新的技術(shù)、新的理論在機器視覺(jué)系統中的應用,機器視覺(jué)將在國民經(jīng)濟的各個(gè)領(lǐng)域發(fā)揮更大的作用,一方面可以帶來(lái)新的產(chǎn)業(yè)增長(cháng)點(diǎn),向市場(chǎng)推廣滿(mǎn)足各種需求的機器視覺(jué)系統產(chǎn)品,產(chǎn)生直接的經(jīng)濟效益;另一方面,通過(guò)機器視覺(jué)系統的應用,更加有效地發(fā)揮自動(dòng)化裝備的效能,提升自動(dòng)化生產(chǎn)水平,提高產(chǎn)品質(zhì)量,帶動(dòng)整個(gè)產(chǎn)業(yè)的生產(chǎn)效率大幅提高。
參考文獻:
[1] David A. Forsyth, Jean Ponce. Computer Vision[M]. Prentice Hall, Inc.,2003.
[2] 劉艾, 馬偉方, 施文康. 基于聲表面波傳感的無(wú)線(xiàn)標簽識別系統[J]. 上海交通大學(xué)學(xué)報,2001,35(5).
[3] 王慶有. CCD應用技術(shù)[M].天津大學(xué)出版社, 2000,11.
[4] 章毓晉. 圖像理解與計算機視覺(jué)[M] 清華大學(xué)出版社,2000.
[5] 顏發(fā)根,丁少華,陳樂(lè ),劉建群. 基于PC的機器視覺(jué)系統[J]. PLC& FA,2004,7.
[6] 邊肇其,張學(xué)工. 模式識別[M]. 清華大學(xué)出版社,1999.
[7] 王守覺(jué). 仿生模式識別(拓撲模式識別)―一種模式識別新模型的理論與應用[J]. 電子學(xué)報,2002,30(10).
[8] 關(guān)勝曉. 不規則形體面積的CCD測量研究[J]. 儀表技術(shù)與傳感器,1998(11).