• <blockquote id="fficu"><optgroup id="fficu"></optgroup></blockquote>

    <table id="fficu"></table>

    <sup id="fficu"></sup>
    <output id="fficu"></output>
    1. ACS880-07C
      關(guān)注中國自動(dòng)化產(chǎn)業(yè)發(fā)展的先行者!
      橫河電機-23年10月11日
      2024
      工業(yè)智能邊緣計算2024年會(huì )
      2024中國自動(dòng)化產(chǎn)業(yè)年會(huì )
      2023年工業(yè)安全大會(huì )
      OICT公益講堂
      當前位置:首頁(yè) >> 資訊 >> 行業(yè)資訊

      資訊頻道

      計算機視覺(jué)簡(jiǎn)述
      • 作者:潘春洪;張彩霞
      • 點(diǎn)擊數:2870     發(fā)布時(shí)間:2006-02-22 09:11:27
      • 分享到:
      簡(jiǎn)要地回顧了計算機視覺(jué)的發(fā)展史,并對它的兩個(gè)重要研究?jì)热荩亟ê妥R別作了重點(diǎn)介紹,最后列舉了一些應用實(shí)例。
      關(guān)鍵詞:



          人們常說(shuō):眼睛是心靈的窗戶(hù),通過(guò)眼睛人們可以輕易地交流情感,眼睛也是與外界交流的窗口,這些都是通過(guò)“看”來(lái)完成的。

          人們可以很容易“看到”一幅畫(huà),但這一“簡(jiǎn)單”過(guò)程并不如此簡(jiǎn)單,大致上它可以分為以下幾個(gè)階段:首先是通過(guò)眼睛將圖成像在視網(wǎng)膜上;其次大腦對圖像進(jìn)行理解;最后根據處理的結果做出反應。用比較專(zhuān)業(yè)一點(diǎn)的語(yǔ)言來(lái)描述,該過(guò)程包括了識別、描述與理解三個(gè)層次;這其中還隱含了邊緣檢測(各物體的輪廓等)、圖像的分割(各物體區域的劃分)等階段。以上實(shí)際上概述了視覺(jué)系統的三個(gè)層次,即低層階段:基于圖像特征提取及分割階段;中層階段:基于物體的幾何模型與圖像特性表達階段;高層階段:基于景物知識的描述、識別與理解階段,這是根據先驗知識介入的程度劃分的,且實(shí)現起來(lái)也越來(lái)越困難。

          毫無(wú)疑問(wèn),如何人工實(shí)現這一過(guò)程是極具挑戰性和應用前景的一項工作,計算機視覺(jué)也因此而應運而生。計算機視覺(jué)是研究用計算機和成像設備來(lái)模擬人和生物視覺(jué)系統功能的技術(shù)學(xué)科,其目標是從圖像或圖像序列中獲取對外部世界的認知和理解,即利用二維圖像恢復三維環(huán)境中物體的幾何信息,比如形狀、位置、姿態(tài)、運動(dòng)等,并能描述、識別與理解。

          計算機視覺(jué)的基礎是各種成像設備,例如CCD(Charge Coupled Device )攝像機(數碼相機屬于此類(lèi)型)、紅外攝像機、醫學(xué)上常用的核磁共振成像、X射線(xiàn)成像等,這些設備不僅可以成像,還可以獲取比人眼更豐富的圖像,人們可以形象地把攝像機看成計算機視覺(jué)的視網(wǎng)膜部分??梢哉f(shuō)從人類(lèi)拍攝出第一幅圖像開(kāi)始,就為計算機視覺(jué)的誕生奠定了基礎。

          而計算機視覺(jué)的核心是數字電子計算機,其發(fā)展可謂突飛猛進(jìn),在計算和存儲能力上,人腦已經(jīng)無(wú)法與之相比,人們的目標就是利用計算機非凡的計算處理能力來(lái)代替人腦實(shí)現對圖像的理解,而計算機日新月異的發(fā)展也使得這一愿望越來(lái)越成為可能。

          用于指導“計算機”這個(gè)大腦運作的核心是計算機視覺(jué)的理論方法,計算機視覺(jué)使用的理論方法主要基于幾何、概率和運動(dòng)學(xué)計算與三維重構的視覺(jué)計算理論,它的基礎包括射影幾何學(xué)、剛體運動(dòng)力學(xué)、概率論與隨機過(guò)程、圖像處理、人工智能等理論。 在20世紀70年代,視覺(jué)研究大多采用模式識別的方法;80年代,開(kāi)始采用空間幾何的方法以及物理知識進(jìn)行視覺(jué)研究;90年代以后,隨著(zhù)智能機器人視覺(jué)研究的發(fā)展,引入了許多新的理論與技術(shù)如主動(dòng)視覺(jué)理論、不變量理論、融合技術(shù)等,并應用于許多計算機視覺(jué)系統中。

          研究計算機視覺(jué),不得不提的是英國已故科學(xué)家戴維?馬爾(David Marr),他在計算機視覺(jué)發(fā)展史上可謂寫(xiě)下了濃重的一筆。在20世紀70年代末,他提出了第一個(gè)較為完善的視覺(jué)系統框架,即計算視覺(jué)理論框架。他認為視覺(jué)是一個(gè)復雜的信息處理過(guò)程,并有不同的信息表達方式和不同層次的處理過(guò)程,而最終的目的是實(shí)現計算機對外部世界的描述。由此,他提出了三個(gè)層次的研究方法,即計算理論層、表征與算法層以及實(shí)現層。并且設想出了自下而上,沒(méi)有反饋的視覺(jué)處理框架,他認為視覺(jué)的主要任務(wù)是獲得物體的三維形狀,并把獲取過(guò)程分為三個(gè)階段,即原始基元圖(primal sketch)→2.5維圖( 2.5dimensional sketch)→3維模型表示。其中,基元圖由二維圖像中的邊緣點(diǎn)、直線(xiàn)、曲線(xiàn)、頂點(diǎn)等基本幾何元素或特征組成;2.5維圖是指對基元圖進(jìn)行一系列處理運算,推導出可見(jiàn)表面的朝向、輪廓等幾何信息,是在觀(guān)察者坐標系下描述的部分的、不完整的三維物體形狀(另一部分是物體的背面或被遮擋的部分);3維模型表示則描述物體坐標系下的各種形狀及其空間組織。

          迄今為止,研究者們在Marr計算視覺(jué)理論框架下,進(jìn)行了大量的研究,并取得了豐富的成果,最矚目也最完善的成果當屬基于幾何方法的計算機視覺(jué)理論體系。



      圖1 攝像機成像的針孔模型




          日常生活中最常用的成像設備-數碼相機的理想成像模型是針孔模型,很多視覺(jué)研究?jì)热荻际窃谶@種模型下進(jìn)行的。如圖1所示,可以看出:景物點(diǎn)、針孔、景物點(diǎn)的像三點(diǎn)共線(xiàn)。為了方便起見(jiàn),通常認為圖像平面在針孔的前面,即虛擬圖像的位置,除了是相互倒立的外,二者是完全等價(jià)的。利用成像設備,獲取了圖像,這時(shí)圖像點(diǎn)的位置已經(jīng)確定,如果針孔的位置也可以確定的話(huà),那么根據三點(diǎn)共線(xiàn)的約束,可知景物點(diǎn)一定在這條射線(xiàn)上,但是這條射線(xiàn)上的每一點(diǎn)成像都是相同的,所以?xún)H從一幅圖像是無(wú)法確定景物點(diǎn)距離攝像機光心(即針孔位置)的深度的。這樣,若再有一幅包含上述景物點(diǎn)的圖像(同一景物點(diǎn)在不同相機下的像稱(chēng)為一對對應點(diǎn)),則存在另一條射線(xiàn),兩條射線(xiàn)相交,從而可以確定出景物點(diǎn)的空間位置,如圖2所示,對于兩幅或多幅圖像上的每對對應點(diǎn)都進(jìn)行類(lèi)似的處理,則可獲得物體的三維形狀信息,如圖3所示。這種由兩幅或多幅兩維圖像恢復物體三維幾何形狀的方法,即是立體視覺(jué)方法,這一過(guò)程就是三維重建。其間包含了許多步工作,例如特征提取、匹配、攝像機標定、運動(dòng)估計等,每一步都凝結了眾多研究者的心血,并取得了大量?jì)?yōu)秀的研究成果,像Canny邊緣檢測算子,Harris角點(diǎn)檢測,Tsai塊標定,張正友的平面模板標定等。



      圖2 立體視覺(jué)



       



      圖3  兩幅圖像的三維重建




          在Marr計算視覺(jué)理論框架下,觀(guān)測者(計算機)只是被動(dòng)地分析獲取的靜態(tài)圖像,并不對成像設備(攝像機)做任何控制,這使得許多視覺(jué)任務(wù)(如識別、導航等)難以完成??梢韵胍幌氯祟?lèi)的視覺(jué),人們在看的時(shí)候,眼球通常不自覺(jué)地或半自覺(jué)地跳動(dòng)或轉動(dòng),這說(shuō)明大腦在主動(dòng)且交互式地接受外界的信息。因此,有學(xué)者提出了主動(dòng)視覺(jué)、有目的的視覺(jué)、定性視覺(jué)等理論,但主動(dòng)視覺(jué)的研究往往與有目的的以及定性視覺(jué)的研究結合在一起。在主動(dòng)視覺(jué)系統中,攝像機的狀態(tài)參數如焦距、縮放、聚散度都可以控制,加之具有可以精確控制的平臺,使得許多不適定的視覺(jué)任務(wù)變?yōu)檫m定的。圖4為一主動(dòng)視覺(jué)平臺,下方是一小車(chē),最上方是兩個(gè)攝像機,計算機可以控制車(chē)和攝像機的運動(dòng)、調整攝像機的注視點(diǎn),并通過(guò)精確控制平臺的運動(dòng),可以獲得攝像機的運動(dòng)參數,從而使一些原本是非線(xiàn)性的問(wèn)題變成線(xiàn)性問(wèn)題,提高了計算速度和準確性,這對實(shí)時(shí)地獲取外界信息并做出反應(如避障)是非常重要的。



      圖4 主動(dòng)視覺(jué)系統平臺




          除了重建,視覺(jué)的另一個(gè)任務(wù)是識別。其基本方法是首先建立物體模型,然后使用各種匹配算法從圖像中識別出與物體模型最相似的物體。這里,就用到了先驗知識,即識別前,物體模型需事先存儲在計算機中,這是很顯然的事情。平常人們能從圖中認出事物,是因為大腦對它們的特征有了事先的認識。在物體識別中,“假設檢驗”是一種很重要的識別方法,又稱(chēng)為基于模型的識別方法,如圖5所示。從圖像進(jìn)行重建人們已經(jīng)粗略地作了介紹,用其重建出的部分模型與模型庫中的物體模型作比較,方法是先“假設”,后“檢驗”,即假設待識物體是模型庫中的某個(gè)物體,然后為了減少匹配時(shí)間,只利用部分幾何元素來(lái)判斷它們是否匹配,如果不匹配,則改變假設;反之,則用其他幾何元素在圖像中對該匹配做“檢驗”,以此來(lái)判斷是否需要再修改假設,并重復上述過(guò)程。因此,這是一種自下而上與自上而下策略的結合。



      圖5  假設檢驗方法




          可以看出,識別過(guò)程涉及了視覺(jué)中從低到高所有層次,它是當前計算機視覺(jué)領(lǐng)域最困難但也是最活躍的領(lǐng)域。之所以困難,可以借用宋朝著(zhù)名詩(shī)人蘇軾的一首詩(shī)概括:“橫看成嶺側成峰,遠近高低各不同”,這說(shuō)明同一事物,因觀(guān)測的角度不同甚至會(huì )產(chǎn)生截然相反的圖像,但是即使同一幅圖像,也可能有天壤之別的感受,如圖6所示,左圖中看起來(lái)凹的,而右圖像是凸的,但是這是同一幅圖像,只不過(guò)倒置了一下,但卻讓人們看到了如此有趣的現象。



      圖6  一對倒置圖




          由于計算機視覺(jué)系統發(fā)展遭遇到眾多瓶頸問(wèn)題,如:圖像分割的不穩定性、二維圖形到三維立體的病態(tài)問(wèn)題、機器缺少大規模并行處理能力等,使得現有的計算機視覺(jué)系統在識別能力、實(shí)時(shí)性上與人類(lèi)視覺(jué)相差甚遠,更不可比擬的是,選擇性注意的能力,即人類(lèi)視覺(jué)分分秒秒都在接受外界的信息,但是人們并不會(huì )對所有的信息都處理,而是對很多都會(huì )“視而不見(jiàn)”。從總體的理論研究和應用角度來(lái)說(shuō),國內外在計算機視覺(jué)的研究水平還是處于起步階段,目前還沒(méi)有一個(gè)完整的理論體系能統一和解決所有的計算機視覺(jué)問(wèn)題。



      圖7  工業(yè)機器人識別和定位零件系統示意圖


      圖8  Rocky7

          雖然困難重重,然而計算機視覺(jué)技術(shù)正在蓬勃地發(fā)展著(zhù),且已經(jīng)有了廣泛的應用。例如:零件識別與定位,圖7是一個(gè)具有簡(jiǎn)單視覺(jué)的工業(yè)機器人系統示意圖,其視覺(jué)系統由一個(gè)位于零件傳輸帶上方的攝像機和相關(guān)的視覺(jué)信息處理系統組成。為了有利于視覺(jué)系統將零件從傳輸帶上分離出來(lái),并進(jìn)行識別和定位,可以選擇與零件顏色差別較大的傳輸帶。由于工業(yè)環(huán)境的結構、照明等因素可以嚴格地控制,使得這種機器人視覺(jué)系統在工業(yè)生產(chǎn)和裝配中得到了成功的應用;再如,移動(dòng)機器人導航,圖8是美國NASA/JPL開(kāi)發(fā)的Rocky7火星探測移動(dòng)機器人,在其后部、前部及桅桿上都安裝了一對黑白CCD攝像機,另外,在桅桿上還安裝了一個(gè)用于近距離成像的攝像機。借助于這些視覺(jué)系統,Rocky7可以進(jìn)行障礙檢測、自身車(chē)輛檢查、挖掘/傾倒核查等任務(wù);其他的象安全鑒別、監視與跟蹤;運動(dòng)分析;工業(yè)產(chǎn)品、農作物生長(cháng)及食品檢測;智能交通系統;娛樂(lè )等。更可喜的是,在我國,指紋識別已達到實(shí)用階段,人臉識別也已研究成功。
      目前,基于內容的圖像數據查詢(xún)、基于內容的圖像自動(dòng)索引等成為很熱門(mén)的研究和應用課題,可應用于數字圖書(shū)館、體育圖像自動(dòng)分析、運動(dòng)物體自動(dòng)跟蹤等系統,根據物體的二維圖像提取相應的特征不變量進(jìn)行識別和分類(lèi)也是一個(gè)十分重要的研究方向。同時(shí),三維物體識別也開(kāi)始進(jìn)入了實(shí)用階段??梢钥吹?,視覺(jué)技術(shù)在如此多的領(lǐng)域都已經(jīng)成功地得到了應用,而且越來(lái)越貼近生活,雖然這些還只是計算機視覺(jué)研究與應用的冰山一角,只是邁出了萬(wàn)里長(cháng)征的第一步,但人們有理由相信有一天計算機會(huì )擁有人一樣的視覺(jué)識別和理解能力,為人們帶來(lái)精彩的生活。

      參考文獻:

      [1]  馬頌德, 張正友. 計算機視覺(jué): 計算理論與算法基礎[M]. 科學(xué)出版社, 1997.

      [2]  賈云得, 機器視覺(jué)[M]. 科學(xué)出版社, 2000.

      [3]  D.馬爾著(zhù), 姚國正, 劉磊, 汪云九譯. 視覺(jué)計算理論[M]. 科學(xué)出版社, 1988.

      [4]  朱淼良, 計算機視覺(jué)[M]. 浙江大學(xué)出版社, 1997.

      [5]  D. A. Forsyth, J.Ponce著(zhù), 林學(xué)

      熱點(diǎn)新聞

      推薦產(chǎn)品

      x
      • 在線(xiàn)反饋
      1.我有以下需求:



      2.詳細的需求:
      姓名:
      單位:
      電話(huà):
      郵件:
      欧美精品欧美人与动人物牲交_日韩乱码人妻无码中文_国产私拍大尺度在线视频_亚洲男人综合久久综合天

    2. <blockquote id="fficu"><optgroup id="fficu"></optgroup></blockquote>

      <table id="fficu"></table>

      <sup id="fficu"></sup>
      <output id="fficu"></output>