影象識別技術論文

  隨著影象處理技術的迅速發展,影象識別技術的應用領域越來越廣泛。小編整理了,歡迎閱讀!

  篇一

  影象識別技術研究綜述

  摘要:隨著影象處理技術的迅速發展,影象識別技術的應用領域越來越廣泛。影象識別是利用計算機對影象進行處理、分析和理解,由於影象在成像時受到外部環境的影響,使得影象具有特殊性,複雜性。基於影象處理技術進一步探討影象識別技術及其應用前景。

  關鍵詞:影象處理;影象識別;成像

  中圖分類號:TP391 文獻標識碼:A 文章編號:1009-3044201310-2446-02

  影象是客觀景物在人腦中形成的影像,是人類最重要的資訊源,它是通過各種觀測系統從客觀世界中獲得,具有直觀性和易理解性。隨著計算機技術、多媒體技術、人工智慧技術的迅速發展,影象處理技術的應用也越來越廣泛,並在科學研究、教育管理、醫療衛生、軍事等領域已取得的一定的成績。影象處理正顯著地改變著人們的生活方式和生產手段,比如人們可以藉助於影象處理技術欣賞月球的景色、交通管理中的車牌照識別系統、機器人領域中的計算機視覺等,在這些應用中,都離不開影象處理和識別技術。影象處理是指用計算機對影象進行處理,著重強調影象與影象之間進行的交換,主要目標是對影象進行加工以改善影象的視覺效果併為後期的影象識別大基礎[1]。影象識別是利用計算機對影象進行處理、分析和理解,以識別各種不同模式的目標和對像的技術。但是由於獲取的影象本事具有複雜性和特殊性,使得影象處理和識別技術成為研究熱點。

  1 影象處理技術

  影象處理image processing利用計算機對影象進行分析,以達到所需的結果。影象處理可分為模擬影象處理和數字影象影象處理,而影象處理一般指數字影象處理。這種處理大多數是依賴於軟體實現的。其目的是去除干擾、噪聲,將原始影象程式設計適於計算機進行特徵提取的形式,主要包括影象取樣、影象增強、影象復原、影象編碼與壓縮和影象分割。

  1影象採集,影象採集是數字影象資料提取的主要方式。數字影象主要藉助於數字攝像機、掃描器、數碼相機等裝置經過取樣數字化得到的影象,也包括一些動態影象,並可以將其轉為數字影象,和文字、圖形、聲音一起儲存在計算機內,顯示在計算機的螢幕上。影象的提取是將一個影象變換為適合計算機處理的形式的第一步。

  2影象增強,影象在成像、採集、傳輸、複製等過程中影象的質量或多或少會造成一定的退化,數字化後的影象視覺效果不是十分滿意。為了突出影象中感興趣的部分,使影象的主體結構更加明確,必須對影象進行改善,即影象增強。通過影象增強,以減少影象中的影象的噪聲,改變原來影象的亮度、色彩分佈、對比度等引數。影象增強提高了影象的清晰度、影象的質量,使影象中的物體的輪廓更加清晰,細節更加明顯。影象增強不考慮影象降質的原因,增強後的影象更加賞欣悅目,為後期的影象分析和影象理解奠定基礎。

  3影象復原,影象復原也稱影象恢復,由於在獲取影象時環境噪聲的影響、運動造成的影象模糊、光線的強弱等原因使得影象模糊,為了提取比較清晰的影象需要對影象進行恢復,影象恢復主要採用濾波方法,從降質的影象恢復原始圖。影象復原的另一種特殊技術是影象重建,該技術是從物體橫剖面的一組投影資料建立影象。

  4影象編碼與壓縮,數字影象的顯著特點是資料量龐大,需要佔用相當大的儲存空間。但基於計算機的網路頻寬和的大容量儲存器無法進行資料影象的處理、儲存、傳輸。為了能快速方便地在網路環境下傳輸影象或視訊,那麼必須對影象進行編碼和壓縮。目前,影象壓縮編碼已形成國際標準,如比較著名的靜態影象壓縮標準JPEG,該標準主要針對影象的解析度、彩色影象和灰度影象,適用於網路傳輸的數碼相片、彩色照片等方面。由於視訊可以被看作是一幅幅不同的但有緊密相關的靜態影象的時間序列,因此動態視訊的單幀影象壓縮可以應用靜態影象的壓縮標準。影象編碼壓縮技術可以減少影象的冗餘資料量和儲存器容量、提高影象傳輸速度、縮短處理時間。

  5影象分割技術,影象分割是把影象分成一些互不重疊而又具有各自特徵的子區域,每一區域是畫素的一個連續集,這裡的特性可以是影象的顏色、形狀、灰度和紋理等。影象分割根據目標與背景的先驗知識將影象表示為物理上有意義的連通區域的集合。即對影象中的目標、背景進行標記、定位,然後把目標從背景中分離出來。目前,影象分割的方法主要有基於區域特徵的分割方法、基於相關匹配的分割方法和基於邊界特徵的分割方法[2]。由於採集影象時會受到各種條件的影響會是影象變的模糊、噪聲干擾,使得影象分割是會遇到困難。在實際的影象中需根據景物條件的不同選擇適合的影象分割方法。影象分割為進一步的影象識別、分析和理解奠定了基礎。

  2 影象識別技術

  影象識別是通過儲存的資訊記憶中儲存的資訊與當前的資訊當時進入感官的資訊進行比較實現對影象的識別[3]。前提是影象描述,描述是用數字或者符號表示影象或景物中各個目標的相關特徵,甚至目標之間的關係,最終得到的是目標特徵以及它們之間的關係的抽象表達。影象識別技術對影象中個性特徵進行提取時,可以採用模板匹配模型。在某些具體的應用中,影象識別除了要給出被識別物件是什麼物體外,還需要給出物體所處的位置和姿態以引導計算初工作。目前,影象識別技術已廣泛應用於多個領域,如生物醫學、衛星遙感、機器人視覺、貨物檢測、目標跟蹤、自主車導航、公安、銀行、交通、軍事、電子商務和多媒體網路通訊等。主要識別技術有:

  2.1 指紋識別

  指紋識別是生物識別技術中一種最實用、最可靠和價格便宜的識別手段,主要應用於身份驗證。指紋識別是生物特徵的一個部分,它具有不變性:一個人的指紋是終身不變的;唯一性:幾乎沒有兩個完全相同的指紋[3]。一個指紋識別系統主要由指紋取像、預處理與特徵提取、比對、資料庫管理組成。目前,指紋識別技術與我們的現實生活緊密相關,如信用卡、醫療卡、考勤卡、儲蓄卡、駕駛證、准考證等。

  2.2 人臉識別   目前大多數人臉識別系統使用可見光或紅外影象進行人臉識別,可見光影象識別效能很容易受到光照變化的影響。在戶外光照條件不均勻的情況下,其正確識別率會大大降低。而紅外影象進行人臉識別時可以克服昏暗光照條件變化影響,但由於紅外線不能穿透玻璃,如果待識別的物件戴有眼鏡,那麼在影象識別時,眼部資訊全部丟失,將嚴重影響人臉識別的效能[4]。

  2.3 文字識別

  文字識別是將模式識別、文書處理、人工智慧集與一體的新技術,可以自動地把文字和其他資訊分離出來,通過智慧識別後輸入計算機,用於代替人工的輸入。文字識別技術可以將紙質的文件轉換為電子文件,如銀行票據、文稿、各類公式和符號等自動錄入,可以提供文字的處理效率,有助於查詢、修改、儲存和傳播。文字識別方法主要有結構統計模式識別、結構模式識別和人工神經網路[5]。由於文字的數量龐大、結構複雜、字型字形變化多樣,使得文字識別技術的研究遇到一定的阻礙。

  3 結束語

  人類在識別現實世界中的各種事物或複雜的環境是一件輕而易舉的事,但對於計算機來講進行復雜的影象識別是非常困難的[6]。在環境較為簡單的情況下,影象識別技術取得了一定的成功,但在複雜的環境下,仍面臨著許多問題:如在影象識別過程中的影象分割演算法之間的效能優越性比較沒有特定的標準,以及演算法本身存在一定的侷限性,這使得影象識別的最終結果不十分精確等。

  參考文獻:

  [1] 胡愛明,周孝寬.車牌影象的快速匹配識別方法[J].計算機工程與應用,2003,397:90—91.

  [2] 胡學龍.數字影象處理[M].北京:電子工業出版社,2011.

  [3] 範立南,韓曉微,張廣淵.影象處理與模式識別[M].北京:科學出版社,2007.

  [4] 曉慧,劉志鏡.基於臉部和步態特徵融合的身份識別[J].計算機應用,2009,129:8.

  [5] 陳良育,曾振柄,張問銀.基於圖形理解的漢子構型自動分析系統[J].計算機應用,2005,257:1629-1631.

  [6] Sanderson C,Paliwal K K.Information Fusion and Person Verification Using Speech & Face Information[C].IDIAP-RR 02-33,Martigny,Swizerland,2002.

點選下頁還有更多>>>