什麼是模式識別模式識別的方法與應用

  模式識別是通過計算機用數學技術方法來研究模式的自動處理和判讀。那麼你對模式識別瞭解多少呢?以下是由小編整理關於什麼是模式識別的內容,希望大家喜歡!

  模式識別的簡介

  模式識別***英語:Pattern Recognition***,就是通過計算機用數學技術方法來研究模式的自動處理和判讀。我們把環境與客體統稱為“模式”。隨著計算機技術的發展,人類有可能研究複雜的資訊處理過程。資訊處理過程的一個重要形式是生命體對環境及客體的識別。對人類來說,特別重要的是對光學資訊***通過視覺器官來獲得***和聲學資訊***通過聽覺器官來獲得***的識別。這是模式識別的兩個重要方面。市場上可見到的代表性產品有光學字元識別、語音識別系統。

  人們在觀察事物或現象的時候,常常要尋找它與其他事物或現象的不同之處,並根據一定的目的把各個相似的但又不完全相同的事物或現象組成一類。字元識別就是一個典型的例子。例如數字“4”可以有各種寫法,但都屬於同一類別。更為重要的是,即使對於某種寫法的“4”,以前雖未見過,也能把它分到“4”所屬的這一類別。人腦的這種思維能力就構成了“模式”的概念。在上述例子中,模式和集合的概念是分未弄的,只要認識這個集合中的有限數量的事物或現象,就可以識別屬於這個集合的任意多的事物或現象。為了強調從一些個別的事物或現象推斷出事物或現象的總體,我們把這樣一些個別的事物或現象叫作各個模式。也有的學者認為應該把整個的類別叫作模去,這樣的“模式”是一種抽象化的概念,如“房屋”等都是“模式”,而把具體的物件,如人民大會堂,叫作“房屋”這類模式中的一個樣本。這種名詞上的不同含義是容易從上下文中弄淸楚的。

  模式識別是人類的一項基本智慧,在日常生活中,人們經常在進行“模式識別”。隨著20世紀40年代計算機的出現以及50年代人工智慧的興起,人們當然也希望能用計算機來代替或擴充套件人類的部分腦力勞動。***計算機***模式識別在20世紀60年代初迅速發展併成為一門新學科。

  模式識別是指對錶徵事物或現象的各種形式的***數值的、文字的和邏輯關係的***資訊進行處理和分析,以對事物或現象進行描述、辨認、分類和解釋的過程,是資訊科學和人工智慧的重要組成部分。

  模式識別的方法

  決策理論方法

  又稱統計方法,是發展較早也比較成熟的一種方法。被識別物件首先數字化,變換為適於計算機處理的數字資訊。一個模式常常要用很大的資訊量來表示。許多模式識別系統在數字化環節之後還進行預處理,用於除去混入的干擾資訊並減少某些變形和失真。隨後是進行特徵抽取,即從數字化後或預處理後的輸入模式中抽取一組特徵。所謂特徵是選定的一種度量,它對於一般的變形和失真保持不變或幾乎不變,並且只含儘可能少的冗餘資訊。特徵抽取過程將輸入模式從物件空間對映到特徵空間。這時,模式可用特徵空間中的一個點或一個特徵矢量表示。這種對映不僅壓縮了資訊量,而且易於分類。在決策理論方法中,特徵抽取佔有重要的地位,但尚無通用的理論指導,只能通過分析具體識別物件決定選取何種特徵。特徵抽取後可進行分類,即從特徵空間再對映到決策空間。為此而引入鑑別函式,由特徵向量計算出相應於各類別的鑑別函式值,通過鑑別函式值的比較實行分類。

  句法方法

  又稱結構方法或語言學方法。其基本思想是把一個模式描述為較簡單的子模式的組合,子模式又可描述為更簡單的子模式的組合,最終得到一個樹形的結構描述,在底層的最簡單的子模式稱為模式基元。在句法方法中選取基元的問題相當於在決策理論方法中選取特徵的問題。通常要求所選的基元能對模式提供一個緊湊的反映其結構關係的描述,又要易於用非句法方法加以抽取。顯然,基元本身不應該含有重要的結構資訊。模式以一組基元和它們的組合關係來描述,稱為模式描述語句,這相當於在語言中,句子和短語用詞組合,詞用字元組合一樣。基元組合成模式的規則,由所謂語法來指定。一旦基元被鑑別,識別過程可通過句法分析進行,即分析給定的模式語句是否符合指定的語法,滿足某類語法的即被分入該類。

  模式識別方法的選擇取決於問題的性質。如果被識別的物件極為複雜,而且包含豐富的結構資訊,一般採用句法方法;被識別物件不很複雜或不含明顯的結構資訊,一般採用決策理論方法。這兩種方法不能截然分開,在句法方法中,基元本身就是用決策理論方法抽取的。在應用中,將這兩種方法結合起來分別施加於不同的層次,常能收到較好的效果。

  統計模式識別

  統計模式識別***statistic pattern recognition***的基本原理是:有相似性的樣本在模式空間中互相接近,並形成“集團”,即“物以類聚”。其分析方法是根據模式所測得的特徵向量Xi=***xi1,xi2,…,xid***T***i=1,2,…,N***,將一個給定的模式歸入C個類ω1,ω2,…, ωc中,然後根據模式之間的距離函式來判別分類。其中,T表示轉置;N為樣本點數;d為樣本特徵數。

  統計模式識別的主要方法有:判別函式法,近鄰分類法,非線性對映法,特徵分析法,主因子分析法等。

  在統計模式識別中,貝葉斯決策規則從理論上解決了最優分類器的設計問題,但其實施卻必須首先解決更困難的概率密度估計問題。BP神經網路直接從觀測資料***訓練樣本***學習,是更簡便有效的方法,因而獲得了廣泛的應用,但它是一種啟發式技術,缺乏指定工程實踐的堅實理論基礎。統計推斷理論研究所取得的突破性成果導致現代統計學習理論——VC理論的建立,該理論不僅在嚴格的數學基礎上圓滿地回答了人工神經網路中出現的理論問題,而且匯出了一種新的學習方法——支援向量機***SVM***。

  模式識別的應用

  模式識別可用於文字和語音識別、遙感和醫學診斷等方面。

  ① 文字識別

  漢字已有數千年的歷史,也是世界上使用人數最多的文字,對於中華民族燦爛文化的形成和發展有著不可磨滅的功勳。所以在資訊科技及計算機技術日益普及的今天,如何將文字方便、快速地輸入到計算機中已成為影響人機介面效率的一個重要瓶頸,也關係到計算機能否真正在我國得到普及的應用。目前,漢字輸入主要分為人工鍵盤輸入和機器自動識別輸入兩種。其中人工鍵入速度慢而且勞動強度大;自動輸入又分為漢字識別輸入及語音識別輸入。從識別技術的難度來說,手寫體識別的難度高於印刷體識別,而在手寫體識別中,離線手寫體的難度又遠遠超過了聯機手寫體識別。到目前為止,除了離線手寫體數字的識別已有實際應用外,漢字等文字的離線手寫體識別還處在實驗室階段。

  ② 語音識別

  語音識別技術技術所涉及的領域包括:訊號處理、模式識別、概率論和資訊理論、發聲機理和聽覺機理、人工智慧等等。近年來,在生物識別技術領域中,聲紋識別技術以其獨特的方便性、經濟性和準確性等優勢受到世人矚目,並日益成為人們日常生活和工作中重要且普及的安驗證方式。而且利用基因演算法訓練連續隱馬爾柯夫模型的語音識別方法現已成為語音識別的主流技術,該方法在語音識別時識別速度較快,也有較高的識別率。

  ③ 指紋識別

  我們手掌及其手指、腳、腳趾內側表面的面板凹凸不平產生的紋路會形成各種各樣的圖案。而這些面板的紋路在圖案、斷點和交叉點上各不相同,是唯一的。依靠這種唯一性,就可以將一個人同他的指紋對應起來,通過比較他的指紋和預先儲存的指紋進行比較,便可以驗證他的真實身份。一般的指紋分成有以下幾個大的類別:環型***loop***,螺旋型***whorl***,弓型***arch***,這樣就可以將每個人的指紋分別歸類,進行檢索。指紋識別基本上可分成:預處理、特徵選擇和模式分類幾個大的步驟。

  ③ 遙感

  遙感影象識別已廣泛用於農作物估產、資源勘察、氣象預報和軍事偵察等。

  ④ 醫學診斷

  在癌細胞檢測、X射線照片分析、血液化驗、染色體分析、心電圖診斷和腦電圖診斷等方面,模式識別已取得了成效。


模式識別的方法與應用