格沃茲傑夫,Α.Α.
[拼音]:jiegou moshi shibie
[英文]:structural approach of pattern recognition
用模式的基本組成元素(基元)及其相互間的結構關係對模式進行描述和識別的方法。在多數情況下,可以有效地用形式語言理論中的文法表示模式的結構資訊,因此也常稱為句法模式識別。
一個句法模式識別系統包括預處理、模式表達、文法推斷和句法分析四個主要部分(圖1)。
預處理的功能是:
(1)模式的編碼和近似;
(2)過濾、復原和增強。通過編碼和近似,壓縮樣本資料;通過過濾、復原和增強,消除噪聲和復原缺損以利於下一級用句法方法對模式進行表達。模式表達部分由模式分割和基元(及關係)識別兩部分組成。為此,首先需要根據所研究的問題選定一組基元以及基元間的關係型別。例如可用圖2中的一組基元來描述染色體。若按順時針方向跟蹤染色體輪廓並以連線關係作為基元間的結構關係,則圖3中的次中性染色體可用鏈babcbabdacad表示。基元選擇如同統計模式識別中的特徵抽取那樣,對整個識別系統的效能有很大的影響。基元應該是基本的模式元素,能夠通過一定的結構關係(例如上述的連線關係)緊湊而方便地對模式加以描述,而且應該容易用非句法方法進行抽取或識別,其本身的結構資訊在所研究的問題中可以不必考慮。系統的另外兩個部分,即文法推斷和句法分析,構成句法模式識別理論的中心內容。文法推斷類似統計模式識別中的監督學習,通過已知類別的一組樣本推斷出描述該類模式的文法。適應實際應用的需要,有各種型別的模式文法。除了短語結構文法外,還有各種高維文法如樹文法、圖文法、網文法、叢狀文法以及加入了語義資訊的屬性文法。與文法推斷相結合,一種更廣泛形式的學習還可以得到有關模式類的最好的基元集合及其結構描述。句法分析是判斷輸入模式是否由學習過程中所推斷出來的文法產生的,因而是一個識別過程。在最簡單的情況下,可以用匹配器代替句法分析,這時在模式基元的意義上把輸入鏈x與每類的參考鏈匹配,把x歸類為與 x匹配得“最好”的參考鏈所屬的類。這種結構識別方法的特點是簡單、快速,但是沒有充分利用鏈的句法資訊,因此只有在能夠確定合適的參考鏈並有明確的匹配準則情況下才適用。
參考書目
傅京孫著,戴汝為、胡啟恆譯:《模式識別及其應用》,科學出版社,北京,1983。