結構分析系統
[拼音]:moshi shibie
[英文]:pattern recognition
用數學、物理和技術的方法實現對模式的自動處理、描述、分類和解釋,是資訊科學的一個分支(見模式分析)。模式是資訊賴以存在和傳遞的形式,諸如波譜訊號、圖形、文字、物體的形狀、行為的方式、過程的狀態等都屬於模式的範疇。人們通過模式感知外部世界的各種事物或現象,這是獲取知識、形成概念和作出反應的基礎。例如,人們通過觀察街上各種各樣的汽車就形成了“汽車”這個抽象類別的概念,並且具有把汽車和其他事物相區別的能力。這是一種思維和抽象過程。模式識別的目的就在於用機器部分地實現人的這種智慧活動。模式識別不僅有很大的實用價值,而且對於探索人類對外部環境感知能力的機理也有重要的意義。早期的模式識別研究強調模擬人腦形成概念和識別模式的心理和生理過程。50年代末,F.羅森布拉特提出的感知器既是一個模式識別系統,也是把它作為人腦的數學模型來研究的。但隨著實際應用的需要和計算機技術的發展,模式識別研究多采用不同於生物控制論、生理學和心理學等方法的數學技術方法。1957年,周紹康首先提出用決策理論方法對模式進行識別。1962年R.納拉西曼提出模式識別的句法方法,此後美籍華人學者傅京孫深入地開展了這方面的研究並於1974年出版第一本專著《句法模式識別及其應用》。現代發展的各種模式識別方法基本上都可以歸納為決策理論方法和結構方法兩大類。無論哪一種方法都首先需要用感測器把有關模式的各種資訊(測量得到的資料)輸入到計算機中。所有這些資料的總體組成了測量空間。這是機器對模式進行加工的基礎。
決策理論方法
通過對輸入到計算機的資料進行數學上的運算,可以得到一組(d個)更能反映模式本質或對分類更為有效的特徵(見特徵抽取),並把這d個特徵看作是一個特徵向量x=(x1, x2,…, xd)的分量,所有表示模式的特徵向量組成特徵空間,這樣就把被識別的模式分配到 c個類中的某一類中去。這個任務轉變為一個把d維空間劃分成c個獨立區域的問題。當代表一個模式的特徵向量落在區域Sj時,該模式被分配為j類,j=1,2,…,c。現代已有多種劃分類別區域的方法,它們的共同特點是通過學習一定數量的樣本,根據某個給定的判據(例如要求平均錯誤分類的概率最小)求取相應的決策規則(見統計模式識別)。這類方法的缺點是忽視了模式的結構特性。
結構識別方法
用模式結構的觀點分析輸入到計算機的測量資料,提取和選擇一組能最有效地描寫模式結構性質的基元,並用基元間的一組關係來定義一個模式類。在簡單的情況下這組關係式可能是布林表示式。在較複雜的情況下,基元之間的關係可能要由一組文法(句法)規則來表達。 這種特定情況下的結構模式識別方法也稱為句法模式識別方法。
為了有效地解決現實的模式識別問題,常需要把決策理論方法與結構方法結合起來。引入文法與句子之間的距離度量、誤差修正文法和屬性文法等概念,就為綜合利用這兩種方法的優點創造了條件。此外,在分類過程中引入模糊集概念,可以產生一種沒有排他性的分類結果。模式識別在工業、遙感、醫學等各個領域都有廣泛的應用前途。
參考書目
傅京孫著,戴汝為、胡啟恆譯:《模式識別及其應用》,科學出版社,北京,1983。
R.O.Duda and P.E.Hart,Pattern Classification and Scene Analysis,Wiley,New York,1973.
S.Watanabe,ed.,Frantiers of Pattern Recognition,Academic Press,1972.