傳輸媒介

[拼音]:tezheng chouqu

[英文]:feature extraction

對輸入模式的原始測量資料(訊號)所進行的一組變換,以便在比原始訊號維數較低的特徵空間對模式進行有效的描述或分類(見統計模式識別)。特徵抽取可以用一級或多級變換實現,在多級的情況下,上一級的輸出就成為下一級的輸入。較低維的輸出訊號可以是較高維輸入訊號的某種線性或非線性組合,也可以僅僅是輸入訊號的一個子集。在後一情況下,這種變換也叫作特徵選擇。根據識別系統的實際要求,通過特徵抽取可以從原始訊號中得到為產生或表示模式所必需的關鍵特徵,例如可從景物的原始灰度影象中抽取出目標的輪廓和形狀,也可以抽取那些只對分類有效的鑑別特徵。通常原始訊號所組成的測量空間具有很高的維數,如攝像機獲取的灰度影象,其維數可以達到256×256以上。直接用它進行分類一方面計算量很大,更重要的是不同的測量條件,如攝像機位置的微小移動、照明強弱的變化等,都可能使在測量空間中表示同一模式的向量發生極大的變化。因此在很多情況下直接在測量空間中進行分類有很大的困難。在實際問題中,原始資料經常包含一些多餘的或重複的資訊,為了減少整個識別系統獲取測量資料的費用和相應的計算工作量以及改善識別系統的效能,也有必要通過特徵抽取和選擇把模式變換到較低維數的特徵空間中去。可以認為特徵抽取是模式識別的關鍵步驟。設模式在測量空間中用D維向量x表示,在特徵空間中用d 維向量y表示,線性特徵抽取器就是把x變換為y 的d×D階的一個矩陣A,即y=Ax。

特徵抽取和選擇的主要方法有:

(1)以K.勒維展開式為基礎進行的線性變換。

(2)給定一個變換類,在規定的準則(例如某個與錯分概率上界有關的準則函式)下在變換類中選擇一個最優變換A。 ③從測量得到的特徵集或已經經過前級變換的特徵集中在某個準則下用搜索演算法、或從上到下、或從下向上演算法求出一個最優的或次優的子集,以達到特徵選擇的目的。

(4)非線性對映方法,例如多維定標法和引數對映法。

在實現一個具體的模式識別系統時,通過特徵抽取所求得的特徵向量,在極大程度上決定了識別系統的效能。因此一方面要對識別物件的各個方面進行深入的分析,儘可能從物理上確定某些對識別有效的特徵;另一方面要與分類器的設計結合起來,反覆進行試驗,藉以得到滿意的結果。