雷達訊號檢測和資訊提取

[拼音]:shengmaqi

[英文]:vocoder

一種對話音進行分析和合成的編、譯碼器,也稱話音分析合成系統或話音訊帶壓縮系統。它主要用於數字電話通訊,特別是保密電話通訊。

圖為人的發聲系統模型。人講話時,氣流經過喉頭形成聲源訊號,然後激勵由口、鼻腔構成的聲道,產生話音訊號。聲碼器發信端的分析器首先對話音訊號進行分析,提取主要話音引數:

(1)聲源特性,如聲帶“振動-不振動”(濁-清音)、聲帶振動時的基本頻率(基頻f0);

(2)聲道傳輸聲源訊號的特性。這些話音引數變化很慢,它們所佔的總頻帶比話音本身的頻帶窄得多,因而對這些引數取樣編碼時總數位元速率只有幾千甚至幾百位元/秒,只有直接由話音訊號取樣編碼的數位元速率的十幾分之一,可以通過一個普通電話通道來傳輸。收信端的合成器利用這些引數來合成話音。

聲碼器最早出現在美國貝爾實驗室。這個實驗室的H.W.達得利在1928年提出合成話音的設想,並於1939年在紐約世界博覽會上首次表演了他取名為聲碼器的話音合成器。此後,話音合成的原理被用來研究壓縮話音訊帶。聲碼器的研究工作不斷取得進展,數位元速率已降到2400或1200位元/秒,甚至更低。合成後的話音質量有較大提高。在售價、結構、耗電等諸方面符合商用的聲碼器已經出現。中國於50年代末開始研製聲碼器,並已用於數字通訊。

壓縮頻帶

聲碼器能壓縮頻帶的根本依據是話音訊號中存在資訊多餘度。話音訊號只要保留聲源和聲道的主要參量,就能保證有較高的話音清晰度。

型別

採用頻譜包絡和基頻作為引數的聲碼器稱為通道聲碼器。除通道聲碼器外,還有多種其他型別的聲碼器。它們在合成話音質量、數位元速率和複雜程度等方面不大一樣,主要的差別在於話音引數和提取這些引數的方式不同。例如,用共振峰的位置、幅度和寬度表示頻譜包絡的,稱為共振峰聲碼器;利用同態濾波技術,如對話音訊號進行積分變換、取對數和反變換以獲得各引數的,稱為同態聲碼器;直接編碼和傳輸話音的基帶(如取200~600赫的頻帶)以表徵聲源特性的,稱為聲激勵聲碼器。此外,還有相位聲碼器、線性預測聲碼器(見線性預測編碼)等。

特點

聲碼器的明顯優點是數位元速率低,因而適合於窄帶、昂貴和劣質通道條件下的數字電話通訊,能滿足節約頻帶、節省功率和抗干擾編碼的要求。低數位元速率對話音儲存和話音加密處理也都很有利。聲碼器的缺點是音質不如普通數字電話好,而且工作過程較複雜,造價較高。現代聲碼器主要用於軍隊、政府以及那些值得付出代價以換取通訊安全(保密)的場合。隨著對人類發聲機構和聽覺機理的深入研究以及計算機技術和大規模積體電路的發展,聲碼器的音質和裝置小型化將不斷得到改進,並將在數字通訊中得到更廣泛的應用。

參考書目

J.L.Flanagan,Speech Analysis Synthesis and Perception,2nd ed., Springer-Verlag, New York,1972.