
售前電話
135-3656-7657
售前電話 : 135-3656-7657
國家高新技術企業 省級專精特新企業
咨詢熱線:135-3656-7657 400-6333-661
結構原理
G.728、G.729和G.723.1都屬于同一類聲碼器,稱之為線性預測合成分析(I.PAS-LinearPredicfionAnalysis-by-Synthesis)編碼器,其原理結構如圖4.1所示。
激勵生成器產生的激勵信號經線性預測器后得到重構的話音信號s(1),線性預測器模擬聲道特性,加強激勵信號的某些頻率域,減弱另一些頻率域,體現了話音的短時相關性。激勵信號則體現了話音的長時相關性,輸入線性預測器的激勵信號是量化后的增益和基音信號。由于臥化誤差的影響,重構信號和輸入信號s(1)之間必然存在有限的差值e(1),稱之為殘差信號(residualsignal),最小化過程的日的就是調整激勵信號,使殘差的方差為最小,由此構成確定激勵信號的閉環回路。為了減小量化比特,提高編碼效率,激勵生成器輸出的是殘差信號估值,而不是原信號估值。從頻域上來說,最小化過程使激勵信號暈化噪聲的能量集中在預測濾波器的低谷部分,從而使雇化噪聲呈現平坦的類似白噪聲的功率頻譜。
經過最小化過程確定的激勵信號星化值就是聲碼器的輸出,接收端的解碼器根據此信號和同樣的線性預測器恢復原來的話音伈號(實際上圖4.1.1難框部分所示閉環回路的下半部分就是解碼器的結構,因此該結構的編碼器己內含解碼器。在話音編碼中,常稱編碼過程為語音分析,它的功能是將話音轉換為適于計算機存儲和網絡中傳輸的數字形式;稱解碼過程為語音合成,它的功能是將數字形式的話音數據重新轉換為可供人類使用的信號形式。按這樣的術語來解釋,反饋回路中的線性預測器是用來重建信號的,又稱為預測合成器,整個編碼器是通過內含的語音合成來完成語音分析過程的,所以稱之為合成分析器。
由于聲道的形狀和大小是隨音素而變化的,因此預測合成器是一個線性時變系統,其濾波器系數需定期更新。因此,LPAS的閉環回路實際上包含兩層反饋控制。內層是線性預測濾波器的自適應控制,其過程和ADPCM相同,系數更新周期為一個幀長,典型值為10~30ms。外層是激勵信號的優化,由于基音周期小于幀長,因此其更新周期較短,典型值為5~lOms。LPAS的關鍵技術是如何確定和量化激勵信號。
殘差激勵信號的量化有多種方法,它是不同LPAS系統的主要差別所在。一種廣為使用的方法稱之為多脈沖激勵(MPE-multi-pulseexcitation)編碼,該方法用于比特率為lOkbit/s左右的話音編碼器,其復雜度適中,有良好的話音質量。與此類似的一種方法稱為規則脈沖激勵(RPE-egularpulseexcitation)編碼,該方法限定激勵脈沖的位置,復雜度較低,其比特率及質量和多脈沖編碼類似。近年來得到廣泛使用的方法是碼本激勵線性預測(CELP-Code-excitedlinearPrediction)編碼,該方法采用矢量量化技術,用予定義的碼本(codebook)激勵替代脈沖激勵,碼本中的每一個向量對應一個量化信號,編碼信息轉化為碼本索引。這種方法具有很高的編碼效率,但是復雜度也很高,由于近年來高速DSP的出現才使這種方法成為實用,并以此為基礎演繹出多種低比特率聲碼器標準。