窄帶語音編碼主要是指電話通信中的語音編碼,所謂窄帶即是指300~3400Hz頻帶。從事語音編碼標準制定的國際組織主要有:國際電信聯盟電信標準部(ITU-T)、歐洲電信標準協會(ETSI)、北美電信工業協會(TIA)、日本的無線電系統研究和開發中心(RCR)、管理全世界地球同步通信衛星的國際海事衛星公司(INMARSAT)、制定保密電話語音編碼標準的美國政府和北大西洋公約組織(NATO)等。他們研究制定了在電話通信中的語音編碼標準,并得到了很好的應用。
1、ITU-T語音編碼標準
傳統上ITU-T主要是為8 kHz采樣率和3.4 kHz帶寬的PSTN電話制定的語音編碼標準,目的是借助數字電路的多路復用技術來提高通信網的容量。同時,ITU-T也制定了16kHz采樣率和7kHz帶寬的語音編碼標準,目的是實現ISDN、無線移動通信網和IP網的互通和兼容。
1972年,ITU-T發布了A/μ律64kb/s PMC(Pulse Code Modulation)語音編碼標準G.711。該標準的基本思想是,先將8 kHz采樣率的離散語音樣點變換到對數域,然后對變換的語音樣點進行8bit量化編碼。作為第一個數字電話系統,G.711已經配置在世界上不同的PSTN中,得到了非常廣泛的應用。從那時起,ITU-T開始制定更復雜的G.72x系列語音編碼標準,頒布了G.721 32kb/s ADPCM(Adaptive Differential Pulse Code Modulation)編碼標準及其擴展標準G.726 (40/32/24/16 kb/s),并最終用G.726取代了G.721。除了G.723.1,ITU-T的每個語音編碼器都是以前一個標準的半速率為基礎進行開發的,例如,1992年和1996年頒布的G.728和G.729語音編碼器的速率分別為16kb/s和8kb/s。另外,ITU-T還頒布了用于可視電話的5.3/6.3kb/s雙速率語音編碼標準G.723.1。G.728、G.729和G.723.1的編碼原理均基于碼激勵線性預測(Code Excited Linear Prediction,CELP)技術。為了支持非連續傳輸,ITU-T還分別公布了G.729和G.723.1的擴展標準G.729B和G.723.1A。基于它們的靜默壓縮方案,這些標準已廣泛應用于包交換的語音通信中。表1概括了ITU-T窄帶語音編碼標準。
表1:ITU-T窄帶語音編碼標準
欲更多了解ITU-T語音編碼標準介紹的請進入。
2、歐洲數字蜂窩電話語音編碼標準
隨著數字蜂窩電話的出現,歐洲電信標準協會(ETSI)制定了許多語音編碼標準。ETSI相繼公布了13kb/s GSM全速率(Full Rate,FR)語音編碼標準、5.6kb/s GSM半速率(Half Rate,HR)語音編碼標準和12.2kb/s GSM增強的全速率(Enhanced Full Rate,EFR)語音編碼標準。繼這三種標準之后,ETSI又公布了一種自適應多速率(Adaptive Multi-Rate,AMR)語音編碼標準,該標準共有8種速率(從12.2kb/s到4.75kb/s),其中4個速率用于全速率信道,而另外4個速率用于半速率信道。AMR編碼器的目的是根據信源編碼和信道編碼間的最佳選擇提供增強的語音質量,在高的無線干擾時,為保障語音質量,AMR能夠自動減少信源編碼比特數,并將富裕的比特數補充到信道編碼中,反之亦然。ETSI語音編碼器也能夠借助于話音激活檢測進行靜默壓縮,這非常有利于減少移動通信中的信道干擾和延長電池壽命。表2概括了歐洲移動通信中使用的標準語音編碼器。
表2:用于GSM移動通信的ETSI語音編碼標準
欲更多了解GSM系統語音編碼介紹的請進入。
3、北美數字蜂窩電話語音編碼標準
在北美,電子工業協會(Electronic Industries Association,EIA)下屬的北美電信工業協會(TIA)根據美國使用的碼分多址(CDMA)和時分多址(TDMA)技術對其移動通信進行了標準化。1993年,TIA/EIA采納了Qualcomm CELP(QCELP)作為過渡語音編碼標準IS-96-A(Interim Standard-96-A),該標準對語音信號進行8kb/s到0.8kb/s的變速率編碼。1995年,TIA/EIA在IS-96-A的基礎上頒布了一個稱為IS-127的增強型變速率(Enhanced Variable Rate Coder,EVRC)語音編碼標準,該標準在語音壓縮模塊的前端引入了一個新穎的語音增強功能,在噪聲背景條件下,獲得了更加舒適的語音質量。 1998年,TIA/EIA公布了用于個人通信系統的變速率語音編碼標準IS-733,該標準的速率介于14.4kb/s和1.8kb/s之間。1989年和1996年,TIA/EIA又分別頒布了用于北美TDMA的7.95kb/s全速率語音編碼標準IS-54和增強的全速率語音編碼標準IS-641-A。表3概括了北美移動通信中使用的標準語音編碼器。
表3:用于北美CDMA/TDMA移動通信的TIA/EIA語音編碼標準
欲更多了解CDMA系統語音編碼介紹的請進入。
4、日本數字蜂窩電話語音編碼標準
日本數字蜂窩(Japanese Digital Cellular,JDC)電話標準由日本的無線電系統研究和開發中心(Research and Development Center for Radio System,RCR)進行標準化,作為日本的TDMA數字移動電話語音編碼標準。1990年,RCR公布了一種類似于IS-54的6.7kb/s VSELP編碼器作為JDC的全速率語音編碼標準。為了使日本TDMA個人數字移動系統(Personal Digital Cellular,PDC)的容量增加一倍,1993年RCR又公布了JDC 3.6kb/s基音同步更新碼激勵線性預測(Pitch Synchronous Innovation-Code Excited Linear Prediction,PSI-CELP)編碼器作為JDC的半速率語音編碼標準。表4概括了JDC語音編碼標準。
表4:JDC語音編碼標準
5、保密通信電話語音編碼標準
語音編碼是保密通信系統中至關重要的一部分,在突發事件中,為了傳達準確的語音命令,語音編碼器的可懂度是一個主要的考慮對象。比較有影響力的保密通信的語音編碼標準主要由美國國防部(Department of Defense,DoD)組織制定。1984年和1991年,DoD分別頒布了稱之為2.4kb/s LPC-10e編碼器和4.8kb/s CELP編碼器的聯邦標準FS-1015(Federal Standard 1015)和FS-1016。后來DoD的保密電話標準是基于正弦語音編碼模型的2.4kb/s混合激勵線性預測(Mixed Excitation Linear Prediction,MELP)聲碼器(Vocoder),2.4kb/s DoD MELP語音編碼器在半速率情況下給出了好于4.8kb/s FS-1016編碼器的語音質量。一個修正和改進的2.4/1.2kb/s MELP編碼器已經成為北大西洋公約組織(North Atlantic Treaty Organization,NATO)的保密電話標準,該標準在編碼前端使用了一個噪聲預處理器。由于MELP編碼器能在非常低的比特率產生可懂的語音質量,因此這類參數編碼器已廣泛使用在保密通信系統中。表5概括了DoD的標準語音編碼器。
表5:DoD語音編碼標準
6、衛星電話語音編碼標準
國際海事衛星公司(INMARSAT)已經采用了兩種語音編碼器用于衛星通信。INMARSAT分別將4.15kb/s改進的多帶激勵(Improved Multiband Excitation,IMBE)語音編碼器和3.6kb/s先進的多帶激勵(Advanced Multiband Excitation,AMBE)語音編碼器用在了INMARSAT M系統和INMARSAT Mini-M系統中。表6概括了INMARSAT的標準語音編碼器。
表6:INMARSAT語音編碼標準
7、各種語音編碼器的性能比較
為了選擇一個最佳的語音編碼器,必須針對某一應用對象進行廣泛的測試。一般來講,降低比特率將導致編碼語音質量的下降。傳統的信噪比(SNR)質量測量方法可以用來評價編碼速率為16kb/s以上的波形編碼器,因為這類編碼器的輸出信號波形與原始信號波形具有非常強的類似性。而低比特參數編碼器沒有保留波形類似性,基于SNR的質量測量方法失去了意義。對于參數編碼器而言,基于感性MOS分的主觀質量測量更可靠。表7通過比特率、算法、延時和MOS分比較了眾所周知的窄帶語音編碼標準。圖7以語音質量相對比特率的形式說明了這些標準的性能。在圖7中,128kb/s線性PCM(8kHz采樣率,每樣點用16bit量化編碼)提供了透明的語音質量,64kb/s壓擴PCM(8kHz采樣率,每樣點用8bit量化編碼)的MOS分值大于4,提供了長途質量,64kb/s PCM是這些標準中語音質量最好的編碼器。
表7:窄帶語音編碼標準比較
圖7:窄帶語音編碼標準的性能比較
欲進一步了解上述語音編碼標準的編碼器的技術性能的請進入。