我們知道,所有的媒體類型(包括音頻和視頻)都可以通過以下兩種模式來傳輸:用于同步顯示的實(shí)時(shí)傳輸和下載模式。下載是一個(gè)異步過程,在網(wǎng)絡(luò)上下載的是多媒體信息還是其他數(shù)據(jù)集,對網(wǎng)絡(luò)的要求都相同,差別在于數(shù)據(jù)集的大小。另一方面,依賴時(shí)間的媒體的實(shí)時(shí)傳輸對網(wǎng)絡(luò)提出了一些新的要求。
一、視頻對網(wǎng)絡(luò)的要求
1、視頻質(zhì)量的5個(gè)等級:
1)高清晰度電視(HDTV)、2)演播質(zhì)量數(shù)字電視、3)演播室質(zhì)量數(shù)字電視、4)VCR質(zhì)量電視、5)低速電視會(huì)議質(zhì)量。以上質(zhì)量的5個(gè)層次是按質(zhì)量的好壞排列的。
1)高分辨率/高幀速率HDTV:要達(dá)到的位率高度依賴于壓縮時(shí)脫機(jī)發(fā)生以產(chǎn)生被壓縮數(shù)字流的存儲(chǔ)版本還是實(shí)時(shí)執(zhí)行,壓縮率通常希望達(dá)到100:1;高分辨率/高幀頻HDTV應(yīng)當(dāng)被壓縮到位率在20~34Mbit/s之間;高分辨率常規(guī)幀頻HDTV則要求在15~25Mbit/s之間。
2)廣播質(zhì)量電視:現(xiàn)存的MPEG-2壓縮標(biāo)準(zhǔn)的實(shí)現(xiàn)是在約6Mbit/s的位率下操作的。對于類NTSC的質(zhì)量,期望達(dá)到2~3Mbit/s。而對于類PAL/SECAM的質(zhì)量,期望達(dá)到4Mbit/s。
3)VCR質(zhì)量:像MPEG-l或DVI這樣的壓縮算法提供了1.2Mbit/s位率的脫機(jī)壓縮,200Kbit/s可以被用于傳輸音頻,以形成1.4Mbit/s的流。
4)視頻會(huì)議質(zhì)量。常規(guī)的基于線路視頻會(huì)議系統(tǒng)按視頻會(huì)議質(zhì)量操作,即以98或112Kbit/s的速度產(chǎn)生數(shù)據(jù)流。在這個(gè)模式里,剩余的帶寬即16bit/s被分配給音頻流。MPEG專家組已制定出能夠壓縮視頻會(huì)議質(zhì)量低到32Kbit/s的相應(yīng)標(biāo)準(zhǔn)。
HDTV質(zhì)量需要的位率比那些傳統(tǒng)共享LAN可用的位率要高。廣播電視質(zhì)量與大多數(shù)局域網(wǎng)技術(shù)兼容,它們能攜帶一個(gè)或多個(gè)同時(shí)發(fā)生的數(shù)據(jù)流。VCR質(zhì)量與T-1租賃線和傳統(tǒng)頻率兼容,視頻會(huì)議質(zhì)量適合于與一個(gè)雙倍窄帶ISDN連接。
2、實(shí)時(shí)視頻要求的延時(shí)抖動(dòng)
通常,為了同步展現(xiàn)多媒體信息,必須把實(shí)時(shí)運(yùn)動(dòng)視頻數(shù)據(jù)流與音頻數(shù)據(jù)流同時(shí)傳輸。在這種情況下,對傳輸延時(shí)和延時(shí)抖動(dòng)的要求通常由音頻數(shù)據(jù)流決定。在音頻和視頻的情況下,對HDTV到VCR質(zhì)量而言,較粗糙的同步是必須的。在視頻會(huì)議質(zhì)量中,抖動(dòng)效果屏蔽了大多數(shù)音頻和視頻異步。
ITU-T對實(shí)時(shí)會(huì)話規(guī)定網(wǎng)絡(luò)的單程傳輸時(shí)延應(yīng)在100~500ms,在交互式多媒體應(yīng)用中,如查詢,網(wǎng)絡(luò)系統(tǒng)對用戶指令的響應(yīng)時(shí)間應(yīng)小于1~2s。為此我們提供需要數(shù)據(jù)流,HDTV質(zhì)量的網(wǎng)絡(luò)傳輸延時(shí)的變化應(yīng)當(dāng)不超過50ms,廣播質(zhì)量應(yīng)不超過l00ms,視頻會(huì)議質(zhì)量應(yīng)當(dāng)不超過400ms的視頻延時(shí)抖動(dòng)界限,它們是從音頻數(shù)據(jù)流的要求推導(dǎo)出來的且應(yīng)用于壓縮。表2-1給出了幾種主要媒體業(yè)務(wù)對網(wǎng)絡(luò)時(shí)延抖動(dòng)的要求。靜態(tài)媒體(文字、圖形、圖像)對網(wǎng)絡(luò)的時(shí)延抖動(dòng)不敏感。
表2-1:幾種主要媒體業(yè)務(wù)對網(wǎng)絡(luò)時(shí)延抖動(dòng)的要求
產(chǎn)生網(wǎng)絡(luò)的延時(shí)抖動(dòng)有多種原因,包括傳輸系統(tǒng)中的干擾和噪聲引起的物理抖動(dòng)、局域網(wǎng)中的介質(zhì)方法時(shí)間變化、廣域分組網(wǎng)中的流控等待時(shí)間、存儲(chǔ)轉(zhuǎn)發(fā)排對時(shí)間變化等均能引起延時(shí)抖動(dòng)。
3、實(shí)時(shí)視頻要求的錯(cuò)誤率
對于網(wǎng)絡(luò)錯(cuò)誤率這個(gè)問題,壓縮數(shù)據(jù)流比非壓縮數(shù)據(jù)流對錯(cuò)誤更敏感。表3-1給出了主要的媒體對網(wǎng)絡(luò)錯(cuò)誤率的要求。假設(shè)連續(xù)被影響幀靜態(tài)傳播,我們簡要地介紹運(yùn)動(dòng)視頻幀被傳輸錯(cuò)誤影響的頻率。
表3-1:主要的媒體對網(wǎng)絡(luò)錯(cuò)誤率的要求
1)被影響幀之間的間隔。在視頻會(huì)議質(zhì)量(100Kbit/s)中如果比特差錯(cuò)率(BER)為10-5,則兩個(gè)連續(xù)被影響幀之間的平均時(shí)間間隔為1s;如果BER為10-9,則間隔為3h。
在壓縮模式的廣播質(zhì)量電視中,如果BER為10-5,則兩個(gè)連續(xù)錯(cuò)誤之間的平均時(shí)間為20ms,也就是說每幀平均有兩個(gè)錯(cuò)誤或者每秒鐘有50個(gè)錯(cuò)誤比特,如果BER為10-9,則每個(gè)4min幀有一個(gè)錯(cuò)誤。在壓縮模式的HDTV中,10-5的BER會(huì)導(dǎo)致每幀約4個(gè)錯(cuò)誤,即每秒240個(gè)錯(cuò)誤比特,而10-9的BER會(huì)導(dǎo)致兩個(gè)連續(xù)包含1個(gè)錯(cuò)誤比特的幀之間平均時(shí)間間隔為1min。
2)傳輸錯(cuò)誤的處理。在實(shí)時(shí)音頻和視頻的情況下,重復(fù)傳輸是不合適的,通常的技術(shù)包括使用向前錯(cuò)誤矯正(FEC)代碼,它依賴于控制位與純信息數(shù)據(jù)流的疊加,這種技術(shù)允許沒有成組的錯(cuò)誤的檢測和校正,它們典型地允許殘余錯(cuò)誤率改善4個(gè)數(shù)量級。
二、音頻對網(wǎng)絡(luò)的要求
音頻質(zhì)量主要分為兩級,即電話語音質(zhì)量(常規(guī)電話網(wǎng)絡(luò)的質(zhì)量,帶寬限制在3.4kHz)和CD質(zhì)量(帶寬在l0kHz附近)。當(dāng)使用ITU-T G.711標(biāo)準(zhǔn)時(shí),電話質(zhì)量要求為64Kbit/s,而CD質(zhì)量是立體聲,需1411.2Kbit/s(這些位流是未壓縮的)。現(xiàn)代的語音編碼和壓縮算法允許32Kbit/s的電話質(zhì)量和低到4.8Kbit/s的電話質(zhì)量,立體聲模式的CD可被壓縮到192或256Kbit/s。
音頻對網(wǎng)絡(luò)的要求主要是延時(shí)問題,音頻的實(shí)時(shí)傳輸對延時(shí)變化很敏感,為了克服延時(shí)變化,一個(gè)附加的偏移延時(shí)需要在接收端實(shí)施延時(shí)平衡化處理,這個(gè)技術(shù)可以在源和音頻的最后播出間的總延時(shí)增加一個(gè)很強(qiáng)的成分。當(dāng)使用典型的個(gè)人計(jì)算機(jī)作為端系統(tǒng)時(shí),網(wǎng)絡(luò)限度對于壓縮的CD質(zhì)量音頻不應(yīng)超過l00ms,對電話質(zhì)量音頻則不超過400ms。電話質(zhì)量的殘余位錯(cuò)誤率應(yīng)被限制在10-2,沒壓縮的CD質(zhì)量應(yīng)限制在10-3,壓縮的CD質(zhì)量應(yīng)限制在10-4。