现在国内市场上的视频会议品牌众多,采用的技术也千差万别。但究其实质,视频会议最核心的技术指标还是编码标准、体系结构、流媒体服务。这里不妨做一个简单介绍。
1.编码标准
和一般的数据业务不同,视频是流特性业务,数据量很大。例如,目前的PAL制广播电视信号,在分辨率为720×576、帧率为25帧每秒的情况下,未经压缩的码率为165.888Mbps。这种码率的视频在网络上是无法传输的,会轻易地将网络资源吞没,造成网络拥塞甚至崩溃。因此,视频通信的第一步就是视频压缩。目前在众多的视频编码算法中,被广泛使用在视频会议系统中的压缩标准是H.26x和MPEG。
H.26x是国际电信联盟制定的标准,主要包括H.261和H.263。H.261也称为(P×64Kbit/s)标准(P=1,2,3…30),在P<6的情况下,只能传输QCIF格式的图像(176×144);在P=6~30时,也仅能传输CIF格式的图像(352×288)。它的视频效果较差,只适合低速率下相对静止图像传输。1996年ITU-T在H.261的基础上进行一定的改进推出了H.263标准,但它仍然不能实现高清晰度图像的传输,只适合低带宽下的应用。
MPEG本是Moving Pictures Experts Group,即“运动图像专家组”的英文缩写,这个专家组是由国际标准化组织ISO和国际电子委员会IEC于1988年联合成立的,致力于运动图像及其伴音编码的标准化工作,MPEG制定的标准主要有MPEG-1、MPEG-2和MPEG-4。
MPEG-1制定于1992年,它主要是在1.5Mbps情况下,对352×288×25帧/秒的运动图像进行处理。它的算法框图基本与H.261相同,但在时间域正负方向进行的运动补偿的帧间内插使其具有以下优点:①具有更高的图像压缩倍数;②能够恰当地对待突发背景;③能较好地保存边缘轮廓,降低原始图像的噪声。但正由于它的双向帧间预测使得图像显示顺序与编码顺序不同,造成较大的系统延时,且压缩比越高,延时也会越大。
MPEG-2制定于1994年,主要应用在广播电视图像的传输和数字存贮媒体(DVD)。与MPEG-1的区别在于MPEG-2有了等级之分,共分为4个等级LL(352×288×25帧/秒)、ML(720×576×25帧/秒)、H1440L(1440×1152×25帧/秒)、HL(1920×1152×25帧/秒)。它在带宽充足的情况下MPEG-2可实现高清晰度图像的传输,甚至能满足HDTV的要求。但它和MPEG-1具有同样的缺点,即延时较大、带宽要求相对较高。在广播电视系统中,由于不要求交互且能提供足够的带宽(广播电视系统可为每路图像信号提供8M带宽),这些缺点体现不明显。但当它应用到视频会议系统中时,要达到ML(720×576×25帧/秒),需要3M以上的带宽,且会有1s以上的延时,不能完全适应当前视频会议系统的需求。
为了解决时延与压缩比的问题,ISO于1999年通过了MPEG-4标准,它与其它标准的最大区别在于MPEG-4是基于内容进行编码,将编码对象由原来的矩形图像改为单独的对象,即将每幅图像分为不同的自然对象单独进行编码。由于这种合成对象/自然对象混合编码SNHC可大大降低帧间图像的信息冗余,因此MPEG-4编码技术可利用最少的数据获得最佳的图像质量。在视频会议系统实际应用中,可在1.5Mbps情况下实现高清晰度图像(720×576×25帧/秒)的传输,同时将时延控制在300ms以内。另外,MPEG-4还把提高多媒体系统的交互性和灵活性作为一项重要的目标,因此它比其他编码方式更适合交互式的视频服务和远程监控。
2.体系结构
视频会议的体系结构有两种:ITU-T H.320和H.323。
H.320是一个传统的电视会议标准,在过去几年被广泛使用在ISDN网络中。它的网络结构主要是H.243标准下的主从星形汇接结构,每个终端必须与它对应的MCU建立电路连接,组网结构非常固定。由于基于电路交换,它能提供确定的带宽保证,充分保证视频会议的质量。
H.323的标准名称是基于包的多媒体通信系统,它凭借TCP/IP这一协议,使网络上的多媒体应用和业务与基础传输网络无关。视频会议也只是这一标准的应用之一,因此可以利用H.323将多种应用和业务(如视频点播、流媒体组播等)叠加到视频会议系统中。也正因为H.323视频会议系统建立在基于分组交换、QoS得不到保证的通信网的基础上,因而会议系统中的码流必须打包成一个一个分组,根据分组标签统计复用。由于不同信息码各有特点,所以对下层网络的承载要求各不相同。例如视音频码流对实时性要求较高,但可以容忍少量的分组丢失,因而它要求下层网络能提供实时性好的传送机制;而对于数据和控制信息,情况完全不同,要求下层提供可靠性传送。
H.323最大的缺点在于它的网络环境是一个QoS得不到严格保证的通信网,因此H.323结构的视频会议系统使用RTCP(实时传输控制协议)来测量网络的QoS,并采用RSVP(资源预留协议)来确保网络中预留一定的带宽,对不同特点的应用提供特定的通道。
H.323作为下一代多媒体通信平台代表着未来多媒体会议的的发展方向和潮流,它的传输网络无关性、灵活性,使它越来越得到普遍地应用,但H.320凭借其在带宽保证方面的优势,仍是很多视频会议用户的最终选择。为了满足不同客户的需要,充分保证用户投资,现阶段的视频会议系统最好能够同时支持H.320和H.323。
3.流媒体服务
随着视频会议技术的不断发展,流媒体服务概念也被引入到其中。流媒体指的是在网络上使用流式传输技术的连续时基媒体,如视频会议系统中的实时视音频流,流媒体的数据流总是随时传送随时播放的。在视频会议系统中主要使用的流式传输技术是实时流式传输,它保证媒体信号带宽与网络连接的匹配,且总是实时传送特别适合视频会议,同时也支持随机访问。在视频会议系统中主要有以下三种流媒体播放方式得到充分应用:
(1)单播
在终端与MCU之间建立一个单独的数据通道,从一台MCU发送的每个数据流只能传送给一台终端。这种方式对网络带宽要求较高,但非常灵活,适合召开双向交互式视频会议时使用。
(2)组播
IP组播技术通过构建一个具有组播能力的网络,可以让MCU只发送一个数据流给多个终端共享。这种方式非常节约带宽,适合在一些需要单向收看视频会议的场合中应用。
(3)点播
点播是指用户可以通过选择内容项目来初始化终端连接,对数据流可以开始、停止、后退、快进或暂停。它主要应用于会议录像的点播。
编码标准、体系结构、流媒体服务是视频会议众多技术中比较重要的三项指标,各种视频会议系统的区别也主要集中于此。至于视频会议配套的显示系统、扩声系统、控制系统等技术透明度高,应用普遍,各个厂家大同小异。所以在建设视频会议系统时结合自身组网情况,充分考虑编码标准、体系结构、流媒体服务三方面因素来选择最适合的产品是极有必要的。