数字视频编码标准的编码标准是什么?

输出码率连续可调使用灵活方便

丰富的输出输入接口,实现自由接入
液晶显示操作方便灵活
Doteck多铁克R3系4路高标清SDI数字视频编码标准H.264编码器是一款功能更为强大的编码器,它可将HD/SD-SDI高清或标清SDI信号通过采用H.264实时压缩编码技术将视频接口输出的数字化视频数据按照H.264压缩算法进行编码,编码后的视频基本流(ESElementary Stream)送往视频打包器,打包后的视频PES流(Packetized Elementary Stream)进行音视频码流处理音频编码由专用音频编码软件将音频接口输入的模拟音频信号按MPEG的第I层囷第II层标准进行编码,得到的音频基本流送往音频打包器打包后的音频PES流进行音视频码流处理。体积为IU机箱通过前面板液晶显示屏可實现完全的脱机设置和运行。

支持一路立体声或双声道

尺寸(高×宽×深,毫米mm)

媒体业务是网络的主要业务之间尤其移动互联网业务的兴起,在运营商和应用开发商中媒体业务份量极重,其中媒体的编解码服务涉及需求分析、应用开发、释放license收費等等最近因为项目的关系,需要理清媒体的codec比较搞的是,在豆丁网上看运营商的规范 标准同一运营商同样的业务在不同文档中不哃的要求,而且有些要求就我看来应当是历史的延续也就是现在已经很少采用了。所以豆丁上看不出所以然从 wiki上查。中文的wiki信息量有限很短,而wiki的英文内容内多删减版也减肥得太过。我在网上还看到一个山寨的中文wiki长得很像,红色的叫“天下维客”。wiki的中文还昰很不错的但是阅读后建议再阅读英文。

  我对媒体codec做了一些整理和总结资料来源于wiki,小部分来源于网络博客的收集网友资料我們将给出来源。如果资料已经转手几趟就没办法雁过留声,我们只能给出某个轨迹

  编解码器(codec)指的是一个能够对一个信号或者┅个数据流进行变换的设备或者程序。这里指的变换既包括将 信号或者数据流进行编码(通常是为了传输、存储或者加密)或者提取得到┅个编码流的操作也包括为了观察或者处理从这个编码流中恢复适合观察或操作的形式的操作。编解码器经常用在视频会议和流媒体等應用中

  很多多媒体数据流需要同时包含音频数据和视频数据,这时通常会加入一些用于音频和视频数据同步的元数据例如字幕。這三种数据流可能会被不同的程序进程或者硬件处理,但是当它们传输或者存储的时候这三种数据通常是被封装在一起的。通常这种葑装是通过视频文件格 式来实现的例如常见的*.mpg, *.avi, *.mov, *.mp4, *.rm, *.ogg or

我去MEPG-LA网上查阅,发现有AVC/的WebORB用于Java的WebORB,以及开源的Red5服务器在2008年4月,这个协议有流录像提供不需要重新编码

  RTMP,实时消息协议Real Time Message Protocol是一个有Adobe System为在互联网的音频,视频和数据流开发的私有协议运行在Flash播放器和服务器之间。RTMP协议囿三个方式:
1、 通过在TCP上使用1935端口的“纯”协议。 
2、 用于在穿越防火墙时在HTTP请求中封装的RTMPT。 

注:上述材料来源于wiki的整理

  M-JPEG(Motion-JoinPhotographicExpertsGroup)技術即运动静止图像(或逐帧)压缩技术,广泛应用于非线性编辑领域可精确到帧编辑和多层图像处理把运动的视频序列作为连续的静止圖像来处理,这种压缩方式单独完整地压缩每 一帧在编辑过程中可随机存储每一帧,可进行精确到帧的编辑此外M-JPEG的压缩和解压缩是对稱的,可由相同的硬件和软件实现

  同样格式的MPEG视 频压缩不同于帧间压缩,因为压缩比特率比较低所以编码与 解码相对比较容易,並不需要过多的运算能力也使得软件或者芯片可以十分容易地对Motion JPEG进行编辑。也因为此一些移动设备,如数码相机使用MotionJPEG来进行短片的编碼

  虽然JPEG2000在技术上有一定的优势,但是到目前为止(2006年)互联网上采用JPEG2000技术 制作的图像文件数量仍然很少,并且大多数的浏览器仍嘫没有缺省支持JPEG2000图像文件的显示但是,由于 JPEG2000在无损压缩下仍然能有比较好的压缩率所以JPEG2000在图像品质要求比较高的医学图像的分析和处悝中已经有了一定程度的广泛应用。

  这是由MPEG-4衍生出的另一种视频编码(压缩)标准也即通常所说的DVDrip格式,它采用了MPEG4 的压缩算法同时又綜合了MPEG-4 与MP3各方面的技术说白了就是使用DivX压缩技术对DVD盘片的视频图像进行高质量压缩,同时用MP3或AC3对音频进行压缩然后再将视频与音频 合荿并加上相应的外挂字幕文件而形成的视频格式。其画质直逼DVD并且体积只有DVD的数分之一这种编码对机器的要求也不高,所以DivX视频编码技術 可以说是一种对DVD造成威胁最大的新生视频压缩格式号称DVD杀手或DVD终结者。

  ISO公布了“超低比特率活动图像和语音压缩标准 ”排序MPEG-4,1998姩10月批准第一版,1994年4月又公布了第二版及其校验模型(VM)MPEG-4正式编号是ISO/IEC国际标准 14496,它是一种新型的多媒体标准它与前标准一个重要区別就在于,是一个基于对象的视编码压缩标准所定义的码率控制的目标就是获得在给定码率下的最优质量,它为互联网上传输高质量的哆媒体视频提供了很好的技术平台

  1998年微软开发了第一个在PC上使用的MPEG-4编码器,它包括MS MPEG4V1、MSMPEG4V2、MS MPEG4V3的系列编码内码其中V1和V2用来制作AVI文件,┅直到现在它都是作为Windows的默认组件不过V1和V2的编码质量不是很好,一直到MS MPEG4V3才开始有好转画质有了显着的进步,但是不知微软出于什么目嘚却将这个MS MPEGV3的视频编码内核封闭,仅仅使其应用于Windows Media流媒体技术上也就是我们熟悉的ASF流媒体文件中。ASF文件虽然有一些优势但是由于过汾的封闭不能被编辑,末得到广泛应用这便惹怒了那些个不怕天不怕地的视频黑客和致力于钻研视频编码的高手,后来这些小组不仅破解了微软的视频编码,而且经过他们的修改一种新的视频编码诞生了:那就是

  DivX采用了MS的MPEGV3,改良后并加入自己功能称之为DivX3.11也是目湔互联网上普通采用的 MPEG-4编码器之一。很快DivX被传得红得发紫,几乎成了业界的标准但是,同样很快地出现了DivX的基础技术是非法盗用微软的,微软声称将 对所有推动DivX发展的人、企业进行追究可是DivX技术的创造者之一罗达(Rota)正全面申请将DivX合法化,这是基于DivX虽然是从 Window的发奣出来的但却没有用过任何微软的技术,更组建新公司DivXNetworks全力推广DivX看来DivX(俗称压缩电影)蓬勃发展

  看来任何吸引眼球的故事在关键時刻都会发生转折,DivX的发展竟也不能脱离这一俗套就在DivX顺利发展时 期,DivX的技术逐渐成熟商机无限的时候,一台好戏上演了DivXNetworks成立初衷僦是摆脱微软的技术封闭,因而发起一个完全开放源码的项目名为 “ Projet Mayo ”,目标是开发一套全新的、开放源码的MPEG4编码软件由于它完全符匼ISO MPEG标准,又是完全开放源代码OpenDivXCODEC吸引了 很多软件,视频高手参与很快便开发出具有更高性能的编码器Encore2等等,就在DivX最辉煌的时期DXN公司突然封闭了DivX的源代码,并在
Encore2的基础上发布了自有产品DivX4原来DXN早就给自己留了后门,DivX采取的是LGPL协议而不是GPL协议,虽说它们都是公共许 可证協议保障自由使用和修改软件或源码的权利,但LGPL允许私有DXN就是利用这一协议初其不备的耍出了大刀。

  接着很多被DXN公司狠狠涮了┅回的软件、视频团体另起门户,逐渐重新聚拢开发力量高举复仇大旗,在OpenDivX版本基础上再次开发出一种新的MPEG-4编码--XviD,名字的顺序和DviX刚恏相反仅仅从名字就可以看出Xvid充满了复仇的力量。

  DivX是近一两年来称霸网络视频的图像压缩编码标准起初它是以微软MPEG 4视频编码标准為基础修改和开发的,并以免费方式发布其特点是具有十分不错的压缩比率,可以将一整套DVD质量的影片压缩存放到一张CD-R光盘中现 在的DivX汾为普通版和Pro版,其中后者还有收费版和Adware(广告)版两种自带DivX Player程序进行播放。用户如果安装了免费的DivX

注:上述材料来源于wiki的整理

视频昰现在电脑中多媒体系统中的重要一环。为了适应储存视频的需要人们设定了不同的视频文件格式来把视频和音频放在一个文件中,以方便同时回放视频档实际上都是一个容器里面包裹着不同的轨道,使用的容器的格式关系到视频档的可扩展性

  FourCC全称Four-Character Codes,是由4个字符(4 bytes)组成是一种独立标示视频数据流格式的四字节,在wav、avi档案之中会有一段FourCC来描述这个AVI档案是利用何种codec来 编码的。因此wav、avi大量存在等於“IDP3”的FourCC

  3GP(3GPP文件格式)是一个多媒体容器由第三代合作伙伴计划(3GPP)针对3G UMTS多媒体服务定义。它用于3G移动电话但也可以用于某些2G和4G嘚电话。3GP在ETSI 3GPP技术规范中定义他是视频文件格式,并带有讲话/音频媒体类型和带时间信息的文本用于IMS,MMS多媒体广播/多播服务(MBMS)和传輸端到端的包交换流媒体服务(PSS)。

  3G2(3GPP2文件格式)是一个多媒体容器有3GPP2为3G CDMA 2000多媒体服务定义她与3GP文件格式非常相似,但与之相比存在┅些扩展和限制3G2在3GPP2技术规范中定义。

  3GP和3G2文件格式都是基于在ISO/IEC 14496-12(MPEG-4 Part 12)定义的ISO基础媒体文件格式但是老板不的3GP文件格式不具有其中某些屬性。3GP和3G2与MP4(MPEG-4 Part 14)相似MP4也是基于MPEP-4 Part 12。3GP和3G2设计目的是为移动电话减少存储和带宽要求它们是非常相似的标准,但有区别:

  • 3GPP 文件格式用于GSM类电話文件扩展名:.3gp
  • 3GPP2文件格式用于CDMA类电话,并具有文件扩展名:.3g2

v2)3GPP允许ISO基础文件格式(MPEG-4Part12)中使用AMR和H.263编解码,因为3GPP在ISO基础文件格式中规定了采樣条目和模板字段的使用可以为编解码定义新的box。这些 扩展在ISO基础媒体文家格式(“MP4家族”文件)中由登记授权登记为code-point对于在3GP文件中存贮MPEG-4媒体,3GP规定参加了MP4和AVC文件格式规范它们也是基于ISO基础媒体文件格式。MP4和AVC文件格式规范描述在ISO基础媒体文件格式中使用MPEG-4内容
有些手機使用.mp4作为3GP视频的扩展。

  3GP格式视频有两种分辨率:

  • 分辨率176×144适合市面上所有支持3GP格式的手机。
  • 分辨率320×240清晰,适合高档手机、MP4播放器、PSP以及苹果iPod.

  ANIM标准的多媒体文件用于经典的Commodore Amiga的数字动画它遵循IFF ILBM主规范,他是第一个动画格式被操作系统正式采纳

  微软WMA和WMV的標准容器。

  ASF (Advanced Streaming format高级流格式)ASF 是 MICROSOFT为了和现在的 Real player 竞争而发展出来的一种可以直接在网上观看视频节目的文件压缩格式。ASF使用了 MPEG4 的压缩算法壓缩率和图像的质量都很不错。因为 ASF 是以一个可以在网上即时观赏的视频"流"格式存在的所以它的图像质量比 VCD 差一点点并不出奇,但比同昰视频"流"格式的 RAM 格式要好

Interactive,就是把视频和音频编码混合在一起存储AVI也是最长寿的格式,已存在10余年了虽然发布过改版(V2.0于1996年发布),但已显老态AVI格式上限制比较多,只能有一个视频轨道和一个音频轨道(现在有非标准插件可加入最多两个音频轨道)还可以有一些附加轨道,如文字等AVI格式不提供任何控制功能。扩展名:avi

  AVI能使用的编码:

  编码组合能根据以下的例子自由选择。

7录制的电视內容多个数据流(视频和音频)在带有DVR-MS扩展的ASF容器中封装。视频使用MPEG-2标准编码音频使用MPEG-1 Layer II或者杜比数字AC-3(ATSC A/52)。扩展的格式包括内容和数字版權管理的元数据这些格式的文件有流缓存引擎(SBE.dll)生成,这是一个在Windows

  MPEG格 式:MPEG(Moving Picture Experts Group)是一个国际标准组织(ISO)认可的媒体封装形式,受到夶部份机器的支持其存储方式多样,可以适应不同的应用环境MPEG-4档的档容 器格式在Part 1(mux)、14(asp)、15(avc)等中规定。MPEG的控制功能丰富可以有多个视频(即角度)、音轨、字幕(位图字幕)等等。MPEG的一个简化版本3GP还广泛的用于准3G手机上扩展名:dat(用于VCD)、vob、mpg/mpeg、3gp/3g2(用于手机)等。

  MPEG也是Motion Picture Experts Group 的缩写这类格式包括了 MPEG-1, MPEG-2 和 MPEG-4在内的多种视频格式。MPEG-1相信是大家接触得最多的了因为目前其正在被广泛地应用在 VCD 的制作和一些视频片段下载的网絡应用上面,大部分的 VCD 都是用 MPEG1 格式压缩的( 刻录软件自动将MPEG1转为 .DAT格式 ) 使用 MPEG-1 的压缩算法,可以把一部 120 分钟长的电影压缩到 1.2 GB 左右大小MPEG-2 则是应鼡在 DVD 的制作,同时在一些
HDTV(高清晰电视广播)和一些高要求视频编辑、处理上面也有相当多的应用使用MPEG-2 的压缩算法压缩一部 120 分钟长的电影可以压缩到 5-8 GB 的大小(MPEG2的图像质量MPEG-1 与其无法比拟的)。

  MPEG-TS:MPEG传输流是数字广播和在非可靠媒体传输的标砖容器,也在蓝光光碟使用通常携带多个视频和音频流以及一个电子节目指南。

  如果你发现原来的播放软件突然打不开此类格式的AVI文件那你就要考虑是不是碰箌了n AVI。n AVI是 New AVI 的缩写是一个名为 Shadow Realm 的地下组织发展起来的一种新视频格式。它是由MicrosoftASF 压缩算法的修改而来的(并不是想象中的 AVI)视频格式追求嘚无非是压缩率和图像质量,所以 NAVI 为了追求这个目标改善了原始的 ASF 格式的一些不足,让 NAVI 可以拥有更高的帧率可以这样说,NAVI 是一种去掉視频流特性的改良型 ASF 格式

注:上述材料来源于wiki的整理。

  MKV 不是任何的编解码或者系统的标准,但实际上可封装任何的东西是一个開放以及开源的容器格式。

  Matroska很多人把它当作为MKV,其实MKV只 是Matroska媒体系列的其中一种文件Matroska是一种新的多媒体封装格式,这个封装格式可紦多种不同编码的视频及16条或以上不同格式的音频和语言不同的字幕封装到一个Matroska Media档内它也是其中一种开放源代码的多媒体封装格式。

  多媒体封装格式简称MCF、多媒体容器,是一个开放(没有身份规限免费)及自由把数据存放的格式。开发者承诺大家可以自 由地使用這种格式和经这种格式所开发的软件;又不会在这种格式普遍的时候变成一个商业的科研项目

Matroska媒体定义了三种类型的档:

  这三种文件中以MKV最为常见。

  Matroska最大的特点就是能容纳多种不同类型的视频编码、音频编码及字幕流并且它能把非常高密的RealMedia及QuickTime文 件也容纳在内,哃时将它们的音频和视频重新组织起来从而达到一个更好和鲜明的效果。

  Matroska的开发是对多种传统媒体格式的一次大挑战虽则如此,Matroska吔被开发成一个多功能的多媒体容器

  MP4,是MPEG-4定义的标准音视频容器基于ISO基础媒体文件格式(在MPEG-4 Part 12以及JPEG 2000 Part 12中定义),在MPEG-4 Part 14中描述是一种使鼡MPEG-4的多媒体电脑档案格式,副档名为.mp4以储存数码音讯及数码视讯为主。

  MOD格式是JVC生产的 硬盘摄录机所采用的存储格式名称

  MOV是评估公司的标准QuickTime视频容器。QuickTime Movie是由苹果公司 开发的容器由于苹果电脑在专业图形领域的统治地位,QuickTime格式格式基本上成为电影制作行业的通用格式1998年2月11 日,国际标准组织(ISO)认可QuickTime文件格式作为MPEG-4标准的基础。QT可存储的内容相当丰富除了视频、音频以外还可支持图片、文字(文本芓幕)等。扩展名:mov

  使用过Mac机的朋友应该多少接触过QuickTimeQuickTime原本是Apple公司用于Mac计 算机上的一种图像视频处理软件。 Quick-Time提供了两种标准图像和数芓视频编码标准格式 , 即可以支持静态的PIC和JPG图像格式动态的基于Indeo压缩法的MOV和基于MPEG压缩法的MPG视频格式。

  Ogg是Xiph.org音频编解码Vorbis和视频编解码Theora的标磚容器Ogg Media一个完全开放性的多媒体系统计划,OGM(Ogg Media File)是其容器格式OGM可以支持多视频、音频、字幕(文本字幕)等多种轨道。扩展名:ogg

  OGM(Ogg Media),是Xiph.ofg的视频编解码容器已经不再支持,并不鼓励使用

Networks公司与Macromedia公司合作推出的新一代高压缩比动画格式)。REAL VIDEO (RA、RAM)格式由一开始僦是定位就是在视频流应用方面的也可以说是视频流技术的始创者。它可以在用
56K MODEM 拨号上网的条件实现不间断的视频播放可是其图像质量比VCD差些,如果您看过那些RM压缩的影碟就可以明显对比出来了

  这是一种由RM视频格式升级延伸出的新视频格式,它的先进之处在于RMVB视頻格式打破了原先RM格式那种平均 压缩采样的方式在保证平均压缩比的 基础上合理利用比特率资源,就是说静止和动作场面少的画面场景采用较低的编码速率这样可以留出更多的带宽空间,而这些带宽会在出现快速运动的画面场景时被利用这样在保证了静止画面质量的湔提下,大幅地提高了运动图像的画面质量从而图像质量和文件大小之间就达到了微妙的平衡。另外相对于DVDrip 格式,RMVB视频也是有着较明顯的优势一部大小为700MB左右的DVD影片,如果将其转录成同样视听品质的RMVB格式其个头最多也就400MB
左右。不仅如此这种视频格式还具有内置字幕和无需外挂插件支持等独特优点。要想播放这种视频格式可以使用RealOne Player2.0或RealPlayer8.0加RealVideo9.0以上版本的解码器形式进行播放。

  VOB文件(video Object)是一个DVD视频媒體的容器格式VOB可以包含视频,音频字母和菜单整合在一个流格式中。VOB是基于MPEG PS格式但是有额外的限制和私有流的规范。MPEG PS提供非标准数據称为私有流VOB文件是MEPG PS表站中非常严格的子集。经所有的VOB文件都是MPEG PS但不是所有的MPEG PS都遵守VOB文件的定义。

Part 7)MPEG-4压缩格式或者其他,而这些在MPEG PS標准中是允许的

注:上述材料来源于wiki的整理。

  IPTV业务是指基于宽带互联网与寬带接入以机顶盒或其它具有视频编解码能力的数字化设备作为终端,通过聚合SP的各种流媒体服务内容和增值应用为用户提供多种互動多媒体服务的宽带增值业务。

  IPTV能否成功开展的一个关键点是采用什么样的视频编解码标准因为IPTV业务需要在有限的网络带宽条件下提供清晰的图像质量,对编码效率有较高的要求;同时视频编码标准的选择会直接影响到整个IPTV产业链的发展,涉及从内容编码到流媒体服務器以及组播复制点直至用户机顶盒各个层面要从某一种编码格式转换为另一种编码格式,需要进行的系统升级甚至硬件更换的成本是極其巨大的也正因为这一点,视频编码标准的选择一直是IPTV业界关注的首要问题

  2、视频编解码标准简介

  视频编解码标准有很多種,目前国内IPTV产业中主要采用了MPEG-4、H.264技术以及中国提出的具有自主知识产权的标准AVS这3种标准相对于H.264和AVS技术标准,MPEG4 ASP在流媒体和IPTV应用市场中起步时间最早因此产业化程度最成熟,IPTV设备提供商的支持也最广泛;AVS的产业化程度最低H

  .264次之。下面对这3种标准进行介绍

  运动图潒专家组(MPEG)于1999年2月正式公布了MPEG-4(ISO/IEC14496)标准第一版本。同年年底公布了MPEG-4第 2版且于2000年年初正式成为国际标准。MPEG-4与MPEG-1和MPEG-2有着很大的差异MPEG-4不只是具体压缩算法,它是针对数字电视、交互式绘图应用、交互式多媒体等整合及压缩技术的需求而制定的国际标准

  MPEG-4除采用第一代视频编码的核惢技术,如变换编码、运动估计与运动补偿、量化、熵编码外还提出了一些有创见性的关键技术,其中包括:

  (1)视频对象提取技术

  MPEG-4标准同以前标准的最显著的差别在于它是采用基于对象的编码理念即在编码时将一幅景物分成若干在时间和空间上相互联系的视频音頻对象,分别编码后再经过复用传输到接收端然后再对不同的对象分别解码,从而组合成所需要的视频和音频这样可以实现对不同的對象采用不同的编码方法和表示方法,又有利于不同数据类型间的融合同时也便于对各种对象进行操作及编辑。视频对象提取(即视频对潒分割)是MPEG-4视频编码的关键技术也是新一代视频编码的研究热点和难点。

  (2)VOP视频编码技术

Plane)是视频对象(VO)在某一时刻的采样VOP是MPEG-4视频编码的核心概念。MPEG-4在编码过程中针对不同VO采用不同的编码策略即对前景VO的压缩编码尽可能保留细节和平滑;对背景VO则采用高压缩率的编码策略,甚至不予传输而在解码端由其他背景拼接而成这种基于对象的视频编码不仅克服了第一代视频编码中高压缩率编码所产生的方块效应,洏且使用户可与场景交互从而既提高了压缩比,又实现了基于内容的交互为视频编码提供了广阔的发展空间。MPEG-4支持任意形状图像与视頻的编解码

  (3)视频编码可分级性技术

Scalability),此外还支持时域和空域的混合分级每一种分级编码都至少有两层VOL,低层称为基本层高层称為增强层。基本层提供了视频序列的基本信息增强层提供了视频序列更高的分辨率和细节。

  (4)运动估计与运动补偿技术

  MPEG-4采用I-VOP、P-VOP、B-VOP3種帧格式来表征不同的运动补偿类型它采用了H.263中的半像素搜索技术和重叠运动补偿技术,同时又引入重复填充(repetitive padding)技术和修改的块匹配(modified block matching)技术鉯支持任意形状的VOP区域

  在MPEG-4视频编码中,运动估计相当耗时对编码的实时性影响很大。因此这里特别强调快速算法运动估计方法主要有像素递归法和块匹配法两大类,前者复杂度很高实际中应用较少,后者则在H.263和MPEG中广泛采用

  2003年,ITU-T通过了一个新的数字视频编碼标准编解码标准即H.264标准,H.264是由ISO/IEC与ITU-T组成的联合视频组制定的新一代视频压缩编解码标准国际电信联盟将该系统命名为H.264/AVC,国际标准化组織和国际电工委员会将其称为14496-10/MPEG-4 AVC

  H.264标准只有3个子集:基本子集、主体子集和扩展子集。基本子集是专为视频会议应用设计的能够提供強大的差错隐消技术,并且支持低延时编/解码技术使视频会议显得更自然。主体子集和扩展子集更适合于电视应用(数字广播、DVD)和延时影響不会太大的视频流应用

H.264标准的关键技术如下:

  (1)帧内预测编码

  帧内编码用来缩减图像的空间冗余。为了提高H.264帧内编码的效率茬给定帧中充分利用相邻宏块的空间相关性,相邻的宏块通常含有相似的属性因此,在对一给定宏块编码时首先可以根据周围的宏块預测,然后对预测值与实际值的差值进行编码这样,相对于直接对该帧编码而言可以大大减小码率。H.264提供6种模式进行4×4像素宏块预测包括1种直流预测和5种方向预测,H.264也支持16×16的帧内编码

  (2)帧间预测编码

  帧间预测编码利用连续帧中的时间冗余来进行运动估计和補偿。H.264的运动补偿支持以往的视频编码标准中的大部分关键特性而且灵活地添加了更多的功能,除了支持P帧、B帧外H.264还支持一种新的流間传送帧——SP帧,码流中包含SP帧后能在有类似内容

  但有不同码率的码流之间快速切换,同时支持随机接入和快速回放模式

  在變换方面,H.264使用了基于4×4像素块的类似于DCT的变换但使用的是以整数为基础的空间变换,不存在反变换与浮点运算相比,整数 DCT变换会引起一些额外的误差但因为DCT变换后的量化也存在量化误差,与之相比整数DCT变换引起的量化误差影响并不大。此外整数DCT变换还具有减少運算量和复杂度,有利于向定点DSP移植的优点

  H.264中可选32种不同的量化步长,这与H.263中有31个量化步长很相似但是在H.264中,步长是以12.5%的复合率遞进的而不是一个固定常数。在H.264中变换系数的读出方式也有两种:之字形(Zigzag)扫描和双扫描,大多数情况下使用简单的之字形扫描;双扫描僅用于使用较小量化级的块内有助于提高编码效率。

  视频编码处理的最后一步就是熵编码H.264标准采用的熵编码有两种:一种是基于內容的自适应变长编码(CAVLC)与统一的变长编码(UVLC)结合;另一种是基于内容的自适应二进制算术编码(CABAC)。CAVLC与CABAC根据相临块的情况进行当前块的编码以达箌更好的编码效率。CABAC比CAVLC压缩效率高但要复杂一些。

  2.3 AVS标准简介

  AVS是基于我国创新技术和部分公开技术的自主标准AVS标准包括系统、视频、音频、数字版权管理等4个主要技术标准和一致性测试等支撑标准。2002年在信息产业部支持下成立了“数字音视频编解码技术标准”工作组(简称AVS工作组),在国内外上百家企业和科研单位共同参与下AVS标准制定工作进展顺利,其中最重要的视频编码标准于2005年通过国家广電总局测试2006年1月得到信息产业部批准,2月国家标准化管理委员会正式颁布3月1日起实施。

  AVS视频编解码的核心技术包括:8×8整数变换、量化、帧内预测、1/4精度像素插值、特殊的帧间预测运动补偿、二维熵编码等

  AVS的8×8变换与量化可以在16位处理器上无失配地实现,从洏克服了H.264之前所有视频压缩编码国际标准中采用的8×8 DCT变换存在失配的固有问题而H.264所采用的4×4整数变换在高分辨率的视频图像上的去相关性能不及8×8的变换有效。AVS采用了64级量化可以完全适应不同的应用和业务对码率和质量的要求。

  AVS的帧内预测技术沿袭了H.264帧内预测的思蕗用相邻块的像素预测当前块,采用代表空间域纹理方向的多种预测模式但AVS亮度和色度帧内预测都是以8×8块为单位的。亮度块采用5种預测模式色度块采用4种预测模式,而这4种模式中又有3种和亮度块的预测模式相同在编码质量相当的前提下,AVS采用较少的预测模式使方案更加简洁、实现的复杂度大为降低。

  帧间运动补偿编码是混合编码技术框架中最重要的部分之一AVS标准采用了16×16,16×88×16和8×8的塊模式进行运动补偿,而去除了H.264标准中的8×44×8,4×4的块模式目的是能更好地刻画物体运动,提高运动搜索的准确性较少的块模式,能降低运动矢量和块模式传输的开销从而提高压缩效率、降低编解码实现的复杂度。

  AVS熵编码采用自适应变长编码技术在AVS熵编码过程中,所有的语法元素和残差数据都是以指数哥伦布码的形式映射成二进制比特流采用指数哥伦布码的优势在于:一方面 ,它的硬件复雜度比较低可以根据闭合公式解析码字,无需查表;另一方面它可以根据编码元素的概率分布灵活地确定以k阶指数哥伦布码编码,如果k選得恰当则编码效率可以逼近信息熵。

  3、三种编码标准的对比与选择

  3.1 基本性能对比

  3种编码标准的基本功能对比如表1:

  表1 3种视频编解码标准的基本功能

这3种主要编码技术各有优缺点MPEG-4标准因为发布较早,产业化程度较高因此产品相对成熟,内容比较豐富、价格也较低同时算法复杂度较低,但相应的问题是编码效率也相对较低需要占用较多的带宽,对网络要求较高对于现有网络需要进行升级改造才能满足其需求。

  对于H.264标准目前市场上已经有多家厂商提供H.264芯片和机顶盒,产品开始成熟内容也逐渐丰富,而苴因为采用了多项提高图像质量和增加压缩比的技术措施在不影响视频效果的情况下能够比MPEG-4节约39%的码率,因而占用带宽较低例如要达箌标清的播放质量,MPEG-4编码需要1.5~2Mbit/s的码率而H.264只需要1.2~1.5Mbit/s码率即可;对于高清图像质量,MPEG-4编码的视频码

6~8Mbit/s而H.264只需要4~6Mbit/s。因此采用H.264可以大大节约網络带宽减少网络改造的压力,且在带宽相同的情况下能够覆盖更多的用户同时,由于H.264是由ITU-T和ISO/IEC联合制定的所以对解码兼容性有着明確的定义,具有较强的抗误码能力容易获得稳定的图像,适用于丢包率高、干扰严重的信道传输不过H.264的算法复杂度较高,系统开销也仳较大

  AVS是近几年才提出的视频标准,产业化进程落后于H.264但是AVS的编码效率与H.264相当,而算法复杂度比H.264明显低其编码复杂度相当于H.264的30%;解码复杂度相当于H.264的70%,软硬件实现成本都低于H.264;同时由于我国掌握主要知识产权专利授权模式简单,专利费用低因此可以预见AVS标准将会昰支撑国家数字音视频产业发展的重要标准。

  3.2 专利费用对比

  如果采用国外的技术标准不得不面临高昂的专利费用的问题。3种標准对应的专利费用如表2所示:

  表2 3种标准的专利费用

  可以看出在专利费方面AVS占有绝对的优势MPEG-4和H.264不仅要收软硬件的专利费,而苴还要收取节目点播费用等如果按照这两种标准的专利收费标准,中国庞大用户群将给运营商带来每年数以亿计的巨大专利费负担;而AVS只收取1元人民币的象征性费用对于运营商来讲非常具有吸引力。

  3.3 应用情况对比

  从目前的应用情况来看MPEG-4和H.264在中国市场具有一定嘚发展优势,在中国电信和中国网通已经开展的IPTV试验及商用网中 MPEG4和H.264同时存在,例如中国电信在上海截止目前已经有15万左右的IPTV用户使用嘚是H.264编码标准;广东电信的IPTV商用网也将实现MPEG4向H.264标准的整体平移。中国网通现已开展了基于AVS标准的IPTV试验由于AVS推出较晚,还处于上下游产业链嘚完善阶段在市场的推广和开拓方面还有待加强,真正商用有待验证其图像质量、商用情况是否满足商用要求和产业链的逐渐成熟目湔3种标准常见的应用场景列举如表3:

  表3 3种标准的应用场景

  3.4 三种编码标准的选择

  由上面的对比可以看出,3种编码标准在性能、设备成本、产业化程度及专利费用方面都各有千秋具体选择哪种视频编码标准还需综合考虑各方面因素。对于IPTV产业来说H.264得到了电信运营商及设备提供商的支持,目前已经逐渐占据市场主流的地位而AVS凭借低廉的专利费优势,长远来说对运营商更具诱惑力同时又得箌了中国政府的支持,今后的应用前景将比较乐观

  本文讨论了目前国内IPTV产业中主要采用的3种编码标准MPEG-4、H.264及AVS。通过介绍和对比这3种标准可以看出 H.264/AVS是目前主流的选择。当然事物都在不断发展音视频编解码技术也处于不断演进的过程中,因此多种编码标准在相当长的时間内还将继续共存今后的IPTV舞台上,编码标准将花落谁家让我们拭目以待。

我要回帖

更多关于 数字视频编码标准 的文章

 

随机推荐