标清信号经mpeg4处理后还是标淸吗?,

媒体业务是网络的主要业务之间尤其移动互联网业务的兴起,在运营商和应用开发商中媒体业务份量极重,其中媒体的编解码服务涉及需求分析、应用开发、释放license收費等等最近因为项目的关系,需要理媒体的codec比较搞的是,在豆丁网上看运营商的规范 标准同一运营商同样的业务在不同文档中不同嘚要求,而且有些要求就我看来应当是历史的延续也就是现在已经很少采用了。所以豆丁上看不出所以然从 wiki上查。中文的wiki信息量有限很短,而wiki的英文内容内多删减版也减肥得太过。我在网上还看到一个山寨的中文wiki长得很像,红色的叫“天下维客”。wiki的中文还是佷不错的但是阅读后建议再阅读英文。

  我对媒体codec做了一些整理和总结资料来源于wiki,小部分来源于网络博客的收集网友资料我们將给出来源。如果资料已经转手几趟就没办法雁过留声,我们只能给出某个轨迹

  编解码器(codec)指的是一个能够对一个信号或者一個数据流进行变换的设备或者程序。这里指的变换既包括将 信号或者数据流进行编码(通常是为了传输、存储或者加密)或者提取得到一個编码流的操作也包括为了观察或者处理从这个编码流中恢复适合观察或操作的形式的操作。编解码器经常用在视频会议和流媒体等应鼡中

  很多多媒体数据流需要同时包含音频数据和视频数据,这时通常会加入一些用于音频和视频数据同步的元数据例如字幕。这彡种数据流可能会被不同的程序进程或者硬件处理,但是当它们传输或者存储的时候这三种数据通常是被封装在一起的。通常这种封裝是通过视频文件格 式来实现的例如常见的*.mpg, *.avi, *.mov, *.mp4, *.rm, *.ogg or

我去MEPG-LA网上查阅,发现有AVC/的WebORB用于Java的WebORB,以及开源的Red5服务器在2008年4月,这个协议有流录像提供鈈需要重新编码

  RTMP,实时消息协议Real Time Message Protocol是一个有Adobe System为在互联网的音频,视频和数据流开发的私有协议运行在Flash播放器和服务器之间。RTMP协议有彡个方式: 
1、 通过在TCP上使用1935端口的“纯”协议。 
2、 用于在穿越防火墙时在HTTP请求中封装的RTMPT。 

注:上述材料来源于wiki的整理

  M-JPEG(Motion-JoinPhotographicExpertsGroup)技术即运动静止图像(或逐帧)压缩技术,广泛应用于非线性编辑领域可精确到帧编辑和多层图像处理把运动的视频序列作为连续的静止图潒来处理,这种压缩方式单独完整地压缩每 一帧在编辑过程中可随机存储每一帧,可进行精确到帧的编辑此外M-JPEG的压缩和解压缩是对称嘚,可由相同的硬件和软件实现

  同样格式的MPEG视 频压缩不同于帧间压缩,因为压缩比特率比较低所以编码与 解码相对比较容易,并鈈需要过多的运算能力也使得软件或者芯片可以十分容易地对Motion JPEG进行编辑。也因为此一些移动设备,如数码相机使用MotionJPEG来进行短片的编码

  虽然JPEG2000在技术上有一定的优势,但是到目前为止(2006年)互联网上采用JPEG2000技术 制作的图像文件数量仍然很少,并且大多数的浏览器仍然沒有缺省支持JPEG2000图像文件的显示但是,由于 JPEG2000在无损压缩下仍然能有比较好的压缩率所以JPEG2000在图像品质要求比较高的医学图像的分析和处理Φ已经有了一定程度的广泛应用。

  这是由MPEG-4衍生出的另一种视频编码(压缩)标准也即通常所说的DVDrip格式,它采用了MPEG4 的压缩算法同时又综匼了MPEG-4 与MP3各方面的技术说白了就是使用DivX压缩技术对DVD盘片的视频图像进行高质量压缩,同时用MP3或AC3对音频进行压缩然后再将视频与音频 合成並加上相应的外挂字幕文件而形成的视频格式。其画质直逼DVD并且体积只有DVD的数分之一这种编码对机器的要求也不高,所以DivX视频编码技术 鈳以说是一种对DVD造成威胁最大的新生视频压缩格式号称DVD杀手或DVD终结者。

  ISO公布了“超低比特率活动图像和语音压缩标准 ”排序MPEG-4,1998年10朤批准第一版,1994年4月又公布了第二版及其校验模型(VM)MPEG-4正式编号是ISO/IEC国际标准 14496,它是一种新型的多媒体标准它与前标准一个重要区别僦在于,是一个基于对象的视编码压缩标准所定义的码率控制的目标就是获得在给定码率下的最优质量,它为互联网上传输高质量的多媒体视频提供了很好的技术平台

  1998年微软开发了第一个在PC上使用的MPEG-4编码器,它包括MS MPEG4V1、MSMPEG4V2、MS MPEG4V3的系列编码内码其中V1和V2用来制作AVI文件,一矗到现在它都是作为Windows的默认组件不过V1和V2的编码质量不是很好,一直到MS MPEG4V3才开始有好转画质有了显着的进步,但是不知微软出于什么目的却将这个MS MPEGV3的视频编码内核封闭,仅仅使其应用于Windows Media流媒体技术上也就是我们熟悉的ASF流媒体文件中。ASF文件虽然有一些优势但是由于过分嘚封闭不能被编辑,末得到广泛应用这便惹怒了那些个不怕天不怕地的视频黑客和致力于钻研视频编码的高手,后来这些小组不仅破解了微软的视频编码,而且经过他们的修改一种新的视频编码诞生了:那就是

  DivX采用了MS的MPEGV3,改良后并加入自己功能称之为DivX3.11也是目前互联网上普通采用的 MPEG-4编码器之一。很快DivX被传得红得发紫,几乎成了业界的标准但是,同样很快地出现了DivX的基础技术是非法盗用微軟的,微软声称将 对所有推动DivX发展的人、企业进行追究可是DivX技术的创造者之一罗达(Rota)正全面申请将DivX合法化,这是基于DivX虽然是从Window的发明絀来的但却没有用过任何微软的技术,更组建新公司DivXNetworks全力推广DivX看来DivX(俗称压缩电影)蓬勃发展 的大潮是势不可挡了。

  看来任何吸引眼球的故事在关键时刻都会发生转折DivX的发展竟也不能脱离这一俗套,就在DivX顺利发展时 期DivX的技术逐渐成熟,商机无限的时候一台好戲上演了,DivXNetworks成立初衷就是摆脱微软的技术封闭因而发起一个完全开放源码的项目,名为 “ Projet Mayo ”目标是开发一套全新的、开放源码的MPEG4编码軟件,由于它完全符合ISO MPEG标准又是完全开放源代码,OpenDivXCODEC吸引了 很多软件视频高手参与,很快便开发出具有更高性能的编码器Encore2等等就在DivX朂辉煌的时期,DXN公司突然封闭了DivX的源代码并在 Encore2的基础上发布了自有产品DivX4,原来DXN早就给自己留了后门DivX采取的是LGPL协议,而不是GPL协议虽说咜们都是公共许 可证协议,保障自由使用和修改软件或源码的权利但LGPL允许私有,DXN就是利用这一协议初其不备的耍出了大刀

  接着,佷多被DXN公司狠狠涮了一回的软件、视频团体另起门户逐渐重新聚拢开发力量,高举复仇大旗在OpenDivX版本基础上,再次开发出一种新的MPEG-4编碼--XviD名字的顺序和DviX刚好相反,仅仅从名字就可以看出Xvid充满了复仇的力量

  DivX是近一两年来称霸网络视频的图像压缩编码标准。起初它是鉯微软MPEG 4视频编码标准为基础修改和开发的并以免费方式发布。其特点是具有十分不错的压缩比率可以将一整套DVD质量的影片压缩存放到┅张CD-R光盘中。现 在的DivX分为普通版和Pro版其中后者还有收费版和Adware(广告)版两种,自带DivX Player程序进行播放用户如果安装了免费的DivX

注:上述材料來源于wiki的整理。

视频是现在电脑中多媒体系统中的重要一环为了适应储存视频的需要,人们设定了不同的视频文件格式来把视频和音频放在一个文件中以方便同时回放。视频档实际上都是一个容器里面包裹着不同的轨道使用的容器的格式关系到视频档的可扩展性。

  FourCC全称Four-Character Codes是由4个字符(4 bytes)组成,是一种独立标示视频数据流格式的四字节在wav、avi档案之中会有一段FourCC来描述这个AVI档案,是利用何种codec来 编码的因此wav、avi大量存在等于“IDP3”的FourCC。

  3GP(3GPP文件格式)是一个多媒体容器由第三代合作伙伴计划(3GPP)针对3G UMTS多媒体服务定义它用于3G移动电话,泹也可以用于某些2G和4G的电话3GP在ETSI 3GPP技术规范中定义,他是视频文件格式并带有讲话/音频媒体类型和带时间信息的文本,用于IMSMMS,多媒体广播/多播服务(MBMS)和传输端到端的包交换流媒体服务(PSS)

  3G2(3GPP2文件格式)是一个多媒体容器有3GPP2为3G CDMA 2000多媒体服务定义。她与3GP文件格式非常相姒但与之相比存在一些扩展和限制。3G2在3GPP2技术规范中定义

  3GP和3G2文件格式都是基于在ISO/IEC 14496-12(MPEG-4 Part 12)定义的ISO基础媒体文件格式,但是老板不的3GP文件格式不具有其中某些属性3GP和3G2与MP4(MPEG-4 Part 14)相似,MP4也是基于MPEP-4 Part 123GP和3G2设计目的是为移动电话减少存储和带宽要求,它们是非常相似的标准但有区别:

  • 3GPP 文件格式用于GSM类电话,文件扩展名:.3gp
  • 3GPP2文件格式用于CDMA类电话并具有文件扩展名:.3g2

v2)。3GPP允许ISO基础文件格式(MPEG-4Part12)中使用AMR和H.263编解码因为3GPP在ISO基础攵件格式中规定了采样条目和模板字段的使用,可以为编解码定义新的box这些 扩展在ISO基础媒体文家格式(“MP4家族”文件)中由登记授权登記为code-point。对于在3GP文件中存贮MPEG-4媒体3GP规定参加了MP4和AVC文件格式规范,它们也是基于ISO基础媒体文件格式MP4和AVC文件格式规范描述在ISO基础媒体文件格式Φ使用MPEG-4内容。 有些手机使用.mp4作为3GP视频的扩展

  3GP格式视频有两种分辨率:

  • 分辨率176×144,适合市面上所有支持3GP格式的手机
  • 分辨率320×240,晰適合高档手机、MP4播放器、PSP以及苹果iPod.

  ANIM标准的多媒体文件用于经典的Commodore Amiga的数字动画。它遵循IFF ILBM主规范他是第一个动画格式被操作系统正式采納。

  微软WMA和WMV的标准容器

  ASF (Advanced Streaming format高级流格式)。ASF 是 MICROSOFT为了和现在的 Real player 竞争而发展出来的一种可以直接在网上观看视频节目的文件压缩格式ASF使鼡了 MPEG4 的压缩算法,压缩率和图像的质量都很不错因为 ASF 是以一个可以在网上即时观赏的视频"流"格式存在的,所以它的图像质量比 VCD 差一点点並不出奇但比同是视频"流"格式的 RAM 格式要好。

Interactive就是把视频和音频编码混合在一起存储。AVI也是最长寿的格式已存在10余年了,虽然发布过妀版(V2.0于1996年发布)但已显老态。AVI格式上限制比较多只能有一个视频轨道和一个音频轨道(现在有非标准插件可加入最多两个音频轨道),还可以有一些附加轨道如文字等。AVI格式不提供任何控制功能扩展名:avi。

  AVI能使用的编码:

  编码组合能根据以下的例子自由選择

7录制的电视内容。多个数据流(视频和音频)在带有DVR-MS扩展的ASF容器中封装视频使用MPEG-2标准编码,音频使用MPEG-1 Layer II或者杜比数字AC-3(ATSC A/52)扩展的格式包括内容和数字版权管理的元数据。这些格式的文件有流缓存引擎(SBE.dll)生成这是一个在Windows XP Service Pack 1的DirectShow组件。

  MPEG格 式:MPEG(Moving Picture Experts Group)是一个国际标准组织(ISO)認可的媒体封装形式,受到大部份机器的支持其存储方式多样,可以适应不同的应用环境MPEG-4档的档容 器格式在Part 1(mux)、14(asp)、15(avc)等中规定。MPEG的控制功能丰富可以有多个视频(即角度)、音轨、字幕(位图字幕)等等。MPEG的一个简化版本3GP还广泛的用于准3G手机上扩展名:dat(用于VCD)、vob、mpg/mpeg、3gp/3g2(用于掱机)等。

  MPEG也是Motion Picture Experts Group 的缩写这类格式包括了 MPEG-1, MPEG-2 和 MPEG-4在内的多种视频格式。MPEG-1相信是大家接触得最多的了因为目前其正在被广泛地应用在 VCD 的制莋和一些视频片段下载的网络应用上面,大部分的 VCD 都是用 MPEG1 格式压缩的( 刻录软件自动将MPEG1转为 .DAT格式 ) 使用 MPEG-1 的压缩算法,可以把一部 120 分钟长的电影压缩到 1.2 GB 左右大小MPEG-2 则是应用在 DVD 的制作,同时在一些 HDTV(高晰电视广播)和一些高要求视频编辑、处理上面也有相当多的应用使用MPEG-2 的压缩算法压缩一部 120 分钟长的电影可以压缩到 5-8 GB 的大小(MPEG2的图像质量MPEG-1 与其无法比拟的)。

  MPEG-TS:MPEG传输流是数字广播和在非可靠媒体传输的标砖容器,也在蓝光光碟使用通常携带多个视频和音频流以及一个电子节目指南。

  如果你发现原来的播放软件突然打不开此类格式的AVI文件那你就要考虑是不是碰到了n AVI。n AVI是 New AVI 的缩写是一个名为 Shadow Realm 的地下组织发展起来的一种新视频格式。它是由MicrosoftASF 压缩算法的修改而来的(并不是想潒中的 AVI)视频格式追求的无非是压缩率和图像质量,所以 NAVI 为了追求这个目标改善了原始的 ASF 格式的一些不足,让 NAVI 可以拥有更高的帧率鈳以这样说,NAVI 是一种去掉视频流特性的改良型 ASF 格式

注:上述材料来源于wiki的整理。

  MKV 不是任何的编解码或者系统的标准,但实际上可葑装任何的东西是一个开放以及开源的容器格式。

  Matroska很多人把它当作为MKV,其实MKV只 是Matroska媒体系列的其中一种文件Matroska是一种新的多媒体封裝格式,这个封装格式可把多种不同编码的视频及16条或以上不同格式的音频和语言不同的字幕封装到一个Matroska Media档内它也是其中一种开放源代碼的多媒体封装格式。

  多媒体封装格式简称MCF、多媒体容器,是一个开放(没有身份规限免费)及自由把数据存放的格式。开发者承诺大家可以自 由地使用这种格式和经这种格式所开发的软件;又不会在这种格式普遍的时候变成一个商业的科研项目

Matroska媒体定义了三种類型的档:

  这三种文件中以MKV最为常见。

  Matroska最大的特点就是能容纳多种不同类型的视频编码、音频编码及字幕流并且它能把非常高密的RealMedia及QuickTime文 件也容纳在内,同时将它们的音频和视频重新组织起来从而达到一个更好和鲜明的效果。

  Matroska的开发是对多种传统媒体格式的┅次大挑战虽则如此,Matroska也被开发成一个多功能的多媒体容器

  MP4,是MPEG-4定义的标准音视频容器基于ISO基础媒体文件格式(在MPEG-4 Part 12以及JPEG 2000 Part 12中定义),在MPEG-4 Part 14中描述是一种使用MPEG-4的多媒体电脑档案格式,副档名为.mp4以储存数码音讯及数码视讯为主。

  MOD格式是JVC生产的 硬盘摄录机所采用的存储格式名称

  MOV是评估公司的标准QuickTime视频容器。QuickTime Movie是由苹果公司 开发的容器由于苹果电脑在专业图形领域的统治地位,QuickTime格式格式基本上荿为电影制作行业的通用格式1998年2月11 日,国际标准组织(ISO)认可QuickTime文件格式作为MPEG-4标准的基础。QT可存储的内容相当丰富除了视频、音频以外还鈳支持图片、文字(文本字幕)等。扩展名:mov

  使用过Mac机的朋友应该多少接触过QuickTimeQuickTime原本是Apple公司用于Mac计 算机上的一种图像视频处理软件。 Quick-Time提供了两种标准图像和数字视频格式 , 即可以支持静态的PIC和JPG图像格式动态的基于Indeo压缩法的MOV和基于MPEG压缩法的MPG视频格式。

  Ogg是Xiph.org音频编解码Vorbis和視频编解码Theora的标砖容器Ogg Media一个完全开放性的多媒体系统计划,OGM(Ogg Media File)是其容器格式OGM可以支持多视频、音频、字幕(文本字幕)等多种轨道。扩展名:ogg

  OGM(Ogg Media),是Xiph.ofg的视频编解码容器已经不再支持,并不鼓励使用

Networks公司与Macromedia公司合作推出的新一代高压缩比动画格式)。REAL VIDEO (RA、RAM)格式由一开始就是定位就是在视频流应用方面的也可以说是视频流技术的始创者。它可以在用 56K MODEM 拨号上网的条件实现不间断的视频播放可是其图像质量比VCD差些,如果您看过那些RM压缩的影碟就可以明显对比出来了

  这是一种由RM视频格式升级延伸出的新视频格式,它的先进之处在于RMVB视频格式打破了原先RM格式那种平均 压缩采样的方式在保证平均压缩比的 基础上合理利用比特率资源,就是说静止和动作场媔少的画面场景采用较低的编码速率这样可以留出更多的带宽空间,而这些带宽会在出现快速运动的画面场景时被利用这样在保证了靜止画面质量的前提下,大幅地提高了运动图像的画面质量从而图像质量和文件大小之间就达到了微妙的平衡。另外相对于DVDrip 格式,RMVB视頻也是有着较明显的优势一部大小为700MB左右的DVD影片,如果将其转录成同样视听品质的RMVB格式其个头最多也就400MB 左右。不仅如此这种视频格式还具有内置字幕和无需外挂插件支持等独特优点。要想播放这种视频格式可以使用RealOne Player2.0或RealPlayer8.0加RealVideo9.0以上版本的解码器形式进行播放。

  VOB文件(video Object)是一个DVD视频媒体的容器格式VOB可以包含视频,音频字母和菜单整合在一个流格式中。VOB是基于MPEG PS格式但是有额外的限制和私有流的规范。MPEG PS提供非标准数据称为私有流VOB文件是MEPG PS表站中非常严格的子集。经所有的VOB文件都是MPEG PS但不是所有的MPEG PS都遵守VOB文件的定义。

Part 7)MPEG-4压缩格式或者其他,而这些在MPEG PS标准中是允许的

注:上述材料来源于wiki的整理

  在上次对MPEG-2的学习整理中有┅个疑惑,双声道理解就是左右立体声,但是5.1声道是什么我们经常看到杜比5.1声道的说法。“0.1”声道具体指什么今天去wiki查了一下,相關内容也整理入我们的学习笔记本文档资料来源:

  使用杜比数字技术下,最标准常用的是5.1声道设置但杜比数字容许一系列不同声道嘚选择。全部可供选择的声道如下列所示:

  • 双声道立体声(左、右)选择性地交叉应用杜比环回
  • 三声道立体声(左、中、右)
  • 双声道立体聲加单环回(左、右、环回)
  • 三声道立体声加单环回(左、中、右、环回)
  • 四声道环回立体声(左前、右前、左后、右后)
  • 五声道环回立體声(左前、中、右前、左后、右后)

  以上所有这些设置可选择性地使用低频效果和杜比数字EX矩阵编码中加入附加后环绕声道。杜比編码技术是向下兼容的很多杜比播放器/解码器均备有向下混音作用是发布不同声道至可供使用的扬声器。这包括一些功能例如声音数據通过前扬声器播放(如适用)和当中央扬声器不适用时发布中央频道至左或右扬声器。或当用户只有2.0喇叭时杜比解码器能把多声道信号混音编码为

  在5.1, 7.1 或其他等文字中,'.1'指的是低频LFE声道

  其实5.1声道就是使用5个喇叭和1个超低音扬声器来实现一种身临其境的音乐播放方式,它是由杜比公司开发的所以叫做“杜比5.1声道”。在5.1声道系统里采用左(L)、中(C)、右(R)、左后(LS)、右后(RS)五个方向输出声音使人产生犹如身临音乐厅的感觉。五个声道相互独立其中“.1” 声道,则是一个专门设计的超低音声道正是因为前后左右都有喇叭,所以就会产生被喑乐包围的真实感如右图所示。

  MPEG-4是一套用于音频、视频信息的压缩编码标准 由国际标准化组织(ISO) 和国际电工委员会(IEC)下属的“動態影像专家组”(Moving Picture Experts Group,即MPEG) 制定第一版在1998年10月通過,第二版在1999年12月通過MPEG-4格式的主要用途在於網上流媒体、光碟、

  为了应对网络傳输等环境,传统的 MPEG-1/2 已经不能适应所以促使了 MPEG-4 的诞生。与MPEG-1和MPEG-2相比MPEG-4的特点是其更适于交互AV服务以及远程监控。MPEG-4是第一个使你由被动变为主动(不再只是观看允许你加入其中,即有交互性)的动态图像标准它的另一个特点是其综合性。从根源上说MPEG-4试图将自然物体与人造物體相溶合 (视觉效果意义上的)。MPEG-4的设计目标还有更广的适应性和更灵活的可扩展性MPEG-4 采用了一系列新技术,来满足在低带宽下传输较高视频質量的需求DivX,XviDMS MPEG4 都是采用的 MPEG-4 视频编码,除了在 DVDRip 上面的应用3GPP 现在也接纳了 MPEG-4 作为视频编码方案。

  最初MPEG-4的主要目的是用于低比特率下的視频通信但是作为一个多媒体的编码标准,它的范围最后得到了扩展在技术方面MPEG-4允许不同的软件/硬件开发商创建多媒体对象来提供更恏的适应性、灵活性,为数字电视动态图像,互联网等业务提供更好的质量  

  MPEG-4提供范围从每秒几k比特到每秒数十兆比特的,它具有下面功能:

  • 改善MPEG-2的编码效率
    • MPEG-4基于更高的编码效率同已有的或即将形成的其它标准相比,在相同的比特率下它基于更高的视觉听觉質量,这就使得在低带宽的信道上传送视频、音频成为可能同时MPEG-4还能对同时发生的数据流进行编码。一个场景的多视角或多声道数据流鈳以高效、同步地合成为最终数据流这可用于虚拟三维游戏、三维电影、飞行仿真练习等。
  • 提供混合媒体数据(视频音频,语音)的編码能力
  • 差错容忍使得内容稳定传输
    • 当在传输有误码或丢包现象时,MPEG4受到的影响很小并且能迅速恢复。
  • 提供受众视听场景的互动能力MPEG-4终端用户提供不同的对象支持各种互动要求。
    • MPEG-4提供了基于内容的多媒体数据访问工具如索引、超级链接、上传、下载、删除等。利用這些工具用户可以方便地从多媒体数据库中有选择地获取自己所需的与对象有关的内容,并提供了内容的操作和位流编辑功能可应用於交互式家庭购物,淡入淡出的数字化效果等MPEG-4提供了高效的自然或合成的多媒体数据编码方法。它可以把自然场景或对象组合起来成为匼成的多媒体数据
  • MPEG-4对传输数据网是透明的,它可以兼容各种网络
    • MPEG-4提供了易出错环境的鲁棒性,来保证其在许多无线和有线网络以及存儲介质中的应用此外,MPEG-4还支持基于内容的的可分级性即把内容、质量、复杂性分成许多小块来满足不同用户的不同需求,支持具有不哃带宽不同存储容量的传输信道和接收端。
    • 这些特点无疑会加速多媒体应用的发展从中受益的应用领域有:因特网多媒体应用;广播電视;交互式视频游戏;实时可视通信;交互式存储媒体应用;演播室技术及电视后期制作;采用面部动画技术的虚拟会议;多媒体邮件;移动通信条件下的多媒体应用;远程视频监控;通过ATM网络等进行的远程数据库业务等。

MPEG-4视频编码核心思想

  在MPEG-4制定之前MPEG-1、MPEG-2、H.261、H.263都是采用第一代压缩编码技术,着眼于图像信号的统计特性来设计编码器属于波形编码的范畴。第一代压缩编码方案把视频序列按时间先后汾为一系列帧每一帧图像又分成宏块以进行运动补偿和编码,这种编码方案存在以下缺陷:

  • 将图像固定地分成相同大小的块在高压缩仳的情况下会出现严重的块效应,即马赛克效应;
  • 不能对图像内容进行访问、编辑和回放等操作;

  MPEG-4则代表了基于模型/对象的第二代压縮编码技术它充分利用了人眼视觉特性,抓住了图像信息传输的本质从轮廓、纹理思路出发,支持基于视觉内容的交互功能这适应叻多媒体信息的应用由播放型转向基于内容的访问、检索及操作的发展趋势。

Object)是MPEG-4为支持基于内容编码而提出的重要概念对象是指在一個场景中能够访问和操纵的实体,对象的划分可根据其独特的纹理、运动、形状、模型和高层语义为依据在MPEG-4中所见的视音频已不再是过詓MPEG-1、MPEG-2中图像帧的概念,而是一个个视听场景(AV场景)这些不同的AV场景由不同的AV对象组成。AV对象是听觉、视觉、或者视听内容的表示单元其基本单位是原始AV对象,它可以是自然的或合成的声音、图像原始AV对象具有高效编码、高效存储与传输以及可交互操作的特性,它又鈳进一步组成复合AV对象因此MPEG-4标准的基本内容就是对AV对象进行高效编码、组织、存储与传输。AV对象的提出使多媒体通信具有高度交互及高效编码的能力,AV对象编码就是MPEG-4的核心编码技术

  MPEG-4实现基于内容交互的首要任务就是把视频/图像分割成不同对象或者把运动对象从背景中分离出来,然后针对不同对象采用相应编码方法以实现高效压缩。因此视频对象提取即视频对象分割是MPEG-4视频编码的关键技术,也昰新一代视频编码的研究热点和难点

  MPEG-4不仅可提供高压缩率,同时也可实现更好的多媒体内容互动性及全方位的存取性它采用开放嘚编码系统,可随时加入新的编码算法模块同时也可根据不同应用需求现场配置解码器,以支持多种多媒体应用

  MPEG-4由一系列的子标准组成,被称为部包括以下的部分。对于媒体编解码重点关注Part2, Part 3, Part 10。 

  描述视訊和音訊的同步以及混合方式(Multiplexing简写为MUX)。定义了 MP4 容器格式, 支持类似 DVD 菜单这样的直观和互动特性等

  定义了一个对各种音訊信号进行编码的编解码器的集合。包括高级音訊编码(Advanced Audio Coding缩写为AAC) 的若干变形和其他一些音频/语音编码工具。即 AAC 音频标准, 包括 LC AAC, HE AAC 等, 支持 5.1 声道编码, 可以用更低的码率实现更好的效果 (相对于 MP3, OGG 等)

  定义了對本标准其他的部分进行一致性测试的程序。

  提供了用于演示功能和说明本标准其他部分功能的软件

  提供了对实现进行优化的唎子(这裡的实现指的是第五部分)。

  定义了在IP网络上传输MPEG-4内容的方式

  提供了用于演示怎样在硬件上实现本标准其他部分功能嘚硬件设计方案。

  可用于多种profile(包括2D和3D版本)的互交互媒体修订了MPEG-4 Part 1:2001以及Part1的两个修订方案。它定义了应用引擎(交付生命周期,格式可下载Java字节代码应用程序的行为),二进制场景格式(BIFS:Binary Format for

  定义了一个存储媒体内容的文件格式

  定义了基于第十二部分的用於存储MPEG-4内容的視訊檔案格式。

  定义了基于第十二部分的用于存储第十部分的视频内容的文件格式

第十八部(ISO/IEC 14496-18):字体压缩和流式传輸(针对公开字体格式)。

  MPEG-4提供大量的编码方式和丰富的设置和MPEG-2一样,应用一般不可能支持MPEG-4全集通过profile和level来描述子集。这些子集通过“profile”来表明解码器要求,为了避免计算的复杂每个profile都有一个或者多个“level”。profile和level的有效组合使得编码生成器只需实现标准中所需的子集同时保持与其他MPEG-4设备的互通。(解码支持范围通常比编码支持范围大)检查其他MPEG-4设备是否符合标准,即一致性测试

我要回帖

更多关于 清者自清 的文章

 

随机推荐