您现在的位置: 通信界 >> 视频通信 >> 技术正文  
 
MPEG系列标准及其应用
[ 通信界 / 卫视周刊 / www.cntxj.net / 2006/9/9 21:31:02 ]
 

  摘要:本文从MPEG-1、MPEG-2、MPEG-4、MPEG-7、MPEG-21标准以及它们的应用等方面,介绍了MPEG系列标准及其应用。

  随着数字化、网络化、全球一体化信息时代的来临,多媒体技术成为信息技术的重要组成部分。它包括声音、图形、数据以及图像在内的多种媒体信息的传送和处理,其关键在于压缩技术。此外,在多媒体的传输、处理、应用中还有许多问题:如何在网络上传输视频?如何通过手机上网并接收视频和图像?如何对多媒体数据进行快速有效的检索?如何对多媒体信息进行统一的存取?等等。

  MPEG是活动图像专家组(Moving Picture Exports Group)英文的缩写,于1988年成立,是为数字视/音频制定压缩标准的专家组,目前已拥有300多名成员,包括IBM、SUN、BBC、NEC、INTEL、AT&&T等世界知名公司。MPEG组织最初得到的授权是制定用于“活动图像”编码的各种标准,随后扩充为“及其伴随的音频”及其组合编码。后来针对不同的应用需求,解除了“用于数字存储媒体”的限制,成为现在制定“活动图像和音频编码”标准的组织。MPEG组织制定的各个标准都有不同的目标和应用,目前已提出MPEG-1、MPEG-2、MPEG-4、MPEG-7和MPEG-21标准。

  一、MPEG-1标准及其应用

  MPEG-1标准于1993年8月公布,用于传输1.5Mbps数据传输率的数字存储媒体运动图像及其伴音的编码。该标准包括五个部分:

  第一部分说明了如何根据第二部分(视频)以及第三部分(音频)的规定,对音频和视频进行复合编码。第四部分说明了检验解码器或编码器的输出比特流符合前三部分规定的过程。第五部分是一个用完整的C语言实现的编码和解码器。

  该标准从颁布的那一刻起,MPEG-1取得一连串的成功,如VCD和MP3的大量使用,Windows95以后的版本都带有一个MPEG-1软件解码器,可携式MPEG-1摄像机等等。

  二、MPEG-2标准及其应用

  MPEG组织于1994年推出MPEG-2压缩标准,以实现视/音频服务与应用互操作的可能性。MPEG-2标准是针对标准数字电视和高清晰度电视在各种应用下的压缩方案和系统层的详细规定,编码码率从每秒3兆比特~100兆比特,标准的正式规范在ISO/IEC13818中。MPEG-2不是MPEG-1的简单升级,MPEG-2在系统和传送方面作了更加详细的规定和进一步的完善。MPEG-2特别适用于广播级的数字电视的编码和传送,被认定为SDTV和HDTV的编码标准。MPEG-2还专门规定了多路节目的复分接方式。MPEG-2标准目前分为9个部分,统称为ISO/IEC13818国际标准。

  MPEG-2图像压缩的原理是利用了图像中的两种特性:空间相关性和时间相关性。一帧图像内的任何一个场景都是由若干像素点构成的,因此一个像素通常与它周围的某些像素在亮度和色度上存在一定的关系,这种关系叫作空间相关性;一个节目中的一个情节常常由若干帧连续图像组成的图像序列构成,一个图像序列中前后帧图像间也存在一定的关系,这种关系叫作时间相关性。这两种相关性使得图像中存在大量的冗余信息。如果我们能将这些冗余信息去除,只保留少量非相关信息进行传输,就可以大大节省传输频带。而接收机利用这些非相关信息,按照一定的解码算法,可以在保证一定的图像质量的前提下恢复原始图像。一个好的压缩编码方案就是能够最大限度地去除图像中的冗余信息

  MPEG-2的编码图像被分为三类,分别称为I帧,P帧和B帧。

  I帧图像采用帧内编码方式,即只利用了单帧图像内的空间相关性,而没有利用时间相关性。I帧使用帧内压缩,不使用运动补偿,由于I帧不依赖其它帧,所以是随机存取的入点,同时是解码的基准帧。I帧主要用于接收机的初始化和信道的获取,以及节目的切换和插入,I帧图像的压缩倍数相对较低。I帧图像是周期性出现在图像序列中的,出现频率可由编码器选择。

  P帧和B帧图像采用帧间编码方式,即同时利用了空间和时间上的相关性。P帧图像只采用前向时间预测,可以提高压缩效率和图像质量。P帧图像中可以包含帧内编码的部分,即P帧中的每一个宏块可以是前向预测,也可以是帧内编码。B帧图像采用双向时间预测,可以大大提高压缩倍数。值得注意的是,由于B帧图像采用了未来帧作为参考,因此MPEG-2编码码流中图像帧的传输顺序和显示顺序是不同的。

  P帧和B帧图像采用帧间编码方式,即同时利用了空间和时间上的相关性。P帧图像只采用前向时间预测,可以提高压缩效率和图像质量。P帧图像中可以包含帧内编码的部分,即P帧中的每一个宏块可以是前向预测,也可以是帧内编码。B帧图像采用双向时间预测,可以大大提高压缩倍数。值得注意的是,由于B帧图像采用了未来帧作为参考,因此MPEG-2编码码流中图像帧的传输顺序和显示顺序是不同的。

  MPEG-2的编码码流分为六个层次。为更好地表示编码数据,MPEG-2用句法规定了一个层次性结构。它分为六层,自上到下分别是:图像序列层、图像组(GOP)、图像、宏块条、宏块、块。MPEG-2标准的主要应用如下:

  1、视音频资料的保存

  2、非线性编辑系统及非线性编辑网络

  3、卫星传输

  4、电视节目的播出

  三、MPEG-4标准及其应用

  运动图像专家组MPEG 于1999年2月正式公布了MPEG-4(ISO/IEC14496)标准第一版本。同年年底MPEG-4第二版亦告底定,且于2000年年初正式成为国际标准。

  MPEG-4与MPEG-1和MPEG-2有很大的不同。MPEG-4不只是具体压缩算法,它是针对数字电视、交互式绘图应用(影音合成内容)、交互式多媒体(WWW、资料撷取与分散)等整合及压缩技术的需求而制定的国际标准。MPEG-4标准将众多的多媒体应用集成于一个完整的框架内,旨在为多媒体通信及应用环境提供标准的算法及工具,从而建立起一种能被多媒体传输、存储、检索等应用领域普遍采用的统一数据格式。

  MPEG-4的编码理念是:MPEG-4标准同以前标准的最显著的差别在于它是采用基于对象的编码理念,即在编码时将一幅景物分成若干在时间和空间上相互联系的视频音频对象,分别编码后,再经过复用传输到接收端,然后再对不同的对象分别解码,从而组合成所需要的视频和音频。这样既方便我们对不同的对象采用不同的编码方法和表示方法,又有利于不同数据类型间的融合,并且这样也可以方便的实现对于各种对象的操作及编辑。例如,我们可以将一个卡通人物放在真实的场景中,或者将真人置于一个虚拟的演播室里,还可以在互联网上方便的实现交互,根据自己的需要有选择的组合各种视频音频以及图形文本对象。

  MPEG-4系统的一般框架是:对自然或合成的视听内容的表示;对视听内容数据流的管理,如多点、同步、缓冲管理等;对灵活性的支持和对系统不同部分的配置。

  与MPEG-1、MPEG-2相比,MPEG-4具有如下独特的优点:

  (1)基于内容的交互性

  MPEG-4提供了基于内容的多媒体数据访问工具,如索引、超级链接、上下载、删除等。利用这些工具,用户可以方便地从多媒体数据库中有选择地获取自己所需的与对象有关的内容,并提供了内容的操作和位流编辑功能,可应用于交互式家庭购物,淡入淡出的数字化效果等。MPEG-4提供了高效的自然或合成的多媒体数据编码方法。它可以把自然场景或对象组合起来成为合成的多媒体数据。

  (2)高效的压缩性

  MPEG-4基于更高的编码效率。同已有的或即将形成的其它标准相比,在相同的比特率下,它基于更高的视觉听觉质量,这就使得在低带宽的信道上传送视频、音频成为可能。同时MPEG-4还能对同时发生的数据流进行编码。一个场景的多视角或多声道数据流可以高效、同步地合成为最终数据流。这可用于虚拟三维游戏、三维电影、飞行仿真练习等。

  (3)通用的访问性

  MPEG-4提供了易出错环境的鲁棒性,来保证其在许多无线和有线网络以及存储介质中的应用,此外,MPEG-4还支持基于内容的的可分级性,即把内容、质量、复杂性分成许多小块来满足不同用户的不同需求,支持具有不同带宽,不同存储容量的传输信道和接收端。

  这些特点无疑会加速多媒体应用的发展,从中受益的应用领域有:因特网多媒体应用;广播电视;交互式视频游戏;实时可视通信;交互式存储媒体应用;演播室技术及电视后期制作;采用面部动画技术的虚拟会议;多媒体邮件;移动通信条件下的多媒体应用;远程视频监控;通过ATM网络等进行的远程数据库业务等。MPEG-4主要应用如下:

  1、应用于因特网视音频广播

  2、应用于无线通信

  3、应用于静止图像压缩

  4、应用于电视电话

  5、应用于计算机图形、动画与仿真

  6、应用于电子游戏

  四、MPEG-7标准及其应用

  MPEG-7标准被称为“多媒体内容描述接口”,为各类多媒体信息提供一种标准化的描述,这种描述将与内容本身有关,允许快速和有效的查询用户感兴趣的资料。它将扩展现有内容识别专用解决方案的有限的能力,特别是它还包括了更多的数据类型。换而言之,MPEG-7规定一个用于描述各种不同类型多媒体信息的描述符的标准集合。该标准于1998年10月提出,于2001年最终完成并公布。

  MPEG-7的目标是支持多种音频和视觉的描述,包括自由文本、N维时空结构、统计信息、客观属性、主观属性、生产属性和组合信息。对于视觉信息,描述将包括颜色、视觉对象、纹理、草图、形状、体积、空间关系、运动及变形等。

  MPEG-7的目标是根据信息的抽象层次,提供一种描述多媒体材料的方法以便表示不同层次上的用户对信息的需求。以视觉内容为例,较低抽象层将包括形状、尺寸、纹理、颜色、运动(轨道)和位置的描述。对于音频的较低抽象层包括音调、调式、音速、音速变化、音响空间位置。最高层将给出语义信息:如“这是一个场景:一个鸭子正躲藏在树后并有一个汽车正在幕后通过。”抽象层与提取特征的方式有关:许多低层特征能以完全自动的方式提取,而高层特征需要更多人的交互作用。MPEG-7还允许依据视觉描述的查询去检索声音数据,反之也一样。

  MPEG-7的目标是支持数据管理的灵活性、数据资源的全球化和互操作性。

  MPEG-7标准化的范围包括:一系列的描述子(描述子是特征的表示法,一个描述子就是定义特征的语法和语义学);一系列的描述结构(详细说明成员之间的结构和语义);一种详细说明描述结构的语言、描述定义语言(DDL);一种或多种编码描述方法。

  MPEG-7由以下几部分组成:

  (1)MPEG-7系统:它保证MPEG-7描述有效传输和存储所必须的工具,并确保内容与描述之间进行同步,这些工具有管理和保护的智能特性;

  (2)MPEG-7描述定义语言:用来定义新的描述结构的语言;

  (3)MPEG-7音频:只涉及音频描述的描述子和描述结构;

  (4)MPEG-7视频:只涉及视频描述的描述子和描述结构;

  (5)MPEG-7属性实体和多媒体描述结构;

  (6)MPEG-7参考软件:实现MPEG-7标准相关成分的软件;

  (7)MPEG-7一致性:测试MPEG-7执行一致性的指导方针和程序。

  在我们的日常生活中,日益庞大的可利用音视频数据需要有效的多媒体系统来存取、交互。这类需求与一些重要的社会和经济问题相关,并且在许多专业和消费应用方面都是急需的,尤其是在网络高度发展的今天,而MPEG-7的最终目的是把网上的多媒体内容变成象现在的文本内容一样,具有可搜索性。这使得大众可以接触到大量的多媒体内容,MPEG-7标准可以支持非常广泛的应用,具体如下:

  (1)音视数据库的存储和检索;

  (2)广播媒体的选择(广播、电视节目);

  (3)因特网上的个性化新闻服务;

  (4)智能多媒体、多媒体编辑;

  (5)教育领域的应用(如数字多媒体图书馆等);

  (6)远程购物;

  (7)社会和文化服务(历史博物馆、艺术走廊等);

  (8)调查服务(人的特征的识别、辩论等);

  (9)遥感;

  (10)监视(交通控制、地面交通等);

  (11)生物医学应用;

  (12)建筑、不动产及内部设计;

  (13)多媒体目录服务(如,黄页、旅游信息、地理信息系统等);

  (14)家庭娱乐(个人的多媒体收集管理系统等)。

  原则上,任何类型的AV(Audio-Video)材料都可以通过任何类型的查询材料来检索,例如,AV材料可以通过视频、音乐、语言等来查询,通过搜索引擎来匹配查询数据和MPEG-7的音视频描述。

  五、MPEG-21标准及其应用

  互联网改变了物质商品交换的商业模式,这就是“电子商务”。新的市场必然带来新的问题:如何获取数字视频、音频以及合成图形等“数字商品”,如何保护多媒体内容的知识产权,如何为用户提供透明的媒体信息服务,如何检索内容,如何保证服务质量等。此外,有许多数字媒体(图片、音乐等)是由用户个人生成、使用的。这些“内容供应者”同商业内容供应商一样关心相同的事情:内容的管理和重定位、各种权利的保护、非授权存取和修改的保护、商业机密与个人隐私的保护等。目前虽然建立了传输和数字媒体消费的基础结构并确定了与此相关的诸多要素,但这些要素、规范之间还没有一个明确的关系描述方法,迫切需要一种结构或框架保证数字媒体消费的简单性,很好地处理“数字类消费”中诸要素之间的关系。MPEG-21就是在这种情况下提出的。

  制定MPEG-21标准的目的是:(1)将不同的协议、标准、技术等有机地融合在一起;(2)制定新的标准;(3)将这些不同的标准集成在一起。MPEG-21标准其实就是一些关键技术的集成,通过这种集成环境就对全球数字媒体资源进行透明和增强管理,实现内容描述、创建、发布、使用、识别、收费管理、产权保护、用户隐私权保护、终端和网络资源抽取、事件报告等功能。

  任何与MPEG-21多媒体框架标准环境交互或使用MPEG-21数字项实体的个人或团体都可以看作是用户。从纯技术角度来看,MPEG-21对于“内容供应商”和“消费者”没有任何区别。标准化是产业化成功的前提,MPEG-1已成功地在中国推动了VCD产业,MPEG-2标准又带动了DVD及数字电视等多种消费电子产业,其它MPEG标准的应用也在实施或开发中,MPEG紧扣应用发展的脉搏,与工业和应用同步。未来是信息化的社会,各种多媒体数据的传输和存储是信息处理的基本问题,因此,可以肯定MPEG系列标准将发挥越来越大的作用。

 

作者:卫视周刊 合作媒体:卫视周刊 编辑:顾北

 

 

 
 热点技术
普通技术 “5G”,真的来了!牛在哪里?
普通技术 5G,是伪命题吗?
普通技术 云视频会议关键技术浅析
普通技术 运营商语音能力开放集中管理方案分析
普通技术 5G网络商用需要“无忧”心
普通技术 面向5G应运而生的边缘计算
普通技术 简析5G时代四大关键趋势
普通技术 国家网信办就《数据安全管理办法》公开征求意见
普通技术 《车联网(智能网联汽车)直连通信使用5905-5925MHz频段管理规定(
普通技术 中兴通讯混合云解决方案,满足5G多元业务需求
普通技术 大规模MIMO将带来更多无线信道,但也使无线信道易受攻击
普通技术 蜂窝车联网的标准及关键技术及网络架构的研究
普通技术 4G与5G融合组网及互操作技术研究
普通技术 5G中CU-DU架构、设备实现及应用探讨
普通技术 无源光网络承载5G前传信号可行性的研究概述
普通技术 面向5G中传和回传网络承载解决方案
普通技术 数据中心布线系统可靠性探讨
普通技术 家庭互联网终端价值研究
普通技术 鎏信科技CEO刘舟:从连接层构建IoT云生态,聚焦CMP是关键
普通技术 SCEF引入需求分析及部署应用
  版权与免责声明: ① 凡本网注明“合作媒体:通信界”的所有作品,版权均属于通信界,未经本网授权不得转载、摘编或利用其它方式使用。已经本网授权使用作品的,应在授权范围内使用,并注明“来源:通信界”。违反上述声明者,本网将追究其相关法律责任。 ② 凡本网注明“合作媒体:XXX(非通信界)”的作品,均转载自其它媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对其真实性负责。 ③ 如因作品内容、版权和其它问题需要同本网联系的,请在一月内进行。
通信视界
华为余承东:Mate30总体销量将会超过两千万部
赵随意:媒体融合需积极求变
普通对话 苗圩:建设新一代信息基础设施 加快制造业数字
普通对话 华为余承东:Mate30总体销量将会超过两千万部
普通对话 赵随意:媒体融合需积极求变
普通对话 韦乐平:5G给光纤、光模块、WDM光器件带来新机
普通对话 安筱鹏:工业互联网——通向知识分工2.0之路
普通对话 库克:苹果不是垄断者
普通对话 华为何刚:挑战越大,成就越大
普通对话 华为董事长梁华:尽管遇到外部压力,5G在商业
普通对话 网易董事局主席丁磊:中国正在引领全球消费趋
普通对话 李彦宏:无人乘用车时代即将到来 智能交通前景
普通对话 中国联通研究院院长张云勇:双轮驱动下,工业
普通对话 “段子手”杨元庆:人工智能金句频出,他能否
普通对话 高通任命克里斯蒂安诺·阿蒙为公司总裁
普通对话 保利威视谢晓昉:深耕视频技术 助力在线教育
普通对话 九州云副总裁李开:帮助客户构建自己的云平台
通信前瞻
杨元庆:中国制造高质量发展的未来是智能制造
对话亚信科技CTO欧阳晔博士:甘为桥梁,携"电
普通对话 杨元庆:中国制造高质量发展的未来是智能制造
普通对话 对话亚信科技CTO欧阳晔博士:甘为桥梁,携"电
普通对话 对话倪光南:“中国芯”突围要发挥综合优势
普通对话 黄宇红:5G给运营商带来新价值
普通对话 雷军:小米所有OLED屏幕手机均已支持息屏显示
普通对话 马云:我挑战失败心服口服,他们才是双11背后
普通对话 2018年大数据产业发展试点示范项目名单出炉 2
普通对话 陈志刚:提速又降费,中国移动的两面精彩
普通对话 专访华为终端何刚:第三代nova已成为争夺全球
普通对话 中国普天陶雄强:物联网等新经济是最大机遇
普通对话 人人车李健:今年发力金融 拓展汽车后市场
普通对话 华为万飚:三代出贵族,PC产品已走在正确道路
普通对话 共享退潮单车入冬 智享单车却走向盈利
普通对话 Achronix发布新品单元块 推动eFPGA升级
普通对话 金柚网COO邱燕:天吴系统2.0真正形成了社保管