现在的位置: 首页 > 综合 > 正文

MPEG-7标准概述     作者:张继东

2013年10月04日 ⁄ 综合 ⁄ 共 3108字 ⁄ 字号 评论关闭
MPEG-7标准概述     作者:张继东    发布时间:2001/06/06
 
文章摘要:
  摘要:针对现有的国际标准中还没有能够解决多媒体信息定位问题的工具,活动图象专家组决定发展一个新的国际标准──MPEG-7。本文就MPEG-7做全面的介绍。
  关键词:MPEG-7 视频 多媒体 信息定位

       


正文:  

MPEG-7标准概述


一.MPEG-7产生的背景
  在活动图象专家组(Moving Picture Experts Group, MPEG)已经制定的国际标准中,MPEG-1用来解决声音图象信息在CD-ROM上的存储,MPEG-2解决了数字电视、高清晰度电视及其伴音的压缩编码。1993年提出的MPEG-4用以解决在多媒体环境下高效存储、传输和处理声音图象信息问题,在1998年11月形成最终的正式国际标准。但在现有的国际标准中还没有能够解决多媒体信息定位问题的工具。活动图象专家组的成员们认识到这一现状和实际的需求,决定在这一应用领域发展一个新的国际标准──MPEG-7,旨在解决对多媒体信息描述的标准问题,并将该描述与所描述的内容相联系,以实现快速有效的搜索。只有首先解决了多媒体信息的规范化描述之后,才能更好地实现信息定位。该标准不包括对描述特征的自动提取。它的正式名称是"多媒体内容描述接口(Multimedia Content Description Interface)"。MPEG-7标准可以独立于其它MPEG标准使用,但MPEG-4中所定义的音频、视频对象的描述适用于MPEG-7。MPEG-7的适用范围广泛,既可应用于存储(在线或离线),也可以用于流式应用(如广播、将模型加入互联网等)。它还可在实时或非实时的环境下应用,实时环境指的是当信息被捕获时是与所描述的内容相联系的。
二 MPEG-7的目标和对象
  MPEG-7标准的目的是要制定一种针对各类多媒体信息的描述标准。该描述与内容有关,并能够达到快速高效地搜索用户感兴趣的素材。
  无论描述的形式如何,描述都可以附在任何一种多媒体素材之后。具有此种附加信息的存储素材就可以被方便地索引和搜索了。尽管MPEG-7描述与被描述内容的表达方式无关,但在一定程度上还是依赖于MPEG-4标准,在该标准中提供了一种将声音图象内容作为在时间(同步)和空间(屏幕)上有一定联系的对象来编码的方法。
对不同类型、不同应用的多媒体信息的标准化描述可以在若干个不同的语义层上进行。比如以视频内容为例:低抽象的语义层可以是对场景中物体的形状、大小、纹理、色彩和位置的描述。而最高抽象的语义层则以高效编码的形式给出语义信息,如:'这是一个位于左侧的棕色狗和一个在右侧并下落着的篮色球的场景'。也可以有中间层存在。不同的应用决定了相同的内容可以有不同的描述,对不同类型的信息描述也不相同。
  对MPEG-7而言,需要描述的各种多媒体信息素材包括:静止图片、图形、声音、运动图象,以及有关这些元素如何组合成多媒体表述的组合信息。换而言之,MPEG-7定义的"多媒体"含义十分广泛,包括:
  1. 客观类:图像、图表、文本、三维模型、音频、语音、视频等。
  2. 主观类:对对象/事件的概括、人的感性色彩等。
  3. 合成类:各种元素之间的有机结合以构成一个真正意义上的多媒体演示。如人的面部表情、性格特征、以至一段电影的主题都是MPEG-7中的数据类型之一。
  为此,MPEG-7定义了"标准描述子集合(Standard Set of Descriptors)"用于描述各种类型的多媒体数据,与之相应的"描述方案( Description Schemes)"用于规范多媒体描述子的生成和不同描述子之间的有机联系。这些描述子与所指定的多媒体对象的内容紧密联系,采用提取对象特征的方法为实现基于内容的语义的准确检索提供了接口。在此基础上,MPEG-7定义了一种新的语言-"描述定义语言(Description Definition Language)"用于指定和生成描述方案。
  和VHDL语言在超大规模集成电路应用中所扮演的角色一样,DDL语言是MPEG-7 的核心。图1解释了描述定义语言、描述方案和描述子的关系。从功能的角度来看,DDL提供了DS/D建立的机制,DS/D则构成了多媒体描述生成的基础。
  要充分地利用多媒体信息描述,特征(或'描述子')的自动提取是十分有用的。但是根据MPEG一贯坚持的"制定最少的、最有用的"原则,MPEG-7主要集中在对便于多媒体信息分
类的表达方法进行标准化。而特征提取算法、声音图象内容识别工具不属于MPEG-7标准的界定范围。同样搜索机制和音频或视频回放技术也不包括在MPEG-7标准中,而只确定描述与搜索机制之间的接口,见下图说明。开发声音图象内容识别工具、特征抽取工具、搜索和音频视频回放工具是工业界的任务,他们会生产销售符合MPEG-7的产品。而在标准发展过程中,正如MPEG-1,-2和-4那样,活动图象专家组会建立一些编码工具(如MPEG-2的Test Model, MPEG-4的Verification Model等),但这些编码工具只作研究之用,并不作为标准。

图1描述定义语言、描述方案和描述子的关系


  符合MPEG-7标准的描述可以是手工输入的,也可以是自动提取的,标准中对此并不作规定。但某些特征最好自动提取(如色彩、纹理),但另一些特征(如:这一场景包括三双鞋,那段音乐录于1995年等)则很难甚至不可能自动提取,所以要根据描述的内容和层次来决定。
  MPEG-7可以独立于其它MPEG标准使用,例如符合MPEG-7标准的描述甚至可以附在非数字模拟影片之后。但是MPEG-7标准也利用了MPEG-4标准提供的用对象来描述声音图象数据的方法,这一表达方法是多媒体信息分类过程的基础。同时,MPEG-7描述又可以帮助改进以往MPEG标准编码的性能。所以各MPEG标准是即相互独立又相互联系的。
三 MPEG-7标准的特点
  MPEG-7 标准的目的是要规定一个描述各种多媒体信息的描述子的标准集和定义其它的描述子和用于描述子结构和关系的描述方案的标准方式。更重要的是,考虑到面向用户,描述子和描述方案是基于内容。
在MPEG-7标准中,最具特点的相关应用方案是:交换处理,多媒体内容的个性化窗口和分配处理。
  1. 内容交换:一个可互操作的内容描述标准使得来自不同视频音频数据库的多媒体内容交换成为可能。MPEG-7将提供各种方法用来表达,翻译,交换和重新利用不同来源的视频音频资料。因为MPEG-7提出采用一种单一的可交互操作的交换格式,这样交换格式独立于任何系统和信息提供商(厂家)。这样多媒体内容描述的互换就可以实现。
  2. 个性化窗口:MPEG-7标准提供的检索和交换视频音频数据的结构和语义注解能力,使得使用者在用户端能设定显示而无须要求从内容广播商那儿再次将其以不同格式下载一遍。
  3. 分配处理:独立于任何系统,应用,厂商,MPEG-7将保证视频音频资料描述的交换能力。因此,服从于此标准的,来源不同的数据能适用各种各样的应用,诸如:多媒体检索系统和处理器,筛选系统等等。

四 MPEG-7标准的应用
  MPEG-7标准的应用领域十分广泛,包括:

    o 数字图书馆(图象目录,音乐字典…)
    o 多媒体目录服务(例如黄页号薄…)
    o 广播媒体选择(无线电频道,TV频道…)
    o 多媒体编辑(个人电子新闻服务,媒体写作)
    o 在教育,娱乐(例如查找游戏,KARAOKE) ,医疗应用,地理信息系统,等领域都有潜在的应用价值。见图 2所示:


图2 MPEG-7在多媒体信息查询中的作用

抱歉!评论已关闭.