现在的位置: 首页 > 综合 > 正文

多媒体基础知识

2014年03月23日 ⁄ 综合 ⁄ 共 6137字 ⁄ 字号 评论关闭
 

多媒体基础知识

媒体是指承载信息的载体,可以分为感觉媒体,表示媒体、显示媒体、存储媒体和传输媒体五种。多媒体是指多种信息载体的表现形式和传递方式,即将音频、视频、图像和计算机技术、通信技术集成到同一数字环境中,以协同表示更丰富和复杂的信息。

1.1 音频

1.1.1 音频基础知识

1.     声音信号

声音是通过空气传播的一种连续的波,称为声波。声波在时间和幅度上都是连续的模拟信号,称为模拟声音信号。人们对声音的感觉主要有音量、音调和音色。

1)音量(响度):声音的强弱程度,取决于声音波形的幅度,取决于振幅的大小和强弱。

2)音调:人对声音频率的感觉表现为音调的高低,取决于声波的基频。基频越低,给人的感觉越低沉,越高越尖锐。

3)声色:由混入基音(基波)的泛音(协波)所决定,每种声音都有其固定的频率和不通音强的泛音,从而使他们具有特殊的音色效果。

4)带宽:组成声音的信号的频率范围。人耳能听到的声音的频率的范围是20HZ---20KHZ

声音信号的两个基本参数是幅度和频率。幅度是指声波的振幅,用分贝为单位计算。频率指声波每秒种变化的次数,用HZ表示,人们把频率小于20HZ声波信号成亚音信号(次音信号),频率为20HZ---20KHZ的声波信号成为音频信号,高于20KHZ的信号成为超音频信号(也称超声波)。

2.     声音信号的数字化

声音信号是一种模拟信号,计算机要对她进行处理,要转化为数字声音信号。最基本的声音信号数字化方法是取样-量化法。

(1)                                     采样:采样把时间连续的模拟信号转化成时间离散、幅度连续的信号。在某些特定的时刻获取声音信号的幅值叫采样。语音信号的采样频率一般为8KHZ,音乐信号的采样频率一般为40khz以上。

(2)                                     量化:把在幅度上连续取值的每一个样本转换为离散值。最后的样本是二进制数来表示。若每个声音样本用16b2B)表示,则声音样本的取值范围是216,065535,精度是1/65536;若用8b1B)表示,则样本的取值范围是0255,精度是1/256。量化精度越高,声音的质量越好,需要的存储空间也越多。

(3)                                     编码:经过采样和量化处理后的声音信号已经是数字形式了,还须按照一定的要求进行数据压缩和编码,以减少数据量,在按照某种规定的格式将数据组织成为文件。

3.     音频文件大小的计算

波形声音信息是一个用来表示声音振幅的数据序列,它可以通过对模拟声音按一定间隔采样获得的幅度值,再经过量化和编码后得到便于计算机存储和处理的数据格式。

未经压缩的数字音频数据传输率按下式计算:

数据传输速率(b/s)=采样频率(HZ)×量化位数(b)×声道数

波形声音经过数字化后所需占用的存储空间按下式计算:

声音信号数据文件大小=数据传输率×持续时间/8B

:若语音信号信号的带宽为3003400HZ,量化精度为8位,单声道输出,计算每秒钟及每小时的数据量。

解:采样频率为8KHZ

每秒数据量:8KHZ×8b×1/88KB/S=64Kb/s.

1小时数字语音的数据量大约为28MB

 

例:若光盘上存储的立体声高保真数字音乐的带宽为20-2000HZ,采样频率为44.1KHZ,量化精度为16位,双声道,计算1小时的数据量。

 

44.1KHZ*16b*2*1小时/8=653MB

 

1.1.2 声音的合成

个人计算机和多媒体系统中的声音,除了数字波形声音外,还有一类是使用符号表示的,由计算机合成的声音,包括语音合成和音乐合成。

1.     语音合成

语音合成目前主要指从文本到语音的合成,也称为文语转换。主要有的技术有以下三种:

1)发音参数合成:这种方法是对人的发音过程进行直接模拟,效果不理想

2)声道模型参数合成:基于声道截面积函数或声道谐振特性合成语音。比特率低,音质适中。

3)波形编辑合成:是直接把语音波形数据库中的波形拼接在一起,输出连续语流。合成的语音清晰自然。

2.音乐合成

音乐可以通过电子学原理合成出来(生成相应的波形),各种乐器的乐色也可以模拟。电子乐器由演奏控制器和音源两部分构成。

(1)    演奏控制器:一种输入和记录实时乐曲演奏信息的设备。

(2)           音源(也称为音乐合成器),音源是具体产生声音波形的部分,即电子乐器发生的部分,它通过电子线路把演奏控制器送来的声音合成器来。

1.1.              3 MIDI

MIDImusical instrument digital interface)是乐器数字接口的缩写,泛指数字音乐的国际标准,是电子乐器和MIDI装置之间的通信标准。MIDI数据不是单个采样点的编码,而是乐谱的数字描述,称为MIDI消息,乐谱由音符序列、定时、音色音量等组成,每个消息对应一个音乐事件,一组MIDI消息(如键压下、键释放等),一组MIDI消息送到MIDI音源时,音源即合成出相应的音乐。所以MIDI文件存储的不是波形而是指令序列,它最大的特点是占用空间小,而且编辑灵活,可以自由地修改曲调、音色等属性,但不能够记录人声。

1.1.              4声音文件格式

数字声音在计算机中存储和处理时,其数据必须以文件的形式进行组织,所选用的文件格式必须得到操作系统和应用软件的支持。以下为声音文件的几种格式。

1Wave文件(.WAV:来源于对声音模拟波形的采样,经过量化后生成WAV文件,即波形文件,质量非常高,但文件数据量大。

2Mod 文件(.MOD):该格式的文件里存放乐谱和乐曲使用的各种音色样本,回放效果好,音色种类多,但其低音效果差,已淘汰。

3MPEG音频文件(.MP3):压缩率大,在网络和可视电话通信方面应用广泛,但音质不能令人满意,也是波形音频文件。

4RealAudio文件(.RA):有强大的压缩比和容错性,它为了解决网络传输带宽资源而涉及的 ,因此主要目标是压缩比和容错性,其次才是音质。

5MIDI文件(.MID/.RMI):它是目前较为成熟的音乐格式,成为音乐工业的数据通信标准,文件长度小,演奏灵活。

6CD Audio文件:记录是波形流,纯正的音乐,音质很好,它的缺点是无法编辑,文件太大。

1.2.              图形和图像

1.2.1 色彩与图像基础

1.                          色彩的基本概念

彩色光作用于人眼,使之产生彩色视觉,为了确切的表示某一彩色光的度量,可以用亮度、色调、色饱和度3个量来表示。

1亮度:描述光作用于人眼时引起的明暗程度感觉,是指色彩明暗深浅程度。

2色调:指颜色的类别,如红色、绿色等不同颜色就是指色调。

3色饱和度:指某一颜色的深浅程度(或浓度),对同一色调的颜色,其饱和度越高,则颜色越深。

2.                          三基色原理

从理论上讲,任何一种颜色都可以用3种基本颜色按不同比例混合得到。自然界中常见的各种颜色光,都可用红、绿、蓝3中颜色按不同比例相配而成。

红色+绿色 = 黄色

红色+蓝色 = 品红

绿色+蓝色 = 青色

    红色+绿色+蓝色=白色

红色+青色=绿色+品红=蓝色+黄色=白色

凡是两种色光混合而成白光,则这两种色光互为补色。

3.                          彩色空间

彩色空间指色彩图像所使用的颜色描述方法,也称为彩色模型。

1RGB彩色空间:彩色图像用Rred)、Ggreen)、Bblue)分量表示,通过这三种颜色相加获得。应用在计算机彩色显示器。

2CMY彩色空间:使用青(cyan)、品红(Magenta)、黄色(yellow)为三基色相减混合。在彩色印刷、彩色胶片和绘画等打印方面应用。

3YUV彩色空间Y代表亮度信号,UV为色差信号,它的优点在于解决了彩电与黑白电视的兼容问题,并减少象素所需的位数。数字化位通常采用YUV844或者822

4YIQ彩色空间:Y代表亮度信号,I Q为色差信号,NTSC制式的彩电。

5HSI彩色空间:用色调、饱和度和亮度来描述颜色的特性。

1.2.2计算机中的图形数据的表示

在计算机中的图形数据有两种常用的表示形式,一种称为几何图形或矢量图形,简称图形;另一种称为点阵图像或位图图像。

1.                          矢量图形

矢量图形是用一系列计算机指令来描述和记录的一幅图的内容,即通过指令描述构成一幅图的所有直线、曲线、圆、圆弧、矩形等图元的位置、维数和形状。矢量图形可以方便的进行移动、缩放、变形、扭曲等变换,主要用于表示线框形的图画、工程制图等,多数CAD3D造型软件使用矢量图形作为基本的图形存储格式。

2.                          位图图像

位图图像指用象素点来描述的图,每个象素用若干位二进制来指定该象素的颜色、亮度和属性。位图适合于表现比较细腻、层次较多、色彩较丰富的图像。但占用存储空间大,需要进行数据压缩。

1.2.3图像的属性

1.                          分辨率

分辨率有两种,即显示分辨率和图像分辨率

1)显示分辨率是指显示屏上能显示出的象素数目。例如,显示分辨率为1024×768表示显示屏分成768行(垂直分辨率),每行(水平分辨率)显示1024个象素。

2)图像分辨率是指组成一幅图像的象素密度,也用水平和垂直的象素来表示,即每英寸多少点(dpi)表示数字化图像的大小。如用200dpi来扫描一幅2×2.5英寸的彩色照片,那么得到一幅400×500个象素点的图像。

当图像分辨率大于显示分辨率时,屏幕只显示部分图像,当图像分辨率小于显示分辨率时,图像只占屏幕的一部分。

2.                          图像深度

图像深度指存储每个象素所用的位数,也用于量度图像的色彩分辨率。图像深度用来确定彩色图像的每个像素可能有的颜色数,或者确定灰度图象的每个像素可能有的灰度级数。一幅图像的图像深度为b位,则该图像的最多颜色数或灰阶度为2b表示一个象素颜色的位数越多,它能表达的颜色数或灰度级越多。例如,只有1个分量的单色图像,若每个象素有8位,则最大灰度数目为28256;一幅彩色图像的每个象素用RGB三个分量来表示,若三个分量的象素位数分别为442,则最大颜色数目为24422101024,就是说象素的颜色深度

1.2.4图像文件大小的计算

条 件

实 例

说 明

知道象数,位数

一幅640×480256色图像,每个象素为16位,其文件大小约为:

640×480×16/8614 400B

16位,可以表示216种颜色,即65536种颜色,也就是每个点需要2Byte,共有640×480个点

知道象数,色数

一幅640×480256色图像,其文件大小约为:

640×480×8/8307 200B

25628,因此每个点要8位存储,即1字节

试题8
   在计算机图象处理时,图象的空间分辨率是指__A__,在 PC 机中,__B__是常用的图象格式文件的后缀名。
  若视频信号的每幅黑白图象均为 256 级灰度,1024×768 的点阵表示,当数据的压缩比为30 时,每幅图象所占的存储空间为__C__比特。以每秒 25 幅的方式播出时,容量为 600M 比特的视频图象以压缩形式在网上需传输__D__秒,传输速率不应低于每秒__E__比特。

供选择的答案:

A:(1)灰度 (2)点阵大小 (3)反差 (4)亮度
B
(1)BMP  (2)PIC     (3)WAV  (4)EXE
C
(1)0.2M (2)2M      (3)0.6M   
(4)6M
D
(1)32  (2)60    (3)87   (4)120

E
(1)5M   (2)7.5M   (3)10M  (4)25M

 

● 某数码相机的分辨率设定为1600*1200像素,颜色深度为256色,若不采用压缩存储技术,则32M字节的存储卡最多可以存储__(55)__张照片。

(55) A.8  B.17   C.34    D.69

 

1.2.5图像、图形文件格式

(1)                               BMP文件

Windows系统采用的图像文件格式,在Windows环境下运行的所有图像处理软件几乎都支持BMP文件格式。一般不采用任何压缩,占用的存储空间大,图像深度可选1位、4位、8位、及24位。

(2)                               GIF文件

是以数据块为单位来存储图像的相关信息,它可以在一个文件中存放多幅彩色图像,每一幅图像都有一个图像描述符、可选的局部彩色表和图像数据组成。把存储于一个文件中的多幅图像逐幅读出来显示,就构成了简单的动画效果。GIF图像深度从1位到8位,即最多支持256种色彩的图像,目前因特网上采用的彩色动画文件多为这种格式。

GIF文件格式定义了来年两种各种数据存储方式:一种是按连续存储,存储顺序与显示器的显示顺序相同,另一种是按交叉方式存储。由于显示图像要较长的时间,使用这种方法存放图像数据,用户可以在图像数据全部收到之前看到这幅图像的全貌,而不觉等待的时间太长。目前,GIF文件格式在HTML中得到广泛的应用。

(3)                               TIFF文件

TIFF.TIF)文件是为扫描仪和桌面出版系统开发的一种较为通用的图像文件格式,是电子出版中的重要的图像文件格式,文件体积大,信息量也大,有利于原稿色彩的复制。最高可达16M色,即可用24位深度表示。

(4)                               PCX文件

经过压缩且节约磁盘空间的PC位图格式,可表现24位,随着JPEG的出现,已经很少使用了。

(5)                               PNG文件

是作为GIF的替代品出现的,存储彩色图像时,深度可达48位,在压缩时采用无损压缩算法

(6)                               JPEG文件

JPEG.jpg)文件,采用一种有损压缩算法,压缩比例很高,适合处理大量图像的场合,是一种有损的静态图像文件存储格式。

(7)                               Targe文件

Targe.TGA)用于存储彩色图像,可支持任意大小的图像,最高彩色数可达32位,专业图形用户经常使用TGA点阵格式保存具有真实感的三位有源图像。

(8)                               WMF文件

只在Windows中使用,它保存的不是点阵信息,而是函数调用信息,它将图像保存位一系列GDI(图像设备接口)的函数调用,在恢复时,应用程序执行源文件(即执行一个函数调用)在输出社别上画出图像,具有设备无关性,常用于Office中。

抱歉!评论已关闭.