当前位置:编程学习 > Delphi >>

Delphi 多媒体技术(1)

     多媒体技术是计算机处理多种媒体信息的综合性技术。

     Delphi具有多媒体信息处理能力,包括在组件上绘制各种图形、图像的显示和处理,以及音频和视频文件的播放等多媒体设计。

本章主要内容

&       多媒体技术

&       图形设计

&       图像处理

&       视频播放组件

 

10.1 多媒体技术
10.1.1 多媒体技术的基本概念
1.多媒体与多媒体技术
    在多媒体技术中,媒体(medium)是指信息的表现形式或载体,包括文本、图形、图像、声音、动画和视频等。

   多媒体(Multimedia)是多种媒体信息的有机组合。

多媒体技术是计算机处理多种媒体信息的综合性技术,通过计算机对各种不同类型的媒体信息进行数字化采集、获取、压缩/解压缩、编辑、存储等加工处理,使多种媒体信息建立逻辑连接,形成一个可组织、存储、传送、操纵和控制多媒体信息的集成环境和交互系统。

多媒体技术具有多样性、集成性、交互性和数字化特性。

2.多媒体信息的类型
计算机能处理的多媒体信息从时效上可分为以下两大类:

·   静态媒体,包括文本、图形、图像。

·   动态媒体,包括声音、动画、视频。

(1)文本。

文本(text)是计算机中基本的信息表示方式,包含字母、数字以及各种专用符号。

(2)图形。

在计算机中,图形与图像是一对既有联系又有区别的概念。它们都是一幅图,但图的产生、处理、存储方式不同。

图形(graphics)是指通过绘图软件绘制的由直线、圆、圆弧、任意曲线等图元组成的画面,称为矢量图形。每个图元具有大小、位置、形状、颜色、维数等属性,不同的图元之间有明确的界限,多个图元可以组合或分解。

矢量图形由特定的绘图软件绘制,以矢量图形文件形式存储。矢量图形文件中存储的是一组描述各个图元属性的指令集合,通过相应的绘图软件读取这些指令,可将其转换为输出设备上显示的图形。矢量图形的最大优点是对图形中的各个图元进行缩放、移动、旋转而不失真,而且它占用的存储空间小。

计算机辅助设计(CAD)系统中常用矢量图形来描述复杂的机械零件、房屋结构等。

(3)图像。

图像(image或picture)是由扫描仪、数字照相机、摄像机等输入设备捕捉的真实场景画面产生的映像,经A/D转换变成二进制代码,并以专门的图像格式文件存储。输出时,以数字方式控制显示设备实现原来景物的重现。

(4)动画。

动画(animation)是利用人眼的视觉暂留特性得到的,当一系列图形或图像的画面按一定时间间隙在人的视线中经过时,人脑就会产生物体运行的印象。

(5)音频。

音频(audio)包括语音、音乐以及各种动物和自然界(如风、雨、雷等)发出的各种声音。音乐和解说词可使文字和画面更加生动。在计算机中的音频处理技术,主要包括声音的采集、数字化、压缩/解压缩、播放等。

(6)视频。

视频(video)图像来自录像带、摄像机、影碟机等视频信号源,是对自然景物的捕捉,数字化后以视频格式文件存储。视频的处理技术有视频信号导入、数字化、压缩/解压缩、视频和音频编辑、特效处理、输出到磁盘、光盘等,音视频的同步使视频影像具有真实的效果。

10.1.2 多媒体信息的数字化
在计算机系统中,所有多媒体信息都是按数字化格式存储、处理和传输的,不同类型的多媒体信息存储成不同格式的文件。

文本文件通常存储成.txt、.rtf、.doc等格式。

由于图像、视频、音频信号的数据量非常大,给多媒体信息的存储、处理和传输造成极大的困难。因此,减少存储量就成为多媒体技术中的一个关键问题,最有效的解决方法是数据压缩编码。

本节先介绍用于数据压缩的两个国际标准,再介绍图形图像、音视频信息的文件格式。

1.数据压缩的国际标准
20世纪80年代,国际标准化组织(ISO)和国际电信联盟(ITU)联合成立了两个专家组:联合图像专家组(Joint Photographic Experts Group,JPEG)和运动图像专家组(Moving Picture Experts Group,MPEG),分别制定了静态和动态图像压缩的工业标准。

(1)JPEG标准。

JPEG标准适用于连续色调和多级灰度的静态图像。一般对单色和彩色图像的压缩比通常分别为10∶1和15∶1。常用于CD-ROM、彩色图像传真和图文管理。

(2)MPEG标准。

MPEG标准不仅适用于运动图像,也适用于音频信息,它包含了三部分:MPEG视频、MPEG音频、MPEG系统(视频和音频的同步),MPEG视频是MPEG标准的核心。MPEG已指定了MPEG-1、MPEG-2、MPEG-4、MPEG-7和MPEG-21等多种标准。

2.图形图像文件格式
(1)BMP(.bmp)文件格式。

BMP(bitmap位图)格式存储构成图像的每个像素点的亮度和颜色等属性,BMP格式是Windows使用的基本位图格式。

显示器上的每一个光点就是一个像素。在数字化彩色显示器中,一个像素由一个二进制控制。若用一位二进制控制,“1”表示发光,“0”表示不发光,则只能是黑白显示;若用4位控制,可显示16种颜色;若用8位控制,可显示256种颜色。目前普遍使用的真彩色图像,由红、绿、蓝三基色通过不同的强度混合而成,当强度分为256级(值为0~255)时,占24位,就构成了224=16777216种颜色的“真彩色”图像。

BMP格式不进行压缩,放大和缩小时会失真。图像的分辨率和像素的颜色深度决定了图像文件的大小,计算公式如下:

位图文件容量(字节数)=列数×行数×颜色深度÷8

图像的分辨率和像素的颜色深度决定位图图像文件的容量示例见表10-1。

表10-1 位图文件容量

分 辨 率
 颜色深度(位)
 颜   色
 位图文件容量(KB)
 
640×480
 1
 单色,黑白
 38
 
640×480
 4
 16色
 150
 
640×480
 8
 256色
 300
 
640×480
 24
 真彩色
 900
 
800×600
 24
 真彩色
 1,406
 
1024×768
 24
 真彩色
 2,304
 

由此可见,对于24位真彩色图像,一幅640×480像素的图像文件需要900KB,而一幅1024×768像素的图像文件则需要2.3MB,占用存储空间较大,即使是空白图像也需要这么大的容量,必须采用编码技术来压缩信息。

(2)JPEG(.jpg)文件格式。

JPEG格式是根据JPEG标准压缩的图像格式,具有良好的压缩性能,能够存储256色以上的真彩图像。JPEG格式文件是目前保存照片等图像的常用格式。

(3)WMF(.wmf)文件格式。

WMF是比较特殊的图元文件,属于矢量图形。Windows中许多剪贴画图像是以该格式存储的,广泛应用于桌面出版印刷领域。

(4)GIF(.gif)文件格式。

GIF(Graphics Interchange Format,图形交换格式)是针对Internet应用而设计的图像格式,GIF格式的压缩比高,磁盘空间占用较少,但不能存储超过256色的图像。

GIF格式既可以存储单幅静止图像,也可以同时存储若干幅静止图像进而形成连续的动画。GIF格式具有渐显方式,即在图像传输过程中,先显示图像的大致轮廓,再逐步显示图像的各细节部分,“从朦胧到清楚”。

3.数字音频的文件格式
(1)WAV(.wav)文件格式。

WAV是Microsoft公司采用的波形声音文件存储格式,主要由外部音频(麦克风、录音机)录制后,经声卡转换成数字化信息以扩展名.wav存储,播放时还原成模拟信号由扬声器输出。WAV文件直接记录了真实声音的二进制采样数据,通常文件较大,多用于存储简短的声音片段。

记录每秒钟存储声音容量的公式为:

存储量(字节/秒)=采样频率×量化精度×声道数÷8

例如,用44.1kHz的采样频率,每个采样点用16位的精度存储,则录制1秒钟的立体声(双声道)节目,其WAV格式文件所需的存储量为:

44100×16×2÷8=176400(byte)

(2)MIDI(.mid)文件格式。

MIDI是乐器数字化接口(Musical Instrument Digital Interface)的缩写,是为了把电子乐器与计算机相连而制定的一个规范,是数字音乐的国际标准。

与WAV文件不同的是,MIDI(扩展名为.mid)文件存放的不是采样信息,而是将乐器弹奏的每个音符记录为一连串的数字,然后由声卡上的合成器根据这些数字代表的含义进行合成后由扬声器播放声音。相对于保存真实采样数据的WAV文件,MIDI文件显得更加紧凑,其文件尺寸通常比声音文件小得多。

(3)MPEG(.mp1/.mp2/.mp3)文件格式。

MPEG指的是采用MPEG音频压缩标准进行压缩的文件。MPEG音频文件的压缩是一种有损压缩,根据压缩质量和编码复杂程度的不同可分为3层(MPEG-1 Audio Player 1/2/3),分别对应MP1、MP2、MP3三种音频文件,压缩比分别为4∶1、6∶1~8∶1、10∶1~12∶1。MP3因其压缩比较高、音质接近CD、制作简单、便于交换等优点,是目前使用最多的音频格式文件。WAV和MIDI格式文件均可以压缩成MPEG格式文件。

(4)RA(.ra)文件格式。

RA(Real Audio)是Real Network公司制

补充:软件开发 , Delphi ,
CopyRight © 2012 站长网 编程知识问答 www.zzzyk.com All Rights Reserved
部份技术文章来自网络,