《数字媒体技术导论》教案课程名称:数字媒体技术
教学章节:第1章 数字媒体技术概论
教学⽬的:了解媒体、数字媒体的内涵及特性,了解数字媒体研究及应⽤开发的概况。 教学重点:了解媒体的概念、特性及分类。掌握数字媒体的定义、传播模式及其特性。指导数字媒体技术的研究及应⽤开发领域。教学难点:数字媒体特性及传播模式教学器具:教学课件。教学课时:2学时授课教师:孙清伟教学内容:章节概要:
第⼀章 数字媒体技术概论1.1 媒体及特性1.1.1媒体概念1.1.2媒体特性1.2 数字媒体及特性1.2.1数字媒体概念1.2.2数字媒体特性1.2.3数字媒体传播模式1.3 数字媒体技术的研究领域1.3.1数字媒体内容产业1.3.2数字媒体技术发展趋势1.3.3数字媒体技术研究领域1.3.4数字媒体应⽤领域主要内容
媒体概念及特性 数字媒体及特性 媒 体媒体特性
媒体分类数字媒体数字媒体特性
数字媒体的研究领域 数字媒体内容产业数字媒体技术发展趋势
数字媒体技术研究领域数字媒体传播模式数字媒体应⽤1.1 媒体及特性
媒体,有时候也被称媒介或媒质。媒体包括多种含义。
媒体是⼀种⼯具,包括信息和信息载体两个基本要素。
⼀张光盘不能称为媒体,只有记录了信息,并可进⾏信息传播时才称为媒体。1.1.1媒体概念
媒体的英⽂单词是medium,源于拉丁⽂的medius,其含义是中介、中间的意思,常⽤复数形式media。同时,媒体⼜是信息交流和传播的载体。媒体包括两层含义:
(1)传递信息的载体,称为媒介,是由⼈类发明创造的记录和表述信息的抽象载体,也称为逻辑载体,如⽂字、符号、图形、编码等。
(2)存储信息的实体,称为媒质,如纸、磁盘、光盘、磁带、半导体存储器等。载体包括实物载体、或由⼈类发明创造的承载信息的实体,也称为物理媒体。媒体分类
媒体依据信息划分具有不同表现形式。
按照⼈的感觉,媒体可分为视觉媒体、听觉媒体等;
按照信息的表现形式,媒体可分为语⾔媒体、⽂字媒体、⾳乐媒体、图形媒体、动画媒体和视频媒体等;按照信息的种类,媒体可分为新闻媒体、科技信息媒体、⽣活媒体等。媒体依据信息的载体不同⼜有不同分类。
按载体的种类不同,媒体可分为报纸、信件、电话、计算机、⽹络等;
按照不同应⽤⽅式,媒体可分为印刷媒体、幻灯、电影媒体、⼴播电视媒体、计算机媒体、计算机多媒体、⽹络媒体等。按照媒体产⽣的时间和历史,媒体⼜可以分为新媒体和旧媒体(也有⼈说是传统媒体)。按⼈们对载体的⼼理承认度,媒体⼜可分为时尚媒体和传统媒体。
按载体的传播范围,媒体⼜可分为个⼈媒体和⼤众媒体。
根据国际电信联盟(ITU:International Telecommunication Union)电信标准部推出的ITU-TI.374 建议的定义,可以将媒体划分为如下五类:
①感觉媒体②表⽰媒体③表现媒体④存储媒体⑤传输媒体
感觉媒体(Perception),是指能够直接作⽤于⼈的感觉器官,使⼈产⽣直接感觉(视、听、嗅、味、触觉)的媒体,如语⾔、⾳乐、各种图像、图形、动画、⽂本等。
表⽰媒体(Presentation),是指为了传送感觉媒体⽽⼈为研究出来的媒体,借助这⼀媒体可以更加有效地存储感觉媒体,或
者是将感觉媒体从⼀个地⽅传送到远处
另外⼀个地⽅的媒体,如语⾔编码、电报码、条形码、语⾔编码,静⽌和活动图象编码以及⽂本编码等。
显⽰媒体(Display),是显⽰感觉媒体的设备。显⽰媒体⼜分为两类,⼀类是输⼊显⽰媒体,如话筒,摄象机、光笔以及键盘等,另⼀种为输出显⽰媒体,如扬
声器、显⽰器以及打印机等,指⽤于通信中,使电信号和感觉媒体间产⽣转换⽤的媒体。
存储媒体(Storage),⽤于存储表⽰媒体,也即存放感觉媒体数字化后的代码的媒体称为存储媒体。例如磁盘、光盘、磁带、纸张等。简⽽⾔之,是指⽤于存放某种媒体的载体。
传输媒体(Transmission),传输媒体是指传输信号的物理载体,例如同轴电缆、光纤、双绞线以及电磁波等都是传输媒体。1.1.2媒体特性
现在的媒体信息⼀般是集数据、⽂字、图形与图像等为⼀体的综合媒体信息,其主要特性为:多样性、集成性、交互性、信息接收⽅便性、信息使⽤⽅便性。1.2 数字媒体及特性1.2.1数字媒体概念
计算机存储、处理和传播的信息媒体为数字媒体(digital media)。数字媒体包括两个⽅⾯。(1)信息,内容采⽤⼆进制表⽰;(2)媒介,能存储、传播⼆进制信息。
数字媒体是数字化的内容作品以现代⽹络为主要传播载体,通过完善的服务体系,分发到终端和⽤户进⾏消费的全过程。(我国的数字媒体概念) 数字媒体是指最终以⼆进制数的形式记录、处理、传播、获取的信息媒体。这些媒体包括数字化的⽂字、图形、图像、声⾳、视频影像和动画及其编码等逻辑媒体和存储、传输、显⽰逻辑媒体的物理媒体。但常常指逻辑媒体。
从微观上来讲,数字媒介就是以数字的形式存在的内容,存储、传输、接收数字媒体内容的设备。从宏观上来讲,数字媒介就是数字内容、设备和介质。1.2.2数字媒体特性(1)数字化
我们过去熟悉的媒体⼏乎都是以模拟的⽅式进⾏存储和传播的,⽽数字媒体却是以⽐特的形式通过计算机进⾏存储、处理和传播。
⽐特只是⼀种存在的状态:开或关、真或假、⾼或低、⿊或⽩,总之简记为0或1。⽐特易于复制,可以快速传播和重复使⽤,不同媒体之间可以相互混合。⽐特可以⽤来表现⽂字、图像、动画、影视、语⾳及⾳乐等信息。(2)交互性
交互性能的实现,在模拟域中是相当困难的,⽽在数字域中却容易得多。因此,具有计算机的“⼈机交互作⽤”是数字媒体的⼀个显著特点。数字媒体就是以⽹络或者信息终端为介质的互动传播媒介。(3)趣味性
互联⽹、IPTV、数字游戏、数字电视、移动流媒体等为⼈们提供了宽⼴的娱乐空间,媒体的趣味性真正体现出来。如观众可以参与电视互动节⽬,观看体育赛事的时候可以选择多个视⾓,从浩瀚的数字内容库⾥搜索并观看电影和电视节⽬,分享图⽚和家庭录像,浏览好品质内容。(4)集成性
媒体技术是结合⽂字、图形、影像、声⾳、动画等各种媒体的⼀种应⽤,并且是建⽴在数字化处理的基础上的。它不同于⼀般传统⽂件,是⼀个利⽤电脑技术的应⽤来整合各种媒体的系统。媒体依其属性的不同可分成⽂字、⾳频及视频;其中,⽂字可
分为⽂字及数字,⾳频(Audio)可分为⾳乐及语⾳,视频(Video)可分为静⽌图像、动画及影⽚等;其中包含的技术⾮常⼴,⼤致有电脑技术、超⽂本技术、光盘储存技术及影像绘图技术等。⽽计算机多媒体的应⽤领域也⽐传统多媒体更加⼴阔,如CAI、有声图书、商情咨询等,都是计算机多媒体的应⽤范围。(5)技术与艺术的融合
信息技术与⼈⽂艺术、左脑与右脑之间都有着明显差异,但数字媒体传播却可以在这些领域之间架起桥梁。计算机的发展与普及已经使信息技术离开了纯粹技术的需要,数字媒体传播需要信息技术与⼈⽂艺术的融合。例如,在开发多媒体产品时,技术专家要负责技术规划,艺术家/设计师要负责所有可视内容,清楚观众的欣赏要求。1.2.3数字媒体传播模式
数字媒体是利⽤数字电视技术、⽹络技术,通过互联⽹、宽带局域⽹、⽆线通信⽹和卫星等渠道,以电视、电脑和⼿机为终端,向⽤户提供视频、⾳频、语⾳数据服务、连线游戏、远程教育等集成信息和娱乐服务的⼀种传播形式。(1)⼤众传播模式
传统的⼤众传播媒体,是⼀对多的传播过程,由⼀个媒介出发达到⼤量的受众,如图1-1所⽰。⽆论何种媒体信息,如⽂本、图像或声⾳、视频,通过编码后都转换成⽐特。信号就是⽐特流。
图1-1 施拉姆的⼤众传播模式
实际的⾳频和视频信息都是连续变化的模拟信息。编码的过程实际上是根据⼀定的协议或格式把这种模拟信息转换成⽐特流的过程。8个⽐特组成⼀个字节,也称⼀个码字。译码是编码的逆过程,它是根据相同的协议把⽐特流转换成媒体信息,同时去掉⽐特流在传播过程中混⼊的噪声的过程。⽐特流实际上包括信息码和控制码两部分。从传播学的⾓度分析,编码是把信息转换成可供传播的符号或代码;译码就是指从传播符号中提取信息。(2)媒体信息传播模式
1949年,信息论创始⼈、贝尔实验室的数学家⾹农与韦弗⼀起提出了传播的数学模式,如图1-2所⽰。⼀个完整的信息传播过程应包括信息来源(source)、编码器(encoder)、信息(message)、通道(channel)、解码器(decoder)、接收器(receiver)。其中,“通道”就是⾹农对媒介的定义,技术上定义为铜线、同轴电缆等。
图1-2 ⾹农—韦弗的传播过程模式(3)数字媒体传输模式
数字媒体系统完全遵循信息论的通信模式。从通信技术上看,它主要由计算机和⽹络构成,如图1-3所⽰。它在传播应⽤⽅⾯⽐传统的⼤众传播更有独特的优势。在数字媒体传播模式中,信源和信宿都是计算机。因此,信源和信宿的位置是可以随时互换的。这与传统的⼤众传播如报纸、⼴播电视等相⽐,发⽣了深刻的变化和⾰命。
图1-3 数字媒体传播模式
数字媒体传播的理想信道是具有⾜够带宽的、可以传输⽐特流的⾼速⽹络信道。⽹络可能由电话线、光缆或卫星通信构成。图6描述的是两点之间的传播过程,实际上数字媒体可以是多点之间的传播,如图1-4所⽰。
图1-4 ⽹络上的多点传播模式(4)超媒体传播模式
范德⽐尔⼤学的两位⼯商管理教授——霍夫曼与纳⽡克(Donna L.Hoffman and Thomas P.Novak)提出了超媒体的概念。霍夫曼认为以计算机为媒介的超媒体传播⽅式延伸成多⼈的互动沟通模式;传播者(F-Firm)与消费者(C-Consumer)之间的信息传递是双向互动的、⾮线性的、多途径的过程,如图1-5所⽰。
图1-5 超媒体传播模式
超媒体整合全球互联⽹环境平台的电⼦媒体,包括存取该⽹络所需的各项软硬件。此媒体可达到个⼈或企业⼆者彼此以互动⽅式存取媒体内容,并透过媒体进⾏沟通。
超媒体传播理论是学者们第⼀次从传播学的⾓度研究互联⽹等新型媒介,得到了国际⽹络传播学研究者的重视。1.3 数字媒体技术的研究领域1.3.1数字媒体内容产业
互联⽹和数字技术的快速发展正在颠覆传统媒体,使得⼈们获取信息、浏览信息、以及对信息反馈的⽅式都在发⽣相当⼤的变化,如图1-6所⽰。
⽹络使⽤者媒体消费⾏为调查结果数字媒体产业价值链
数字媒体新趋势将在未来⼏年内成为不容忽视的重⼤经济驱动⼒,⽬前主要呈现出⼏⼤发展趋势。数字媒体产业价值链的延伸,是在3C融合基础上,传媒业、通信业和⼴电业相互渗透所形成的新的产业形态,如图1-7所⽰。
数字媒体产业价值链(1)内容创建
内容创建是数字媒体价值链过程中的第⼀个阶段。数字媒体对象的创建有多种⼿段,可以从⾮数字化的媒体对象中采集,例如利⽤视频采集卡、⾳频采集卡、扫描仪等设备可将电视信号、声⾳、图⽚等采集为数字媒体;可以从已有的数字媒体对象中截取,例如应⽤视频编辑软件可以截取数字视频中的某些⽚断或数字声⾳中的某⼀部分;可以从某些数字媒体对象中分离,例如将数字视频分解为静态的图⽚或单独的数字声⾳等。创建阶段的产品的存在形式⼀般是在存储介质中的各种格式的媒体⽂件。数字媒体产业价值链(2)内容管理
在数字媒体价值链中,数字媒体的内容管理是⾮常重要的⼀个阶段,包括存储管理,查询管理,⽬录、索引等等,在这个阶段,数字媒体携带的信息需要被格式化地表⽰出来,它的使⽤也将在管理阶段被规范。⽬前对数字媒体的管理⼤都是各个应⽤程序中根据应⽤的需要单独设计、单独完成的。(3)内容发⾏
信息发布环节的主要作⽤是将信息送到⽤户端。例如,对数字媒体对象的买卖交易、在线销售等。和管理阶段⼀样,⽬前对数字媒体的发布也是每个应⽤程序单独设计、单独完成。(4)应⽤开发
应⽤开发是将内容展现给⽤户的应⽤,包括⾳乐点播服务、视频点播服务、游戏服务等。将制作出来的数字媒体内容,经过⼀定的资源整合和优化配置,形成新的应⽤提供能⼒。并向数字媒体的运营平台合作,共同向客户提供服务。数字媒体产业价值链(5)运营接⼊
运营接⼊是提供具体将数字媒体应⽤提供和传播给客户的运营平台和传输通道。采⽤⼀系列先进的⽹络技术⼿段,实施内容产品管理、带宽管理、⽹络使⽤的授权管理、安全认证服务等。(6)价值链集成
价值链集成指⾯向客户销售和交易数字媒体时,存在着最后对价值链的集成环节,以提供给最终客户更⾼性价⽐、内涵丰富的各种服务集成产品,为整个价值链创造更多价值。价值链的集成包括商务集成和技术集成。(7)媒体应⽤
客户利⽤各种接收装置来获取数字媒体的内容,如PC、STB机顶盒、零售显⽰屏、⽆线⽹关、信息站、媒体⽹关等等。数字媒体的最终使⽤者既是价值链的起点、价值链的归宿,也是价值链的源泉。1.3.2数字媒体技术发展趋势
数字媒体内容产业将内容制作技术以及平台、⾳视频内容搜索技术、数字版权保护技术、数字媒体⼈机交互与终端技术、数字媒体资源管理平台与服务、数字媒体产品交易平台等六个⽅向定义为发展重点。
其中,前四个属于技术与平台类,后两个属于技术与服务类。数字媒体技术六个重点发展⽅向
内容制作技术以及平台:应以⾼质量和⾼效率制作为导向,研究开发国际先进的数字媒体内容制作软件或功能插件。⾳视频内容搜索技术:海量数字内容检索技术使数字内容能够得到有效的制作、管理与充分的利⽤。
数字版权保护技术:为了保障数字媒体产业的持续、健康发展,必须采取⼀套有效的数字版权保护机制。这是数字媒体服务产业发展的核⼼问题之⼀。
数字媒体⼈机交互与终端技术:如何将数字媒体⽤最好的体验⼿段展现给⽤户,是数字媒体产业最后能否得到市场接受的重要环节。
数字媒体资源管理平台与服务:对纷繁复杂的海量数字内容素材、⾳视频作品及最终产品,需要建⽴基于内容描述的资源集成、存储、管理、数字保护、⾼效的多媒体内容检索与信息复⽤机制等服务。
数字媒体产品交易平台与服务:在统⼀的数字媒体运营与监管标准与规范制约下,通过贯穿数字媒体产品制作、传播与消费全过程的版权受控形成⾃主创新的数字媒体交易与服务体系。1.3.3数字媒体技术研究领域
数字媒体涉及的技术范围很⼴,技术很新、研究内容很深,是多种学科和多种技术交叉的领域。主要技术范畴包括:(1)数字媒体表⽰与操作,包括数字声⾳及处理、数字图像及处理、数字视频及处理、数字动画技术等。(2)数字媒体压缩,包括通⽤压缩编码、专门压缩编码(声⾳、图像、视频)技术等。
(3)数字媒体存储与管理,包括光盘存储(CD技术、DVD技术等)、媒体数据管理、数字媒体版权保护等。(4)数字媒体传输,包括流媒体技术、P2P技术等。
数字媒体的技术范畴规划了数字媒体技术的研究领域,其主要的研究⽅向包括:(1)数字声⾳处理
包括⾳频及其传统技术(记录、编辑技术)、⾳频的数字化技术(采样、量化、编码)、数字⾳频的编辑技术、话⾳编码技术(如PCM、DA、ADM)。数字⾳频技术可应⽤于个⼈娱乐、专业制作、数字⼴播等。(2)数字图像处理
包括数字图像的计算机表⽰⽅法(位图、⽮量图等)、数字图像的获取技术、图像的编辑与创意设计。常⽤的图像处理软件有Photoshop等。数字图像处理技术可应⽤于家庭娱乐、数字排版、⼯业设计、企业徽标设计、漫画创作、动画原形设计、数字绘画创作。(3)数字视频处理
包括数字视频及其基本编辑技术、后期特效处理技术。常⽤的视频处理软件有Premiere 等。数字视频处理技术可应⽤于个⼈、家庭影像记录、电视节⽬制作、⽹络新闻。(4)数字动画设计
包括动画的基本原理、动画设计基础(包括环节:构思、剧本、情节链图⽚、模板与⾓⾊、背景、配乐)、数字⼆维动画技术、数字三维动画技术、数字动画的设计与创意。常⽤的动画设计软件有3DMAX、Flash等。数字动画可应⽤于少⼉电视节⽬制作、动画电影制作、电视节⽬后期特效包装、建筑和装潢设计、⼯业计算机辅助设计、教学课件制作等。(5)数字游戏设计
包括游戏设计相关软件技术(Directx、OpenGL、Director等)、游戏设计与创意。(6)数字媒体压缩
包括数字媒体压缩技术及分类、通⽤的数据压缩技术(⾏程编码、字典编码、熵编码等)、数字媒体压缩标准,如⽤于声⾳的MP3、MP4、⽤于图像的JPEG、⽤于运动图像的MPEG。(7)数字媒体存储
包括内存储器、外存储器、光盘存储器等。(8)数字媒体管理与保护
包括数字媒体的数据管理、媒体存储模型及应⽤、数字媒体版权保护概念及框架、数字版权保护技术,如加密技术、数字⽔印技术、权利描述语⾔等。(9)数字媒体传输技术
包括流媒体传输技术、P2P技术、IPTV技术等。等等。1.3.4数字媒体应⽤领域
数字媒体有着⼴泛的应⽤和开发领域,包括教育培训、电⼦商务、信息发布、游戏娱乐、电⼦出版、创意设计等。下⾯的内容介绍了数字媒体在⼀些领域内的应⽤。数字媒体应⽤领域——教育培训
在教育培训⽅⾯,可以开发远程教育系统、⽹络多媒体资源、制作数字电视节⽬等。数字媒体因能够实现图⽂并茂、⼈机交互、反馈,从⽽能有效地激发受众的学习兴趣。
⽤户可以根据⾃⼰的特点和需要来有针对性地选择学习内容,主动参与。以互联⽹为基础的远程教学,极⼤地冲击着传统的教育模式,把集中式教育发展成为使⽤计算机的分布式教学。学⽣可以不受地域限制,接受远程教师的多媒体交互指导。因此,教学突破了时空的限制,并且能够及时交流信息,共享资源。数字媒体应⽤领域——电⼦商务
在电⼦商务领域,开发⽹上电⼦商城,实现⽹上交易。⽹络为商家提供了推销⾃⼰的机会。通过⽹络电⼦⼴告、电⼦商务⽹站,能将商品信息迅速传递给顾客,顾客可以订购⾃⼰喜爱的商品。
⽬前,国际上⽐较流⾏的电⼦商务⽹站有⽹上拍卖电⼦湾eBAY、⽹络书店amazon,国内的电⼦商务⽹站有卓越⽹(http://www.doczj.com/doc/4b9048258.html
)、阿⾥巴巴(http://www.doczj.com/doc/4b9048258.html )、淘宝⽹(http://www.doczj.com/doc/4b9048258.html )等。
数字媒体应⽤领域——信息发布
在信息发布⽅⾯,组织机构或个⼈都可以成为信息发布的主体。
各公司、企业、学校及政府部门都可以建⽴⾃⼰的信息⽹站,通过媒体资料展⽰⾃我和提供信息。超⽂本链接使⼤范围发布信息成为可能。
讨论区、BBS可以让任何⼈发布信息,实时交流。如清华⼤学的BBS⽔⽊清华站(http://www.doczj.com/doc/4b9048258.html)拥有⼴泛的国内外⽤户。
另外,博客、播客等形式提供了展⽰⾃我和发布个⼈信息的舞台。数字媒体应⽤领域——个⼈娱乐
在个⼈娱乐⽅⾯,开发娱乐⽹站,利⽤IPTV、数字游戏、影视点播、移动流媒体等为⼈们提供娱乐。随着数据压缩技术的改进,数字电影从低质量的VCD上升为⾼质量的DVD。通过数字电视,不仅可以看电视、录像,实现视频点播,⽽且微机、互联⽹、联⽹电话、电⼦邮箱、电脑游戏、家居购物和理财都可以使⽤。另外,数码相机、数码摄像机及DVD光碟的发展,也推动了数字电视的发展。
电脑游戏已成为流⾏的娱乐⽅式,特别是⽹络在线游戏因其新颖、开放、交互性好和娱乐性强等特点,受到越来越多⼈的青睐。
数字媒体应⽤领域——电⼦出版
在电⼦出版⽅⾯,开发多媒体教材,出版⽹上电⼦杂志、电⼦书籍等。实现编辑、制作、处理输出数字化,通过⽹上书店,实现发⾏的数字化。电⼦出版是数字媒体和信息⾼速公路应⽤的产物。我国新闻出版署对电⼦出版物曾有以下界定:“电⼦出版物系指以数字代码⽅式将图、⽂、声、像等信息存储在磁、光、电介质上,通过计算机或类似设备阅读使⽤,并可复制发⾏的⼤众传播媒体。”
⽬前,电⼦出版物基本上可以分为两⼤类:封装型的电⼦书刊和电⼦⽹络出版物。前者以光盘等为主要载体,后者以多媒体数据库和Internet为基础。电⼦出版物的内容可以包括教育、学术研究、医疗资料、科技知识、⽂学参考、地理⽂物、百科全
书、字典词典、检索⽬录、休闲娱乐等。⽬前,许多国内外报刊杂志都有相应的⽹络电⼦版,如《中国青年报》(http://www.doczj.com/doc/4b9048258.html )等。
表1-1 电⼦出版与传统出版的⽐较
数字媒体应⽤领域——创意设计
创意设计⽅⾯,包括⼯业设计,企业徽标设计,漫画创作、动画原形设计、数字绘画创作,游戏设计等。
创意设计是多媒体活泼性的重要来源,好的创意不仅使应⽤系统独具特⾊,也⼤⼤提⾼了系统的可⽤性和可视性。精彩的创意将为整个多媒体系统注⼊⽣命与⾊彩。
多媒体应⽤程序之所以有巨⼤的诱惑⼒,主要是其丰富多彩的多种媒体的同步表现形式和直观灵活的交互功能。数字媒体应⽤领域——虚拟现实
虚拟现实(Virtual Reality,VR) 综合了计算机图形学、⼈机交互技术、传感技术、⼈⼯智能等领域的最新成果,⽤以⽣成⼀个具有逼真的三维视觉、听觉、触觉及嗅觉的模拟现实环境。
是由计算机硬件、软件以及各种传感器所构成的三维信息的⼈⼯环境,即虚拟环境,是可实现的和不可实现的物理上的、功能上的事物和环境,⽤户投⼊这种环境中,就可与之交互作⽤。
例如,美国在训练航天飞⾏员时,总是让他们进⼊到⼀个特定的环境中,在那⾥完全模拟太空的情况,让飞⾏员接触太空环境的各种声⾳、景像,以便能够在遇到实际情况时能做出正确的判断。
沉浸(immersion)、交互(interaction)和构想(imagination)是虚拟现实的基本特征。虚拟现实在娱乐、医疗、⼯程和建筑、教育和培训、军事模拟、科学和⾦融可视化等⽅⾯获得了应⽤,有很⼤的发展空间。练习与思考:
《数字媒体技术导论》刘清堂等北京清华⼤学出版社2008.3第13页⼀、填空题⼆、简答题《数字媒体技术导论》教案课程名称:数字媒体技术
教学章节:第2章数字⾳频技术基础
教学⽬的:了解⾳频的三个特性及概念、了解常⽤的声⾳记录设备及录制编辑软件,知道数字⾳频的⽂件格式及特性。掌握⾳频数字化的过程及编辑软件的操作和应⽤。教学重点:⾳频的三个特性及概念,声⾳记录设备及录制编辑软件,数字⾳频的⽂件格式及特性。
教学难点:⾳频数字化的过程及数字⾳频质量和参数的关系教学器具:教学课件。教学课时:4学时授课教师:孙清伟教学内容:章节概要:
第⼆章数字⾳频技术基础2.1 ⾳频技术及特性2.2 ⾳频数字化
2.3 数字⾳频质量及格式2.4 数字⾳频的编辑技术
2.5 数字⾳频技术应⽤主要内容:
模拟⾳频模拟⾳频记录设备及特性模拟⾳频处理设备什么是数字⾳频⾳频的数字化⾳频的数字化过程
⾳频数据率及质量声⾳⽂件格式
数字⾳频质量及格式⾳频的编辑⽅式数字⾳频处理设备⾳频编辑软件简介数字⾳频编辑实例数字⾳频的编辑技术数字⾳频技术的应⽤
数字⾳频
⾳频的概念及特性学习⽬标:
(1)知道⾳频的三个特性及其相关概念。(2)说出⼏种声⾳记录设备。
(3)了解模拟⾳频处理技术涉及到的设备及各⾃主要功能(4)掌握⾳频数字化的过程(5)能够列举⼏种常见数字⾳频格式,并进⾏简单的⽐较。(6)了解⼏款常见的数字⾳频编辑软件,并知道其基本性能。(7)熟练掌握⼀款数字⾳频编辑软件的操作⽅法。2.1.1⾳频的概念及特性
物理学上,声⾳被看成⼀种波动的能量,即声波。同时在物理学上,⼀般⽤声⾳的三个基本特性来描述声⾳,即频率、振幅和波形。
⽣理学上,声⾳是指声波作⽤于听觉器官所引起的⼀种主观感觉。如响度、⾳调、⾳⾊和⾳长等。尽管这两个关于声⾳的理解涵义有所不同,但它们之间有⼀定的内在联系。
在物理学上声⾳的三个基本特性:频率、振幅和波形,对应到⼈⽿的主观感觉就是⾳调、响度和⾳⾊。所谓频率即发声物体在振动时,单位时间内的振动的次数,单位为赫兹(HZ)。振幅是指发声物体在振动时偏离中⼼位置的幅度,代表发声物体振动时动势能的⼤⼩。
振幅是由物体振动时所产⽣的声⾳的能量或声波压⼒的⼤⼩所决定的。声能或声压愈⼤,引起⼈⽿主观感觉到的响度也愈⼤。⾳⾊是指声⾳的纯度,它由声波的波形形状所决定。即使某种声⾳它们的振动和频率都⼀样,也就是说它们的⾳调⾼低,声⾳强弱都相同,但它们的波形不⼀样,所以听起来就会有明显的区别。声⾳的分类:
按照⼈⽿可听到的频率范围,声⾳可分为超声、次声和正常声。⼈⽿可感受声⾳频率的范围介于20~20000赫兹间。声⾳⾼于20000赫兹为超声波,低于20赫兹为次声波。 按照声⾳的来源以及作⽤来看,可分为⼈声、乐⾳和响⾳。⼈声包括⼈物的独⽩、对⽩、旁⽩、歌声、啼笑,感叹等;乐⾳也可成为⾳乐,是指⼈类通过相关乐器演奏出来的声⾳,如影视作品中的背景声⾳,⼀般起着渲染⽓氛的作⽤;响⾳(⾳效)是指除语⾔和⾳乐之外电影中所有声⾳的统称,如动作⾳响、⾃然⾳响、背景⾳响、机械⾳响、特殊⾳响。2.1.2模拟⾳频记录设备及特性
最初声⾳信息的传播是瞬时性的,不能对声⾳进⾏存储和回放。直到爱迪⽣发明留声机声⾳才可以得以记录和重放。爱迪⽣的留声机记录声⾳利⽤的是“声⾳是由振动产⽣的”这⼀基本原理。
图2-1 爱迪⽣留声机成品声⾳记录技术发展史
(1)机械留声机:最早⽤来记录声⾳的是机械式留声机,1877年由美国⼈爱迪⽣发明的。初期的留声机结构⾮常简单,只是在⼀个⽊盒中装上⼀只铜制的⼤喇叭,录放⾳的声波都经过这只喇叭传递。
(2)钢丝录⾳机:世界上最早出现的钢丝录⾳机是在1898年,它由丹麦科学家波尔森发明的,第⼀次⽤磁性记录的⽅式进⾏记录。
(3)磁带录⾳机:磁带录⾳机属⼲磁性记录技术的再发挥,是根据电磁感应定律,提出⽤永久剩磁录⾳的可能性,把声⾳记录在磁带上,接着再⽤磁带进⾏还原。
由于⾳频技术的迅猛发展,不论从机型的繁衍、结构和改进、功能的扩展、性能的提⾼诸多⽅⾯都取得了瞩⽬的进步.上述材料中显⽰了传统⾳频记录技术的演变历史,从记录介质上看历经了⽯蜡(锡箔)记录、钢丝记录、磁带记录;从技术⼿段上来看经历了机械记录和磁性记录,从外形上⾯来看录⾳设备由原来的开放式结构变成后来的封闭式的设备(盒式)。2.1.3模拟⾳频处理设备
在对声⾳进⾏处理的过程中,除了对声⾳进⾏记录之外,还需要对声⾳进⾏⼀些其它⽅⾯的调整。如对声⾳进⾏⾳调的调节、多声⾳混合、⾼中低⾳的调整,还有诸如原始声波信号的拾取等等问题。⾳频处理设备:
话筒(Microphone麦克风)⾳箱(speaker,扬声器)模拟调⾳台
(1)话筒(Microphone麦克风)
话筒的主要功能就是进⾏声⾳能量的收集。当出现磁性记录技术之后,话筒的功能就开始发⽣变化,除了完成声⾳的收集外,还要完成声能向电能的转化(声⾳信号转化成电流信号),但是其还原声⾳的功能已逐渐消失。(2)⾳箱(speaker,扬声器)
⾳箱的主要功能就是还原声⾳,将⾳频电流信号变换成声⾳信号,可以说是留声机中⼤喇叭另⼀功能的转化。(3)模拟调⾳台
调⾳台在现代电台⼴播、舞台扩⾳、⾳响节⽬制作中是⼀种经常使⽤的设备,它具有多路输⼊,每路的声⾳信号可以单独被处理,还可以进⾏各种声⾳的混合,且混合⽐例可调;拥有多种输出。调⾳台在诸多系统中起着核⼼作⽤,它既能创作⽴体声、美化声⾳,⼜可抑制噪声、控制⾳量,是声⾳艺术处理必不可少的⼀种设备。2.2 ⾳频数字化
模拟⾳频信号:⼀般,模拟信号在时间或者空间维度上可以⽆限制的细分下去。模拟信号最⼤的特点就是它是⼀种连续的不间断的信号。
对⾳频模拟信号进⾏处理时,⼀般采⽤模拟的技术⼿段。电器元件是将连续的原始信号的变化形式原封不动的传递给下⼀单元,这就是模拟的处理⽅式。
数字⾳频是指⽤⼀连串⼆进制数据来保存的声⾳信号。这种声⾳信号在存储和电路传输及处理过程中,不再是连续的信号,⽽是离散的。关于离散的含义:
数字化的⾳频信号两种途径:
第⼀种途径就是将现场声源的模拟信号或已存储的模拟声⾳信号通过某种⽅法转换成数字⾳频;第⼆种途径就是在数字化设备中创作出数字⾳频,⽐如电⼦作曲。
⾳频数字化⼀般经过三个阶段“采样——量化——编码”。具体步骤如下:第⼀步,将麦克风转化过来的模拟电信号以某⼀频率进⾏离散化的样本采集,这个过程就叫采样;
第⼆步,将采集到的样本电压或电流值进⾏等级量化处理,这个过程就是量化;
第三步将等级值变换成对应的⼆进制表⽰值(0和1),并进⾏存储,这个过程就是“编码”。通过这三个环节,连续的模拟⾳频信号即可转换成离散的数字信号——⼆进制的0和1。数字化过程两个指标:
⼀是量化深度,也可称之为量化分辨率,是指单位电压值和电流值之间的可分等级数; ⼆是采样频率,即采样点之间的时间间隔。
两者与⾳质还原的关系是:采样频率越⾼,量化深度越⼤,声⾳质量越好。
横坐标是时间轴(采样频率),纵坐标是幅度值(量化分辨率),曲线代表的是模拟信号对应的波动曲线,带颜⾊的⽅格是采样量化后的所得结果。
采样量化
由图中可以得知,当频率越⼩(时间间隔越短),量化深度(量化分辨率)越⼤,⼆者的轮廓越吻合,这也说明数字化的信号能更好的保持模拟⾳频信号的形状,有利于保持原始声⾳的真实情况。
在数字⾳频的衡量指标中,采样频率的单位是Hz,量化深度⼀般⽤⽐特(Bit)来度量。
例如:某⼀⾳频的数字化指标是44.1kHz,8个⽐特位。那么这⾥的44.1kHz⽐较容易理解,但8⽐特位并不是说把某⼀单位的电压(电流)值成8份,⽽是分成28=256份;同理16位是把纵坐标分成216=65536份。
通常情况下,在⾳频数字化的过程中,设置的采集频率可已选择三种:32kHz、44kHz、48kHz。特别是在CD制作过程中,⼀般的采样频率是44.1kHz,那么为什么会设置这三个档次呢?
采样频率对波形的影响
如图,上半部分表⽰原始⾳频的波形;下半部分表⽰录制后的波形;红⾊的点表⽰采样点。
上下波形之所以不吻合,是因为采样点不够多,或是采样频率不够⾼。这种情况关于合理的采样频率这⼀问题在Nyquist(奈奎斯特)定理中早已有明确的答案:要想不产⽣低频失真,则采样频率⾄少是录制的最⾼频率的两倍(上图中,采样频率只是录制频率的4/3倍)。这个频率通常称作Nyquist极限。,称之为低频失真。2.3 数字⾳频质量及格式2.3.1⾳频数据率及质量
数字⾳频⽂件存储在计算机中要占据⼀定的空间,然⽽不同的采样频率、量化深度和录制时间⽣成的⾳频⽂件⼤⼩也不同。例如:⽤44.1kHz、16bit来进⾏⽴体声(即两个声道)采样(标准的CD⾳质),录制(或采集)3分钟的⾳频,那么在该未经压缩的声⾳数据⽂件的⼤⼩为:
⼀秒钟内采样44.1×1000次,每次的数据量是16×2=32bit(因为⽴体声是两个声道),那么3分钟的总共数据量是44100×32×60×3= 254016000(bit),换算成计算机中的常⽤单位(Byte),总共数据量是254016000/8/1024/1024=30.28MByte。
⽐特率,即每秒钟⾳频的⼆进制数据量。上述例题的⽐特率是176.4kB/s。如果要衡量⼀个数字⾳频的⾳质好坏的话,通常可以参考以下指标:采样频率:即采样点之间的时间间隔,采样间隔时间越短,⾳质越好。
量化深度(量化分辨率):是指单位电压值和电流值之间的可分等级数,可分等级越多,⾳质越好。⾳频流码率:数字化后,单位时间内⾳频数据的⽐特容量,流码率越⼤⾳质越好。
以上三个⽅⾯的指标中,前⾯两个指标是绝对指标,⽽⾳频流码率是⼀个相对指标,可以间接⽤来考察⾳频的质量。2.3.2声⾳⽂件格式
其实,不同的编码⽅式就对应计算机中不同的⽂件格式,反映在计算机中就是⽂件的后缀名不同。对于数字⾳频的常见格式有以下⼏种:
(1)W A V格式:W A V格式⽀持许多压缩算法,⽀持多种⾳频位数、采样频率和声道,采⽤44.1kHz的采样频率,16位量化位数,因此W A V的⾳质与CD相差⽆⼏,但W A V格式对存储空间需求太⼤不便于交流和传播。
(2)MIDI格式:MIDI是Musical Instrument Digital Interface的缩写,⼜称作乐器数字接⼝,是数字⾳乐/电⼦合成乐器的统⼀国际标准。它定义了计算机⾳乐程序、数字合成器及其它电⼦设备交换⾳乐信号的⽅式,规定了不同⼚家的电⼦乐器与计算机连接的电缆和硬件及设备间数据传输的协议,可以模拟多种乐器的声⾳。2.3.2声⾳⽂件格式
(3)CDA格式:⼤家都很熟悉CD这种⾳乐格式了,扩展名CDA,其取样频率为44.1kHz,16位量化位数。CD存储采⽤了⾳轨的形式,⼜叫“红⽪书”格式,记录的是波形流,是⼀种近似⽆损的格式。
(4)MP3格式:其全称是MPEG-1 Audio Layer 3。MP3能够以⾼⾳质、低采样率对数字⾳频⽂件进⾏压缩。
(5)MP3 Pro格式:MP3 Pro可以在基本不改变⽂件⼤⼩的情况下改善原先的MP3⾳乐⾳质。它能够在⽤较低的⽐特率压缩⾳频⽂件的情况下,最⼤程度地保持压缩前的⾳质。
(6)WMA格式:WMA格式是以减少数据流量但保持⾳质的⽅法来达到更⾼的压缩率⽬的,其压缩率⼀般可以达到1:18。此外,WMA还可以通过DRM(Digital Rights Management)⽅案加⼊防⽌拷贝,或者加⼊限制播放时间和播放次数,甚⾄是播放机器的限制,可有⼒地防⽌盗版。
(7)MP4格式:MP4在⽂件中采⽤了保护版权的编码技术,只有特定的⽤户才可以播放,有效地保证了⾳乐版权的合法性。另外MP4的压缩⽐达到了1:15,体积较MP3更⼩,但⾳质却没有下降。不过因为只有特定的⽤户才能播放这种⽂件,因此其流传与MP3相⽐差距甚远。
(8)SACD格式:SACD(SA=SuperAudio)是由Sony公司正式发布的。它的采样率为CD格式的64倍,即2.8224MHz。SACD重放频率带宽达100kHz,为CD格式的5倍,24位量化位数,远远超过CD,声⾳的细节表现更为丰富、清晰。(9)Quicktime格式:QuickTime是苹果公司于1991年推出的⼀种数字流媒体,它⾯向视频编辑、Web⽹站创建和媒体技术平
台,QuickTime⽀持⼏乎所有主流的个⼈计算平台,可以通过互联⽹提供实时的数字化信息流、⼯作流与⽂件回放功能。(10)VQF格式:VQF格式是由Y AMAHA和NTT共同开发的⼀种⾳频压缩技术,它的压缩率能够达到1:18,因此相同情况下压缩后VQF的⽂件体积⽐MP3⼩30%~50%,更便利于⽹上传播,同时⾳质极佳,接近CD⾳质(16位44.1kHz⽴体声)。但VQF未公开技术标准,⾄今未能流⾏开来。
(11)DVD Audio格式:DVD Audio 是新⼀代的数字⾳频格式,与DVD Video尺⼨以及容量相同,为⾳乐格式的DVD光碟,取样频率为“48kHz/96kHz/192kHz”和“44.1kHz/88.2kHz/176.4kHz”可选择,量化位数可以为16、20或24⽐特,它们之间可⾃由地进⾏组合
(12)MD格式:Sony公司的MD(MiniDisc)⼤家都很熟悉了。MD之所以能在⼀张⼩⼩的盘中存储60~80分钟采⽤44.1khz采样的⽴体声⾳乐,就是因为使⽤了ATRAC算法(⾃适应声学转换编码)压缩⾳源。
(13)RA格式:RealAudio是由Real Networks公司推出的⼀种⽂件格式,最⼤的特点就是可以实时传输⾳频信息,尤其是在⽹速较慢的情况下,仍然可以较为流畅地传送数据。
(14)Liquid Audio格式:Liquid Audio是⼀家提供付费⾳乐下载的⽹站。它通过在⾳乐中采⽤⾃⼰独有的⾳频编码格式来提供对⾳乐的版权保护。Liquid Audio的⾳频格式就是所谓的LQT。
(15)Audible格式:Audible拥有四种不同的格式:Audible1、2、3、4。格式1、2和3采⽤不同级别的语⾳压缩,⽽格式4采⽤更低的采样率和MP3相同的解码⽅式,所得到语⾳更清楚,⽽且可以更有效地从⽹上进⾏下载。
(16)VOC⽂件格式:在DOS程序和游戏中常会遇到这种⽂件,它是随声霸卡⼀起产⽣的数字声⾳⽂件,与W A V⽂件的结构相似,可以通过⼀些⼯具软件⽅便地互相转换。
(17)AU格式:AU⽂件是UNIX操作系统下的数字声⾳⽂件,由于早期Internet上的Web服务器主要是基于UNIX的,所以这种⽂件成为WWW上唯⼀使⽤的标准声⾳⽂件。
(18)AIFF格式:AIFF(.AIF) 是苹果公司开发的声⾳⽂件格式,被Macintosh平台和应⽤程序所⽀持。
(19)Amiga格式:Amiga声⾳(.SVX):Commodore所开发的声⾳⽂件格式,被Amiga 平台和应⽤程序所⽀持,不⽀持压缩。(20)MAC格式:Apple计算机公司所开发的声⾳⽂件格式,被Macintosh平台和多种Macintosh应⽤程序所⽀持,⽀持某些压缩。
(21)S48格式:S48(stereo、48kHz)采⽤MPEG-1 layer 1、MPEG-1 layer 2声⾳压缩格式,由于其易于编辑、剪切,所以在⼴播电台应⽤较⼴。
(22)AAC格式:AAC实际上是⾼级⾳频编码的缩写。AAC是MPEG-2规范的⼀部分。AAC的⾳频算法在压缩能⼒上远远超过了以前的⼀些压缩算法。它还同时⽀持多达48个⾳轨、15个低频⾳轨、更多种采样率和⽐特率、多种语⾔的兼容能⼒、更⾼的解码效率。
2.4 数字⾳频的编辑技术2.4.1数字⾳频的编辑⽅式
对于数字⾳频的技术操作具体来说可以归纳为以下六个⽅⾯的内容。
(1)数字录⾳:该技术操作是指通过数字⽅式将⾃然界中的声源或者存储在其它介质的模拟声⾳通过“采样——量化——编码”的⽅式将其变成计算机中或其它数字⾳频设备中能够识别的数字声⾳。
(2)数字⾳乐创作:该技术操作是指通过相关的数字⾳频创作⼯具(如:计算机和Midi键盘、Midi吉它等)直接⽣成创作数字⾳频,通常是数字⾳乐。
(3)声⾳剪辑:该操作旨在对数字⾳频素材进⾏裁剪或者复制。
(4)合成声⾳:也可称之为混⾳,声⾳合成是指根据需要,把多个声⾳素材叠加在⼀起,⽣成混合效果。(5)增加特效:增加特效是指对原始的数字⾳频素材进⾏听觉效果的优化调整,以使其符合需要。(6)⽂件操作:对数字⾳频的⽂件操作是指对整个⾳频⽂件进⾏的操作,⽽⾮改变其⾳⾊、⾳效。2.4.2数字⾳频设备
数字⾳频处理设备可以分为两类:⼀类是专⽤数字⾳频设备,另⼀类是⾮专为处理⾳频⽽设计的多媒体计算机。
(1)数字调⾳台:前⾯介绍过模拟的调⾳台,可以知道调⾳台的作⽤有两个:其⼀是将每⼀路进⾏优化和调节;其⼆,对多路声⾳进⾏混合输出。
(2)数字录⾳机:如图2-8所⽰是数字录⾳机。数字录⾳机是对模拟录⾳⽅式进⾏了升级,采⽤数字记录⽅式来存储⾳频信号。⼀般可⽤硬盘记录⽅式或者光盘记录⽅式。
图2-8 数字录⾳机
(3)数字⾳频⼯作站:如图2-9是数字⾳频⼯作站。数字⾳频⼯作站是⼀台能够完成从录⾳、编辑、混合、压缩,⼀直到最后刻出母盘的全部⾳频节⽬制作过程的设备。拥有这样⼀台设备就相当于有了调⾳台、多轨录⾳机、编辑机、效果器等这些录⾳棚的价值不菲的全部家当。它最⼤的特点就是集成度⾼,免去录⾳连线的烦恼,且便于携带。
图2-9 数字⾳频⼯作站
在进⾏数字⾳频处理时,除了⽤到上述⼏种专⽤的硬件设备外,还会⽤到⼀些其它配套设备,如麦克风、⾳箱等等。其实,不管是专⽤设备,还是多媒体计算机,在处理数字⾳频时,其关键的硬件技术内核包括:
1)模数转换器:模数转换器(Analog to Digital Converter,ADC)是⼀个硬件芯⽚,⼀般⽤在带录⾳功能的⾳频处理设备之中,其作⽤就是将模拟的⾳频电压(流)信号转成数字脉冲电压(PCM)信号。任何ADC都包括上⾯提到的三个基本功能:采样、量化和编码,⽤来完成从模拟的⾳频信号向数字⾳频信号的采集过程。
2)数模转换器:数模转换器(Digital to Analog Converter,DAC)也是⼀个硬件芯⽚,⼀般⽤在数字⾳频的重放设备中,⽤来将数字⾳频信号还原成模拟的⾳频信号。可以把DAC 想像成16 个⼩电阻,各个电阻值是以⼆的倍数增⼤。当DAC 接受到来⾃计算机中的⼆进制PCM 信号,遇到0 时相对应的电阻就开启,遇到 1 相对应的电阻不作⽤,这样每⼀批16Bits 数字信号都可以转换为相对应的电压⼤⼩。如图2-6中所⽰,还原后的电流信号看起来就像阶梯⼀样,当然会跟原来平滑的信号有些差异,但是⼈的⽿朵没有那么灵敏,只要采样的频率和量化深度⾜够的话,⼀般不会察觉到差异。
图2-6采样量化
3)数字信号处理器:数字信号处理器(Digital Signal Processor,DSP)是⼀个专门⽤来处理数字声⾳的微型处理器,类似于计算机中的CPU,可以⽤来模拟和产⽣声场,并对声⾳效果进⾏控制。2.4.3数字⾳频编辑软件简介数字⾳频编辑软件可分为两种:
⼀种是⾳源软件(⾳序器软件),主要是针对数字⾳乐创作⽽⾔。它是⼀种可以⽤来产⽣和模拟各种乐器或发声物的应⽤软件。⾳源软件中最核⼼的是⾳序器,其主要作⽤是把⾳乐元素或事件进⾏系列或序列编程。这类软件⼀直与MIDI⾳乐创作联系在⼀起。
另外⼀种软件是编辑软件,可以完成对声⾳的录⾳、剪辑、混⾳合成、特效处理。下⾯来介绍⼏款较为常⽤的数字⾳频编辑软件。2.4.3.1⾳源软件
⾸先来介绍两款⾳序器软件。
(1)Cakewalk:Cakewalk是全世界使⽤率最⾼的专业作曲软件,其功能⾮常全⾯。使⽤Cakewalk,不但可以制作MIDI,还能录制⾳频;在歌曲伴奏制作完后,通过Cakewalk的⾳频功能,可以将作者制作的歌曲伴奏录制成⾳频(WA V)⽂件,也可以在Cakewalk的界⾯下直接录制⼈声,将MIDI和⾳频⽂件混合编辑。
(2)FL Studio :FL Studio 是⼀款⾳乐创作利器,能够让作者的计算机变成全功能的录⾳室。它⾸先提供了⾳符编辑器,可以根据⾳乐创作⼈的要求编辑出不同⾳律的节奏,例如⿎,镲,锣,钢琴,笛,⼤提琴,筝,扬琴等等。其次提供了⾳效编辑器,⾳效编辑器可以编辑
因篇幅问题不能全部显示,请点此查看更多更全内容