如何识别声音信号
发布网友
发布时间:2022-04-24 06:49
我来回答
共5个回答
热心网友
时间:2022-06-17 04:10
声音信号的数字化传输
山东潍坊学院公共计算机教学部 丁素英
众所周知,声音是模拟信号,在传输过程中,由于噪声的干扰和能量的损失总会发生畸变和衰减,所以模拟传输时,每隔一定的距离就要通过放大器来放大信号的强度,放大信号强度的同时,由噪声引起的信号失真也随之放大。当传输距离增大时,多级放大器的串联会引起失真的叠加,从而使信号的失真越来越大。而数字传输,只有代表了0和1变化模式的数据,方波脉冲式的数字信号在专输过程中除了会衰减外,也会发生失真但它是采用转发器来代替放大器,转发器可以通过域值判别等手段,识别并恢复其原来的0和1变化的模式,并重新产生一个新的完全消除了衰减和畸变的信号传输出去。这样多级的转发不会累积噪声引起的失真。
图1为声音信号的数字传输示意图。发送端通过编码解码器首先将声音的模拟信号变换为数字信号,然后在数字信道上传输,接收端再通过编码解码器将收到的数字信号复原成声音的模拟信号。
一、声音信号的数字化
在时间和幅度上都连续的模拟声音信号,经过采样、量化和编码后,才能得到用离散的数字表示的数字信号。
1.采样。采样就是在某些特定的时刻对模拟信号进行测量,对模拟信号在时间上进行量化。具体方法是:每隔相等或不相等的一小段时间采样一次。相隔时间相等的采样为均匀采样,相隔时间不相等的采样为不均匀采样。均匀采样又称为线性采样,不均匀采样又称为非线性采样。
2.量化。分层就是对信号的强度加以划分,对模拟信号在幅度上进行量化。具体方法是:将整个强度分成许多小段。如果分成小段的幅度相等称为线性分层,分成的小段不相等称为非线性量化。
声音信号的采样、量化和编码,如图2所示。
3.编码。编码就是将量化后的整数值用二进制数来表示。若分成123级,量化值为0~127,每个样本用7个二进制位来编码。若分成32级,则每个样本只需用5个二进制位来编码。
采样频率越高,量化数越多,数字化的信号越能*近原来的模拟信号,而编码用的二进制位数也就越多。
二、声音信号的编码和解码标准MPEG
MPEG标准阐明了声音和电视图像的编码和解码过程,严格规定了声音和图像数据编码后组成位数据流的句法,提供了解码器的测试方法等。
MPEG—1声音,写成MPEG—1Audio,规定声音数据的编码和解码,标准名是ISO/IEC11172-3:1993 Information technology-Coding of moving pictures and associated audio for digital storage media at up to about 1.5Mb/s—Part3:Audio。
MPEG—2 声音,写成 MPEG—2 Audio,规定声音数据的编码和解码,是MPEG—1 Audio的扩充,支持多个声道,标准名是ISO/IEC 13818—3:1988 Information technology - Generic coding of moving picture 此 5 and associated audio information - Part3 : Audio。
MPEG—4 声音,标准名是IS0/IEC 14496—3 Very low bitrate audio—visual coding -Part3:Audio。
三、声音信号数字化的应用
1.PC机构造的MIDI系统。MIDI(musical instrument digital interface)的中文含义是电子乐器数字接口,它用于音乐合成器(music synthesiz-ers)、乐器(musical instruments)和计算机之间,把演奏信息转换为电子数据。在MIDI电缆上传送的不是声音,而发给MIDI设备或其他装置让它产生声音或执行某个动作的指令。MIDI接口通常包含3种不同的MIDI连接器,用IN(输入),OUT(输出)和THRU(穿越)。按照MIDI标准,生成的文件比较小,容易编辑,可以和其他媒体一起播放,以加强演示效果。
由PC机构适的MIDI系统,如图3所示。在这个系统中,PC机使用内置的MIDI接口卡,用来把MIDI数据发送到外部的多音色MIDI合成器模块。像多媒体演示程序、教育软件或游戏等应用软件,它们把信息通过PC总线发送到MIDI接口卡。MIDI接口卡把信息转换成MIDI消息,然后送到多音色声音模块同时播放出许多不同的声音,如钢琴声、低音和鼓声。使用安装在PC机上的高级的MIDI音序器软件,用户可以把MIDI键盘控制器连接到MIDI接口卡的MIDI IN端口,也可以有相同的音乐创作功能。
2.文本—语音转换系统(TTS)。文本一语音转换是将文本形式的信息转换成自然语音的一种技术,其最终目标是使计算机输出清晰而有自然的声音。
3.IP电话。IP电话、因特网电话、VoIP都是在IP网络即信息包交换网络上进行的呼叫和通话,而不是在传统的公众交换电话网络上进行的呼叫和通话。IP电话的通话过程如图5所示。
来自麦克风的声音在声音输入装置中转换成数字信号,声称“编码声音样本”输出,这些输出样本以帧为单位组成声音样本块,并拷贝到缓冲存储器;IP电话应用程序估算样本块的能量;选择一种算法进行压缩编码;在样本块中插入样本块头信息,封装到用户数据包协议套接接口成为信息报;信息包在物理网络上传送;通话的另一方接受到信息包之后,去掉样本块头信息,使用与编码算法相反的解码算法重构声音数据,再写入到缓冲存储器;从缓冲存储器中把声音拷贝到声音输出设备转换成模拟声音,完成一个声音样本块的传送。
热心网友
时间:2022-06-17 04:11
参考语音识别软件,对函数值的变化求导函数微积分。
热心网友
时间:2022-06-17 04:11
付费内容限时免费查看回答一,转动头部形成多点定位。这个是最常见的,很多时候人第一下听到声音总是不确定是由那个方向传来的,因为上面说过双耳效应是无法准确定位的。这时候最常见的做法就是下意识地晃动下脑袋或,这样就会在空间上形成多个点,定位三维空间的一个声源的位置绰绰有余。
二,利用人体自身以及周围对声音的影响。因为人不是光靠两个鼓膜来分辨声音的,声音可以在整个人体中传播,特别是头骨,这样算下来就不止只有两个点可以用来定位了。人的外耳奇怪的形状可以对不同方向的声音形成不同的反射效果,周围的墙壁等物体也会对同一声音形成多次反射。综合这些因素,再加上双耳效应已经确定的大致位置,大脑完全可以计算出很精确的声源位置。
热心网友
时间:2022-06-17 04:12
众所周知,声音是模拟信号,在传输过程中,由于噪声的干扰和能量的损失总会发生畸变和衰减,所以模拟传输时,每隔一定的距离就要通过放大器来放大信号的强度,放大信号强度的同时,由噪声引起的信号失真也随之放大。当传输距离增大时,多级放大器的串联会引起失真的叠加,从而使信号的失真越来越大。而数字传输,只有代表了0和1变化模式的数据,方波脉冲式的数字信号在专输过程中除了会衰减外,也会发生失真但它是采用转发器来代替放大器,转发器可以通过域值判别等手段,识别并恢复其原来的0和1变化的模式,并重新产生一个新的完全消除了衰减和畸变的信号传输出去。这样多级的转发不会累积噪声引起的失真。
热心网友
时间:2022-06-17 04:12
这里有关于声音的文章 不知道合符你的要球不
http://www.vbyte.com/iReader/Reader.asp?ISBN=9578239734&URI=/222002.htm