如何识别声音信号

发布网友发布时间：2022-04-24 06:49

共5个回答

热心网友时间：2022-06-17 04:10

声音信号的数字化传输

山东潍坊学院公共计算机教学部丁素英

众所周知，声音是模拟信号，在传输过程中，由于噪声的干扰和能量的损失总会发生畸变和衰减，所以模拟传输时，每隔一定的距离就要通过放大器来放大信号的强度，放大信号强度的同时，由噪声引起的信号失真也随之放大。当传输距离增大时，多级放大器的串联会引起失真的叠加，从而使信号的失真越来越大。而数字传输，只有代表了0和1变化模式的数据，方波脉冲式的数字信号在专输过程中除了会衰减外，也会发生失真但它是采用转发器来代替放大器，转发器可以通过域值判别等手段，识别并恢复其原来的0和1变化的模式，并重新产生一个新的完全消除了衰减和畸变的信号传输出去。这样多级的转发不会累积噪声引起的失真。

图1为声音信号的数字传输示意图。发送端通过编码解码器首先将声音的模拟信号变换为数字信号，然后在数字信道上传输，接收端再通过编码解码器将收到的数字信号复原成声音的模拟信号。

一、声音信号的数字化

在时间和幅度上都连续的模拟声音信号，经过采样、量化和编码后，才能得到用离散的数字表示的数字信号。

1．采样。采样就是在某些特定的时刻对模拟信号进行测量，对模拟信号在时间上进行量化。具体方法是：每隔相等或不相等的一小段时间采样一次。相隔时间相等的采样为均匀采样，相隔时间不相等的采样为不均匀采样。均匀采样又称为线性采样，不均匀采样又称为非线性采样。

2．量化。分层就是对信号的强度加以划分，对模拟信号在幅度上进行量化。具体方法是：将整个强度分成许多小段。如果分成小段的幅度相等称为线性分层，分成的小段不相等称为非线性量化。

声音信号的采样、量化和编码，如图2所示。

3．编码。编码就是将量化后的整数值用二进制数来表示。若分成123级，量化值为0～127，每个样本用7个二进制位来编码。若分成32级，则每个样本只需用5个二进制位来编码。

采样频率越高，量化数越多，数字化的信号越能*近原来的模拟信号，而编码用的二进制位数也就越多。

二、声音信号的编码和解码标准MPEG

MPEG标准阐明了声音和电视图像的编码和解码过程，严格规定了声音和图像数据编码后组成位数据流的句法，提供了解码器的测试方法等。

MPEG—1声音，写成MPEG—1Audio，规定声音数据的编码和解码，标准名是ISO/IEC11172-3：1993 Information technology-Coding of moving pictures and associated audio for digital storage media at up to about 1．5Mb/s—Part3：Audio。

MPEG—2 声音，写成 MPEG—2 Audio，规定声音数据的编码和解码，是MPEG—1 Audio的扩充，支持多个声道，标准名是ISO/IEC 13818—3：1988 Information technology - Generic coding of moving picture 此 5 and associated audio information - Part3 ： Audio。

MPEG—4 声音，标准名是IS0/IEC 14496—3 Very low bitrate audio—visual coding -Part3：Audio。

三、声音信号数字化的应用

1．PC机构造的MIDI系统。MIDI（musical instrument digital interface）的中文含义是电子乐器数字接口，它用于音乐合成器（music synthesiz-ers）、乐器（musical instruments）和计算机之间，把演奏信息转换为电子数据。在MIDI电缆上传送的不是声音，而发给MIDI设备或其他装置让它产生声音或执行某个动作的指令。MIDI接口通常包含3种不同的MIDI连接器，用IN（输入），OUT（输出）和THRU（穿越）。按照MIDI标准，生成的文件比较小，容易编辑，可以和其他媒体一起播放，以加强演示效果。

由PC机构适的MIDI系统，如图3所示。在这个系统中，PC机使用内置的MIDI接口卡，用来把MIDI数据发送到外部的多音色MIDI合成器模块。像多媒体演示程序、教育软件或游戏等应用软件，它们把信息通过PC总线发送到MIDI接口卡。MIDI接口卡把信息转换成MIDI消息，然后送到多音色声音模块同时播放出许多不同的声音，如钢琴声、低音和鼓声。使用安装在PC机上的高级的MIDI音序器软件，用户可以把MIDI键盘控制器连接到MIDI接口卡的MIDI IN端口，也可以有相同的音乐创作功能。

2．文本—语音转换系统（TTS）。文本一语音转换是将文本形式的信息转换成自然语音的一种技术，其最终目标是使计算机输出清晰而有自然的声音。

3．IP电话。IP电话、因特网电话、VoIP都是在IP网络即信息包交换网络上进行的呼叫和通话，而不是在传统的公众交换电话网络上进行的呼叫和通话。IP电话的通话过程如图5所示。

来自麦克风的声音在声音输入装置中转换成数字信号，声称“编码声音样本”输出，这些输出样本以帧为单位组成声音样本块，并拷贝到缓冲存储器；IP电话应用程序估算样本块的能量；选择一种算法进行压缩编码；在样本块中插入样本块头信息，封装到用户数据包协议套接接口成为信息报；信息包在物理网络上传送；通话的另一方接受到信息包之后，去掉样本块头信息，使用与编码算法相反的解码算法重构声音数据，再写入到缓冲存储器；从缓冲存储器中把声音拷贝到声音输出设备转换成模拟声音，完成一个声音样本块的传送。

热心网友时间：2022-06-17 04:11

参考语音识别软件，对函数值的变化求导函数微积分。

热心网友时间：2022-06-17 04:11

付费内容限时免费查看回答一，转动头部形成多点定位。这个是最常见的，很多时候人第一下听到声音总是不确定是由那个方向传来的，因为上面说过双耳效应是无法准确定位的。这时候最常见的做法就是下意识地晃动下脑袋或，这样就会在空间上形成多个点，定位三维空间的一个声源的位置绰绰有余。

二，利用人体自身以及周围对声音的影响。因为人不是光靠两个鼓膜来分辨声音的，声音可以在整个人体中传播，特别是头骨，这样算下来就不止只有两个点可以用来定位了。人的外耳奇怪的形状可以对不同方向的声音形成不同的反射效果，周围的墙壁等物体也会对同一声音形成多次反射。综合这些因素，再加上双耳效应已经确定的大致位置，大脑完全可以计算出很精确的声源位置。

热心网友时间：2022-06-17 04:12

众所周知，声音是模拟信号，在传输过程中，由于噪声的干扰和能量的损失总会发生畸变和衰减，所以模拟传输时，每隔一定的距离就要通过放大器来放大信号的强度，放大信号强度的同时，由噪声引起的信号失真也随之放大。当传输距离增大时，多级放大器的串联会引起失真的叠加，从而使信号的失真越来越大。而数字传输，只有代表了0和1变化模式的数据，方波脉冲式的数字信号在专输过程中除了会衰减外，也会发生失真但它是采用转发器来代替放大器，转发器可以通过域值判别等手段，识别并恢复其原来的0和1变化的模式，并重新产生一个新的完全消除了衰减和畸变的信号传输出去。这样多级的转发不会累积噪声引起的失真。

热心网友时间：2022-06-17 04:12

这里有关于声音的文章不知道合符你的要球不

http://www.vbyte.com/iReader/Reader.asp?ISBN=9578239734&URI=/222002.htm