想做款语音识别,全自动的。想监听麦克风判断一句话的开始和结束。应该怎...
发布网友
发布时间:2024-07-03 17:53
我来回答
共1个回答
热心网友
时间:2024-08-01 16:48
语音的频率是有一定范围的,大约是2kHz以下,这也是普遍运用于电话的PCM压缩的采样率在0~2000Hz范围的原因
你可以对语音分段采样后做频谱分析,比如fft,求每段能量值在2000Hz以下的能量是否超过阈值,如果超过则算是有人声,当然还可以辅助增加一些其他的特征值来判断人声,这样可以在复杂音频背景下进行判断
如果要简化情况,可以用静音判断来分割语音,假设没有人声时,麦克风的输入是基本静音的(fft得到的平均能量值小于有声的阈值),也可以进行有效的分割
如何在 Windows XP 中安装和配置语音识别
如果安装语音识别时收到错误,或如果无法安装语音识别,请转到“后续步骤”部分。安装语音识别引擎后,“麦克风向导”可能会自动启动。如果该向导自动启动,则可以立即安装和配置硬件。或者,您可以退出该向导,使用“如何设置您的硬件”部分在其他时间设置硬件。在Microsoft Office 2003 和 2002 程序中打开语音识别若要在 Micr...
讯飞输入法是一款怎样的产品?
讯飞输入法是一款集语音、手写、拼音等多种输入方式于一体的输入软件。鉴于它最大的特点是语音识别输入,所以今天我们重点讨论语音输入法这一点。虽然我是罗粉,但坦率地说,其实早在锤子发布会前,讯飞作为输入法就已经出现很久了,而且语音识别技术也不是什么新鲜事儿,只是这种讯飞和老罗这种广告硬植再...