为什么语音输入那么准?
发布网友
发布时间:2022-04-23 08:43
我来回答
共5个回答
热心网友
时间:2022-06-18 12:26
语音输入是根据操作者的讲话,电脑识别成汉字的输入方法(又称声控输入)。它是用与主机相连的话筒读出汉字的语音,利用语音识别系统分析辩识汉字或词组,把识别后的汉字显示在编辑区中,再通过“发送”功能将编辑区的文字传到其他文档的编辑中。
语音识别技术的原理是将人的话音转换成声音信号,经过特殊处理,与计算机中已存储的已有声音信号进行比较,然后反馈出识别的结果。其关键在于将人的话音转换成声音信号的准确性,以及与原有声音信号比较时的智能化程度。语音识别技术是人工智能的有机组成部分。
这种输入法的好处是不再用手去输入,把双手解放出来,只要会读出汉字的读音即可,但是受每个人汉字发音的*,不可能都满足语音识别软件的要求,因此在实际应用中错误率较键盘输入高。特别是一些专业技术方面的语言,识别系统几乎不能确认,错误率较高。
目前,主流的大词汇量语音识别系统多采用统计模式识别技术。典型的基于统计模式识别方法的 语音识别系统由以下几个基本模块所构成
信号处理及特征提取模块。该模块的主要任务是从输入信号中提取特征,供声学模型处理。同时,它一般也包括了一些信号处理技术,以尽可能降低环境噪声、信道、说话人等因素对特征造成的影响。 统计声学模型。典型系统多采用基于一阶隐马尔科夫模型进行建模。 发音词典。发音词典包含系统所能处理的词汇集及其发音。发音词典实际提供了声学模型建模单元与语言模型建模单元间的映射。 语言模型。语言模型对系统所针对的语言进行建模。理论上,包括正则语言,上下文无关文法在内的各种语言模型都可以作为语言模型,但目前各种系统普遍采用的还是基于统计的N元文法及其变体。 解码器。解码器是语音识别系统的核心之一,其任务是对输入的信号,根据声学、语言模型及词典,寻找能够以最大概率输出该信号的词串。 从数学角度可以更加清楚的了解上述模块之间的关系。
热心网友
时间:2022-06-18 12:27
现在都是智能化,能通过语句的连贯性,来鉴别最大可能性的语句,当然只要你的普通话不是太差。
热心网友
时间:2022-06-18 12:27
普通话标准的话,语音输入就准。
热心网友
时间:2022-06-18 12:28
没看有多准,这只能说明你的普通话很标准。很棒啊,普通话很优秀啊,香港人就惨了,啥呢渣渣灰
热心网友
时间:2022-06-18 12:29
那是因为高科技呗!还有你的吐字清楚