问答文章1 问答文章501 问答文章1001 问答文章1501 问答文章2001 问答文章2501 问答文章3001 问答文章3501 问答文章4001 问答文章4501 问答文章5001 问答文章5501 问答文章6001 问答文章6501 问答文章7001 问答文章7501 问答文章8001 问答文章8501 问答文章9001 问答文章9501

一个一亿人用的语音识别APP,需要多少人开发

发布网友 发布时间:2022-05-11 07:18

我来回答

3个回答

热心网友 时间:2023-10-08 17:35

优势的话,一是学习者心理压力小。可能很多人小时候都经历过,在街上碰到一个老外,爸爸妈妈就在一旁戳你:“快去和老外对个话”。其实对很多人来说,开口说外语的门心理障碍其实是很大的,而通过机器学口语就完全没有这种压力。其次是可以利用碎片化时间,学习更高效,而和真人对话的时间成本和门槛都比较高。

具体来说,目前的语音识别技术可以怎样帮助学习者提高口语呢?
秦龙:主要是两种方式,第一种的目的是帮助用户改善发音:软件给出一个句子,用户读句子,机器会通过语音识别技术来判断你发音对不对,给出一个评分。

第二种方式,目前的语言学习软件,包括 Duolingo 在内,做得都还不够好:理想状况下,在创建的场景下,学习者和电子设备应该可以实现自由对话,语音识别技术不但能够识别发音是否标准,还能进行语义理解,判断学习者的词汇句法是否正确,这和Siri的技术有些相似,但具体如何在 Duolingo 中实现,我们还在研究中。

目前 Duolingo 网页端已经可以做到的是:在创建的场景中,引导用户先用文字翻译句子,再把翻译后的外语读出来,机器会分别就文字翻译和口语发音两方面的水准进行打分。

Duolingo 目前提供超过40种语言课程,甚至包括克林贡语。语音识别技术支持其中多少种?

秦龙:目前已支持的语言有10种(英语、西班牙语、法语、德语、意大利语、葡萄牙语、荷兰语、丹麦语、瑞典语、土耳其语),已在开发中即将上线的还有乌克兰语和挪威语。Duolingo 在英语语音识别中投入最多,它的识别结果和打分也最准确,因为英语是目前 Duolingo 上学习人数最多的语言,占到全部流量的30-40%。

团队目前有多少人?每种语言的语音识别需不需要开发者本身懂这种语言?

秦龙:Duolingo 语音识别团队目前由我一个人负责。我本人只会中文和英文,所以刚开始接触的时候也有些忐忑。最后衡量语音识别效果的是客观评测,所以开发者其实并不必须掌握语言本身,但对每种语言的是深入理解对开发是有很大帮助的,在细节的处理上会更准确一些。

能不能给非技术背景的读者解释一下,多语种语音识别的难度究竟在哪里?Duolingo 每开发一种新语言的成本如何?

秦龙:难度主要来自三方面。一是数据非常庞杂:来自网页端、平板、手机端的语音质量都不相同;男女老少,甚至不同文化程度的人有不同的语言习惯;朗读和自然对话的语音数据不同;室内录音和室外录音也数据也不同......要将这些情况全部考虑进去,做出准确的识别结果,需要相当大的开发量。

二是不同语言有不同元素,比如中文的特点是有平仄声调,德语的特点是可以把不同词汇组在一起生成一个新词,因此词汇量异常的大,开发时需要根据每种语言的特点做相应调整。

三是多语种数据库本身有很大的维护成本。

目前世界上识别语言最多的技术应该来自Google,覆盖了40多种语言,Siri 和微软也都能识别20多种。

就 Duolingo 来说,开发英语识别这部分用了2-3个月,其他一些小语种(西、德、法、意)在数据到位的情况下,用2-3个星期就完成了。

Duolingo 作为一家创业型公司,整个公司负责语音识别技术的也只有你一个人,没有科技巨头们那么多的资源,又要开发多种语言,怎么应对这种压力呢?

秦龙:我们的诀窍主要是:利用一切可以利用的免费资源。比如,我们会利用公开的Google API 在Chrome 版本的 Duolingo 中使用,省去一部分开发资源;我们还会利用 Google Voice Search 的语音识别,不过因为我们识别需要服务于语言学习的目的,而不是搜索目的,所以使用时会在后端做一些调整;另外,我们还会抓取一些开源词典的发音,并根据 Duolingo 的需求做一些剪裁和修改。

热心网友 时间:2023-10-08 17:35

多少人使用与多少人开发并没有直接关系,功能就那样,人多开发可能快,人少可能开发慢
使用的人多可能是功能强大,适合大众使用,受用户欢迎

热心网友 时间:2023-10-08 17:36

盘点稚汗为人谒粟
云知声是如何拿到1亿元A轮融资的?

1999年刘庆峰创立了科大讯飞,同为中科大校友的梁家恩当时还没毕业,两年后梁家恩开始接触语音识别技术,并在国内最早进行语音识别的研究机构——中科院自动化所深造5年,现在,二人站到了同一个舞台上。在创立初期云知声获得了千万元级别的天使投资,2012年9月,云知声发布“云知声”语音识别公有云,成为国内...

智能语音机器人哪个好

语音机器人的核心是语音识别,现在各大厂家的识别率都差不多,主要看对行业的优化。朗深公司的人工智能机器人针对多个行业做了优化,支持听写模式和关键词模式,支持打断和非打断,在电销、房产、教育等行业应用广泛。朗深人工智能机器人与朗深...

chatGPT是什么意思?

ChatGPT是是由人工智能研究实验室OpenAI在2022年11月30日发布的全新聊天机器人模型,一款人工智能技术驱动的自然语言处理工具。它能够通过学习和理解人类的语言来进行对话,不仅上知天文下知地理,知识渊博,还能根据聊天的上下文进行互动,真正像人类一样来聊天交流,但ChatGPT不单是聊天机器人的简单,甚至能...

若琪音箱可以随身携带,随身携带怎么联网?

1.通过有线网口直接连接 WiFi音箱在背部的接口区域拥有RJ45网口,因此最简单直接的方法就是通过有线网络连接,但这样缺点也相当明显,使得音箱并不是真正的无线,摆放时会受限于网线的长度,不易和路由器离开较远的距离,对于居家面积很大的网友来说,这种有线连接方式显然不太适合。2.通过有线网口连接再...

手机上最好用的输入法是什么?

3、讯飞输入法 讯飞输入法的特点是它的语音输入。在语音识别方面,讯飞是最先布局的输入法,在网络环境顺畅的情况下,讯飞输入法的语音转换文字几乎没有停滞,十分及时。1分钟输入400字对于大多数人来说可能稍微困难一些,但一分钟两百字基本是没有问题的。4、QQ输入法 QQ输入法主要还是依托于腾讯的生态...

为什么全民K歌更新不了?

2019年声网针对客户除了RTC外的实时互动需求发布了云市场,首次提出构建实时互联网生态的概念,建立开发者生态,引入美颜、鉴黄、语音识别、互动白板等领域的上下游合作伙伴,其中不乏阿里云、小米、云知声、依图、商汤、搜狗、360AI等明星开发者,一起给客户提供完整的实时互动能力。 2020年声网推出了Agora云市场2.0版本,可将...

如何看待华为Mate 40系列国内发布会自有应用服务,有哪些亮点?

我觉得挺好的,就是可以吸引一些喜欢这类就是服务的那个个性化的和人不一样,手机的一群人,然后让人觉得就是用这款手机和别人不一样,然后完整好就让人可以有那种炫耀和那个羡慕 我觉得挺好的,就是可以吸引一些喜欢这类就是服务的那个个性化的和人不一样,手机的一群人,然后让人觉得就是用这款...

3g时代移动互联网将重点发展的业务包括什么

如余额宝、理财通等移动互联网金融理财产品风生水起,改变了普通百姓的金融消费习惯和理念,让指尖金融在年青人中广泛流传。 4、移动互联网驱动创新,引领产业融合发展 2013年,移动互联网驱动产业融合、创新,开启了一扇扇创新的大门。可穿戴设备、4G、云计算、大数据,以及语音识别技术等等都给相关行业的发展带来巨大的...

小米10和爱酷3哪个更值得入手?

IQOO 3和小米10哪个更好。事先说明,外观属于主观因素,每个人的眼光都不一样,因此不评价两台手机的外观。iQOO3和小米10对比评测:从上面的参数对比表格可以看出,iQOO 3和小米10配置比较接近,但是体验方面小米10更占上风。首先是屏幕,iQOO 3官网中没有说明具体的刷新率,那就意味着还是60Hz。对比...

语音识别和说话人识别区别 APP开发语音识别 语音识别是否可以识别到人 声纹识人,分角色语音识别 语音识别的应用 可以语音识别是哪里的人吗 语音识别APP 有没有语音识别字的软件 把语音识别成文字的app
声明声明:本网页内容为用户发布,旨在传播知识,不代表本网认同其观点,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。E-MAIL:11247931@qq.com
热血江湖剑客怎么升级快些 三月份有哪些花开花 三月份有哪些花开花呢 三月什么花开的最旺盛呢 请问急性化脓性扁桃体炎期间可不可以食用巧克力? 扁桃体化脓吃什么消炎药 为什么扁桃体发炎或者化脓以后不能喝冷水或者吃辣的东西呢? 扁桃体化脓能吃冰淇淋吗 扁桃体化脓可以吃什么 炸酱面通常使用哪种面条? ...写一篇150词左右的英语短文。 Halloween(万圣节... 请问屋面几分水怎么计算呢?另外有公式吗? 屋顶几分水是怎么计算出来的? 信用账户有钱普通账户没钱可以开通创业板吗 房屋分水具体怎么计算?他们经常说4分水 ,5分水等等,具体计算公式是怎样的? 高中生毕业后想留学伦敦艺术大学怎么办 伦敦艺术大学研究生对托福的要求是多少,各科小分有什么具体要求 伦敦大学艺术类专业雅思要求是什么? 伦敦艺术大学雅思5.0可以录取吗? 3g手机和4g手机有啥区别 最高限速60,65算超速吗 货车在高速公路上的最高时速限制为多少 PBBTOOOPPOA7X光遇可以分屏吗 2013河南大学生创业贷款 能贷多少钱??? 河南省针对大学生毕业后自主创业问题有什么政策? 河南省大学生创业的具体政策 社会保障卡弄丢了怎样余额查询 源文件中的meta有啥作用 excel中怎么批量删除空白行 2014年1月到2016年五月,央行基准利率调整了几次。急求利率调整表 2011年银行调整了几次存款利率,都是什么时间,利率是多少?调整银行存款利率的具体因素是哪些? 如何在android平台上实现语音识别 怎么在U3D中添加语音识别啊,求帮忙 如何在调用讯飞语音API时不弹出”请说话“对话框,又能完成语音识别的功能 农村建房,屋面水法应如何计算 Xamarin有自己的语音识别技术吗?或者支持什么语音识别框架或API(iOS)方面的 筒瓦一般取几分水 30度的屋面等于几分水,怎么算的,假如进升4米,高是多少?急 4分水的屋脊角度是多少? 建房屋坡屋顶是怎么算水的? 屋面分水面积是什么意思? 坡屋面屋脊长度如何计算 斜屋顶分水是用三角形的什么公式计算 屋脊工程量如何计算? 五分水与四分半水表示坡度什么 农村平瓦屋面几分水为宜? 哪位gg&jj能不能搞到上交大《材料科学基础》和《材料热力学与动力学》考博专业课的历届试卷? 材料热力学与动力学的介绍 动力学和热力学解决的问题有什么不同?并举两个例子。 材料热力学与动力学的图书简介 热力学中的相似性原理