问答文章1 问答文章501 问答文章1001 问答文章1501 问答文章2001 问答文章2501 问答文章3001 问答文章3501 问答文章4001 问答文章4501 问答文章5001 问答文章5501 问答文章6001 问答文章6501 问答文章7001 问答文章7501 问答文章8001 问答文章8501 问答文章9001 问答文章9501

我们为什么还不能和手机交谈?

发布网友 发布时间:2022-05-25 23:17

我来回答

1个回答

热心网友 时间:2024-03-07 09:26

  四十多年前,专家们曾宣称,语音识别将在“五到十年内”发展为一项成熟的技术。可多年过后,他们依然重复着一模一样的说辞。
  语音识别的发展确实费了不少工夫——好在,时隔多年以后,我们总算开发出了一套质量过硬的识别技术。不仅如此,我们还把这玩意应用到了移动设备上(尽管还得靠服务器提供一大堆技术支持)。
  回答这个问题的关键,在于提供一个语音交互界面,远比理解一打单词来得复杂——尤其是对手机而言。我们还必须得理解用户的“意图”。要知道,除了语音技术本身以外,人机语音交流中还有其他因素在作怪——输出方式,互动形式还有语境。
  多元化的输出:既能秀,也能说
  如今投入使用的语音系统,识别的效果一般都过于极端化——要么一字不差,要么谬以千里。事实上,当我们查询一条去某大街的路线时,要是系统能精确无误地从数据库的上千个条目中识别出我们想要的那一条,还是挺令人称奇的。不幸的是,如果识别有误或者街名不准,我们的搜索就只能乖乖从头再来。
  要想在现有的语音技术上有所突破,我们必须得认识到一点:我们现有的系统,不过就是最原始的识别技术而已——识别技术本身没啥问题;但除了这套技术以外,我们的系统只是一个空壳罢了。而我们需要的,其实是创造一个语音交互界面——说白了,就是一整套基于语音的互动模式。
  理解用户的“意图”,意味着系统要判断出用户真正需要的事物,而这通常得依靠交谈来实现。这就是说,系统要了解用户为什么问这个问题——一般来说,这就要求系统去知晓对方在做什么;与此同时,这也要求系统根据用户所处的情形合理应答。这可决不是一项轻松的任务——毕竟,用户只是把移动设备握在手中而已,他们可能有着大把的事情,要忙着分神去处理。
  互动是一种双向的沟通,意味着我们在提供输入的同时还得留意输出;而这些能发声的应用是怎么回答我们的呢?最常见的方式,是直接向用户回复他们所想要的信息。那些提供实时驾驶指南的“杀手级应用”就是个典型的例子:用户双眼注视路况,双手把好方向盘,然后严格按照语音提示说的做就行——这种情况下,这样的应答方式也确实管用。
  这其中的关键在于,语音只是瞬时性的——一句话,说完就完了。要是我们一时不小心分神了,或者一下子没来得及把消息印到脑子里,我们就得再问一遍。说不定还得问上一遍又一遍。
  理解背后的“意图”
  这也引出了未来的语音技术所需的第三个,也是最重要的一个因素:语境。人们的对话里包含着丰富的语境信息:词汇表达的意思,代词指代的对象,还有那些被重读的单词。这其中牵涉到一系列细微的语言模式(心理语言学家赫伯·克拉克称其为“定位”),使得一句像“你懂了没?”这样的短问句,就足以暗示一段微妙、共有的经历——因为对话中的另一方清楚你所暗指的是什么。
  而这些语境,正是手机可以大展身手的场合,尤其是考虑到语音技术发展的现状与未来的话:手机知道它自己身处何处;它能够识记我在不在上班、在哪里上班;它清楚我都跟谁打过电话,谁是对我更重要的人。
  如果我用的是清一色的安卓或者iOS应用的话,手机还能掌握我的邮件信息、日程安排,还有我的兴趣爱好。于是,当我问“公交是几点来着?”的时候,手机就会听懂我说的是哪趟车、哪一站、哪个方向,甚至还包括我要将花多久才能赶到车站。事实上,说不定在我发问之前,手机里的闹钟就会自动响起,提醒我该起身出门赶车去了,还能顺带一句“别忘带雨伞哦”——就像一个称职的管家一样。
  对语境的分析,不仅有助于我们理解一词一句,更能帮我们理解其背后的“意图”。尽管在一些手机应用中,我们多多少少已经体验到了这些功能;但就语音而言,相关技术还远未成熟。至少目前看来还言之尚早。毕竟,我们不能忽视社会因素的影响:在公共场合,我们未必会和手机“交谈”,可能是因为我们不想打扰他人,也可能是因为我们不愿暴露隐私。
  但事情总是在变化的。我是美国最早用上第一代手机(摩托罗拉MicroTac)的人之一。当年我打着大哥大走在马路上的时候,周围的人看我就像看个疯子一样——即使是在MIT这样遍地技术狂的校园里也毫不例外。而现在,看到那些戴着蓝牙耳机自顾自聊天的路人,我们都已经见怪不怪了——要知道,从前这可都是疯子的标志呢。  (作者系麻省理工媒体实验室科学家,语言+移动项目组负责人,译者:北大西洋的龙猫)
声明声明:本网页内容为用户发布,旨在传播知识,不代表本网认同其观点,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。E-MAIL:11247931@qq.com
...啊?我从嘴里吐出去是直的算过肺了吗?我不会从鼻子里出去_百度... 恶心呕吐是什么? 高考数学大题应注意哪些问题呢? 高考数学可不可以用高等数学啊 高考数学 基础知识点 常见考查方式 高考数学考什么内容 一般纳税人如何交所得税 以前的QQ忘记密码了那时候不要了就不找回密码了,现在想找回来,但是又没... 常州机场坐飞机流程 常州机场大巴时刻表 ...我早上九点起飞的飞机, 然后我这的机场快线大巴到机场时70分钟,_百 ... VV5怎样播放手机照片? viovv55手机格式化后怎样找回主菜单? 【十月大征集】安全智能,性价比超高的魏派VV5,值得信赖 vv5咋设置开机壁纸 win8联想电脑y510p如何进入安全模式 丁当年龄? 玖富万卡和玖富叮当哪一个适合学生? 大连电瓷的财报?大连电瓷最新事件?大连电瓷股票牛叉股? 大连电瓷股走势股价?大连电瓷今日技术分析?股票大连电瓷股价今天是多少... 大连电瓷财务报表?大连电瓷今日新闻?大连电瓷千股千平? 大连电瓷半年报预告?大连电瓷今日股市?股大连电瓷千股千评? 大连电瓷财报数据?大连电瓷今日趋势?大连电瓷千古千评? 大连电瓷股历史行情?大连电瓷股千股评价?大连电瓷下跌缩量? 大连电瓷的市盈率为什么那么高?大连电瓷2021年报预测?大连电瓷千股千评... 大连电瓷的股价为什么那么低?大连电瓷2021半年报预报?股票大连电瓷千股... 大连电瓷现在可以介入吗?大连电瓷最近股价怎么了?大连电瓷千股千评... 大连电瓷估值为什么这么低?大连电瓷2021年度报?大连电瓷千股千评东方... 大连电瓷财报时间?大连电瓷今日能买吗?大连电瓷股千股千评?_百度... 股市分析大连电瓷?大连电瓷千股千评价?大连电瓷股票涨不动? 大连电瓷的股票为什么涨的慢?大连电瓷2021年报?大连电瓷每日千股千评... 如何最简单的搭建一个语音交互的原型 语音交互会成为人机交互的主流吗 如何看待市面上的语音交互功能? 交互界面是什么意思 想请教下在flash中如何使用语音识别进行交互,就是把原来的鼠标交互换成... 去朋友家看到墙上的装饰画居然有语音交互的功能,会和人互动,看着也不是... 手机照片怎么弄成电子版发送 身份证上未满18岁可以办邮政银行卡吗 小米手机接后自动备份发微信人的信息,怎么停止? 哎 显卡烧了 技嘉的怎么保修 面点技师证需要多少钱? 广东德奥轨道装备有限公司怎么样? 广州南车城市轨道装备有限公司怎么样 广东南车轨道交通车辆有限公司好吗??发展前景怎么样? 轨道装备有限公司怎么翻译比较好? 是rail equipment,还是railway equipmen... 出纳员可以做工资工作吗? 阴阳师百鬼夜行砸哪里 萌新问下。。阴阳师的百鬼券这么刷多 阴阳师百鬼弈玩法攻略_阴阳师新玩法百鬼弈怎么玩 短视频剪辑教拍视频要拍胸给看是不是骗子