经济学人解释说,语音识别软件如何在2014年4月23日如此出色

 作者:邝潼俞     |      日期:2017-05-17 09:08:57
很长一段时间,语音识别软件很差,证实了计算机发现很难做人类容易做的事情,反之亦然但最近它已经变得更好了:大多数现代智能手机现在都有许多实际上有效的语音激活功能 Google Now或iPhone的Siri等程序不仅可以处理限制性任务,例如寻找餐馆或拨打电话号码;智能手机在自由形式的语音识别方面也变得更好,例如采用口述的文本消息或电子邮件计算机如何更好地理解语音几乎任何单词都可以开始一个句子,所以句子中的第一个单词可以是数万个单词中的一个如果任何单词在任何位置都与其他任何单词一样可能,则从20,000个单词的词汇表中的五个单词的话语将具有3.2 x 1021种可能性面对这样的赔率(以及由便宜的麦克风,背景噪音和压缩降低的声音信号),任务将是不可能的升级您的收件箱并获取我们的每日调度和编辑推荐但是,单词不会以随机顺序出现,因此计算机不必为您说的每个单词猜测(比如说)20,000个单词的词汇相反,该软件根据周围的单词,根据从大量数字化文档库和其他用户的先前话语中得出的统计模型,评估您是否有可能根据周围的单词说出一个单词 “the”之后的内容可能不是动词,例如,缩小了可能性在“杰斐逊撰写宣言”之后发生的事情缩小了可能性,而不是更多以自然的速度将“一辆漂亮的奶油卡车”命令进入您的手机,并且它可能会返回几乎同音的“冰淇淋卡车” “漂亮的奶油卡车”中的所有单词都很常见,但组合不是智能手机可以通过考虑用户的个人信息(例如他的地址簿中的姓名或他所在位置附近的城市)来进一步改善他们的猜测这种统计模型正在为各种语言应用提供动力例如,较旧形式的计算机化翻译倾向于试图打破句子的语法和含义,并用新语言重新组合最好的现代系统依赖于原始语言中字符串A被正确呈现为目标语言中的字符串B的可能性,其基于计算机已被训练的人体翻译材料的主体并且统计模型可以纠正常见和明显的错误:发送一个朋友“在路上割草”,即使“割”是一个英文单词,一些软件会知道将其改为“现在的路上”,因为“割”是一个相对不常见的词,几乎从未在“途中”之前计算机对人类更有用,他们对我们的了解越多,无论是集体还是个人消费者越来越关注的是,他们愿意放弃多少个人信息以换取更有帮助和更可靠的服务深入挖掘:转移,Siri: