语音人工智能技术正在兴起 渐渐地语音技术已跟我们密切相关

早在计算机发明之前,自动语音识别的设想就已经被提上了议事日程,早期的声码器可被视作语音识别及合成的雏形。而1920年代生产的“radio rex”玩具狗可能是最早的语音识别器,当这只狗的名字被呼唤的时候,它能够从底座上弹出来。最早的基于电子计算机的语音识别系统是由at&t贝尔实验室开发的audrey语音识别系统,它能够识别10个英文数字。其识别方法是跟踪语音中的共振峰。该系统得到了98%的正确率。到1950年代末,伦敦学院(college of london)的denes已经将语法概率加入语音识别中。1960年代,人工神经网络被引入了语音识别。这一时代的两大突破是线性预测编码linear predictive coding (lpc), 及动态时间规整dynamic time warp技术。
互联网时代,科技家居已经变得格外普遍。智能语音界面无处不在,或许现在的人们跟智能软件讲话的次数比邻居、老同学甚至家人还要多。我们将amazon echo或者google home安装在家里的某个角落,我们跟siri调侃谈话,我们搜索资料、发送信息、控制相连设备、购物等等,都和语音界面紧密相关。
但事实上是孩子先一步接触语音技术的。2010年ipad第一次亮相后,孩子很快就学会如何激发语音界面。识字尚且不多的孩子希望世界上的一切都和这个ipad一样,只要说话就可以控制了。但那时技术尚且不成熟,孩子和机器说话,像“alexa,打开车窗”或者“谷歌,调整电视信号”,沮丧的是,这时什么都没有发生。孩子也在等待世界跟上他们的步伐,就像鼠标和触摸控制是大人的,而语音控制却是孩子的,智能语音界面就是他们最了解也最喜爱的东西。
语音用户界面有个大舞台,随着科技进步,舞台会越变越大。alexa、google home以及siri的各项功能随着时间越来越丰富,越来越完善。我们已经可以和它们有良好的互动,像“alexa,今天早上的通勤时间是多少?”或者“谷歌,告诉我今天的天气”。我们喜欢和机器人聊天,但又很快的抛弃它们。根据voicelabs统计显示,用户度过了第一周的新鲜期以后,继续使用语音用户界面的几率只有3%。对于试图想要和消费者建立良好互动关系的营销人员来讲,这并不是一个好现象。那么想要建立更加复杂的交互关系就更加困难了。
语言界面现在虽然已经兴起,但是用户似乎尚未学会物尽其用。因为在大多数的情况下,我们并不需要创造对话,我们只是想在语音界面输入老式单一的命令。像在行程中添加一些东西、播放一首歌曲以及设置一个闹钟,这些都只需要简单的命令。这些命令语音界面都可以游刃有余的办好,但是一旦涉及到更加广泛的谈话空间,语音界面就显得迟钝。但是这不单单是用户界面的问题,智能语音界面和用户想要建立更加流畅的对话关系,需要长时间的信息采集。例如当用户提到“有趣的周末”时,语音界面的回答建议便是从以前的对话中提取整合信息得来的。
语音用户界面的模块构建需要对话设计。保罗·庞加罗(paul pangaro),一位权威的会话理论家,提出了对话简单元素和流程的框架。以此为基础,研发者设计界面时,设定谈话双方要共享上下文以及语言环境,准确定义谈话目标,反复评估和交换信息。
现在有很好的工具促进语音用户界面的对话创建。pullstring和dexter试图向用户呈现一个友好的界面的同时保持运行灵活顺畅。但是为了语音用户界面的更好发展,这些工具还是需要改进,例如设计专业业务逻辑,像针对用户的职业身份,语音界面会具备相应的专业只是系统;以及语音人工智能的个性化以及品牌化发展等。
上面提出的已经有公司在尝试,但这还需要很多的工作要做。语音人工智能技术正在兴起,无论是对广大的用户来讲还是营销人员来讲,相信语音用户界面的发展会给人们带来更多更美好的体验。

RS出货Raspberry Pi相机模块
蓝牙耳机哪个品牌性价比高,国内性价比高的无线蓝牙耳机推荐
氢燃料电池和智能锂离子电池是欧洲绿色复苏的关键
智慧浴室的“大脑”——智能家居魔镜
以模拟电视系统介绍CRT显示技术原理
语音人工智能技术正在兴起 渐渐地语音技术已跟我们密切相关
微软现准备将Windows 7进入扩展安全更新的第二年
中国芯崛起:2009只有1家,现在11家!
自制最便宜功放 1.9元全网最低
伺服和控制器之间靠什么联系
平板电视选购技巧
穿戴式设备成为主角 苹果手表会不会成主流
TD-SCDMA无线传播模型校正
苹果便宜新机就要来临,iPhone7表示压力山大
吴汉明:集成电路产业发展需突破两大壁垒
区块链赋能金融怎样为技术落地提速
电路板用什么清洗
1∶80拆股 百度为募资赴港二次上市
中国的一部重要法律出台了,这就是《出口管制法》
下一代英特尔玻璃基板封装转型概述