在CES 2018上语音和人工智能应用的大爆发

在今年的国际消费电子展(ces 2018)上,语音(voice)、连接(connectivity)和人工智能(ai)成为最受关注的焦点。如果说今年的ces能为我们带来什么指标,那么这三项建构模块将是组成2018年及未来消费电子设备缺一不可的神圣“三位一体”。
语音助理已经准备好进入可穿戴设备、耳机、婴儿监视器、灯具、电视遥控器和车辆。dsp concepts创办人兼首席技术官paul beckmann在接受《ee times》时说:“我们似乎正见证着一场围绕着语音的‘寒武纪大爆发’。”
dsp concepts首席技术官paul beckmann
在ces上,被称为“中国google”的百度大力向开发商展示并开放其基于duer os的平台。无论是其声控台灯或挂在天花板上的投影机和屏幕,都不需要alexa或google assist。就像百度常挂在嘴边的“中国速度”,越来越多的厂商开始朝向语音发展。
百度展示了一款整合台灯功能的声控智能喇叭(来源:baidu)
消费设备必须具备连接能力已经是不争的事实。silicon labs首席执行官tyson tuttle强调,接下来的必备功能是“混搭”不同的无线网络。他解释说,直接将原本为智能手机设计的连接芯片加进物联网(iot)设备,已经无法满足要求了。系统需要动态的多协议软件,以及为不同的无线网络划分时间的能力。
尽管ai在高度自动化汽车中占据主导地位,但ceva首席执行官gideon wertheizer告诉我们:“我看到ai开始摆脱幻想世界。”供应商如今正试着“设置参数,在随机环境中使用ai来解决特定问题。”
ceva首席执行官gideon wertheizer
换句话说,许多公司开始学习在小规模应用中导入ai,并将其用于特定任务,而非依靠ai来解决世界上的问题。
语音随车上路
无论是在家庭或开车行驶中,语音都将至关重要。
博世(robert bosch)在ces宣布计划将其语音助理设计在方向盘后方。博世管理董事会成员dirk hoheisel表示:“我们正致力于让驾驶舱内的按钮乱象划下句点。”elektrobit在ces上承诺,该公司将成为亚马逊(amazon) alexa的第一批汽车软件整合商之一。
bosch开发“自然语言”车内语音辅助系统(来源:bosch)
百度宣布其基于duer os的apollo 2.0平台被称为“自动车辆的android”,并称语音辅助系统将成为该平台的一部份。百度总裁兼coo陆奇表示:“家庭与车辆之间已经不存在界限了。无论你在家中做什么,应该也都可以在车子里实现。”
wertheizer则指出,无论是在家中还是车内,隔离声音以及直接向云端发送清晰的讯号都非常困难。 “我们的周遭充斥着噪音和噪声着。”很自然地,家庭和汽车的解决方案必须能够因应一连串完全不同的嘈杂环境。
语音算法缺少标准
让问题变得更复杂的原因在于业界还没有任何标准的语音算法。
wertheizer表示:“每一家公司都有自家处理语音的专有算法。”
系统业者开始求助于学术界发表的技术论文,竞相找出如何最有效隔离语音的解决之道。而当他们使用不同的麦克风和扬声器类型时,还必须优化其算法,以因应不同的设置要求。
而在ceva,wertheizer说:“我们必须建立一个类似原子庇护所的工作室”,用于研究所有的选择,并开发波束成形、远场和近场、回声消除和环境降噪等算法。
beckman也呼应了这个观点。就像人们喜欢语音作为自然的用户接口一样,他说:“遗憾的是,对于实际执行的产品设计人员来说,它是最具挑战的技术之一。”他已经看到了太多的语音项目出错了,最终得回到草图阶段重新开始。
beckman曾经在bose corp.担任研究工程师长达9年,在2000年初成立了他的咨询业务。当他与客户讨论语音项目时,他发现业界需要一套有效执行的“完整软件解决方案,以及能为其实现差异化的底层技术”。但是,最主要的关键在于赋予其能够自行调整系统的能力。
随着语音市场爆发,beckman的业务也随之成长。dsp concepts不再只是一家咨询公司,现在还提供了一套完整的算法作为软件库和除错工具,有助于客户调整系统。beckman说:“我们提供调整、整合和验证工具。”
语音ui解决方案需要一套完整的算法(来源:dsp concepts)
dsp concepts的语音用户接口(ui)技术称为audio weaver,它是第一家获得亚马逊(amazon) alexa产品认证的第三方软件公司。dsp concepts共同创办人兼首席执行官chin beckmann展示一款audio weaver语音助理产品——相较于亚马逊echo使用了7支麦克风,audio weaver仅用了2支麦克风,据称就能够“听”得比echo或google home更清楚。
在边缘实现ai
wertheizer说,隔离语音是第一步,但接下来还有其他步骤:语音助理必须辨识语音的位置,而且必须能够追踪语音。而且,它必须能侦测以及辨识谁在房间里说话。
直到最近,云端才刚被认为是处理和学习的地方。如今,这个假设将在2018年发生改变。
wertheizer解释说:“我看到人们对于ai的态度越来越务实。他们希望在边缘设备执行ai而非在云端进行,以避免隐私、延迟和成本等问题。”
联发科技(medatek)首席财务官顾大为对此表示认同。相较于亚马逊在其echo设备中推动云端到云端的服务,联发科看到了“边缘和云端”融合模式的可能性。他在ces时告诉我们,语音助理竞赛如今已经着重于在本地增加“智慧”、区别人类与非人类的声音分开、消除背景音乐、辨识声音模式等。
petcube wi-fi宠物照相在远程进行机监测并与宠物互动(来源:petcube)
wertheizer说:“以petcube设计的交互式wi-fi宠物相机为例,它能在主人不在家时,透过双向音讯和1080p高分辨率(hd)视频摄影机进行监控,以及与狗或猫互动”。wertheizer说:“我不确定petcube是否意识到这是一家物联网公司。但是,像这样的连网产品中,语音识别系统显然必须能够辨识狗吠声,并且确定狗是处于压力还是处于危机之中。换句话说,系统需要有智能才能进行学习。”
neupro低功耗ai处理器
虽然ceva为语音系统的设计者提供了名为clearvox的语音算法,但它也知道系统厂商需要的更多。系统制造商希望在其物联网设备中整合学习和推论的能力,使其产品能够持续变得更加智能化。
目前的市场上亟需ai处理器。为了满足这一需求,ceva在ces上推出了nuepro,这是一款“专用的低功耗ai处理器系列,用于在边缘进行深度学习”。nuepro是一款独立的专用ai处理器,可广泛用于物联网、智能手机、安全监控、汽车、机器人、医疗和工业等市场。
ceva推出ai处理器(来源:ceva)
值得注意的是,ceva并非深度学习领域的新手。据报导,neupro是以ceva在计算机视觉应用深层神经网络方面的经验为基础。
wertheizer说,neupro ai处理器是ceva从头开始研发的第一款“非dsp”技术。他在发布neupro时说:“我有点紧张。但是你必须知道ai并不是讯号处理方面的问题。”
neupro处理器搭载两个硬件——neupro引擎和neupro vpu (向量处理单元)。wertheizer指出,虽然引擎处理定义良好的人工智能算法,如cnn、启动和规范层,但是,可编程的向量引擎neupro vpu是执行专有ai算法的一种延伸。“我们选择了这种硬联机的建置方式,而不是使用gpu或cpu,让我们能够增加ai处理器的利用率。”
ceva声称,这款新的专用ai处理器系列带来了“相当高的性能提升,从入门级处理器的2tops到为最高阶配置的12.5tops”。
neupro硬件模块;ceva首席执行官gideon wertheizer强调,“neupro vpu和neupro引擎之间的无缝切换至关重要”。 (来源:ceva)
ceva表示,neupro ai处理器将于2018年第二季向客户提供授权,并计划在第三季全面发布。
同样地,联发科准备推出一款由意腾科技(intelligo technology)设计的ai处理器和算法。intelligo是2016年时从联发科独立而出的新创公司。
intelligo设计的这款ai soc被称为“智能dnn语音处理器”应用范围较有限。联发科表示,该处理器提供“可配置的深度神经网络和高效率推论引擎(每秒每瓦特1 tops运算性能)”。
顾大为表示,联发科正在寻找一种小型的ai加速器,为辨识20到30个关键词而设计。另一方面,联发科也正推广其“分布式处理”的观念,期望语音和ai功能不只是整合于像echo或google home的智能音箱,而是更落实于广泛的小型设备——如电灯开关。

功率检测器MAX2206/MAX2208的基本性能特点及应用研究
NVIDIA Morpheus 通过生成式人工智能助力抵御鱼叉式网络钓鱼
边缘设备成就IoT的成功
传统彩电行业势衰 OLED市场被持续看好
中国宣布对部分无人机实施出口管制!
在CES 2018上语音和人工智能应用的大爆发
物联网中该如何使用区块链技术?
应用材料:2012年半导体有望止跌回升
台湾高技 GAOJ-K交叉滚柱导轨结构与优势
在智能大棚中温湿度传感器是温度和湿度测量的关键性元件
飞兆在“中美半导体节能技术、产品及应用合作论坛”上突显“绿色
高光谱遥感在生态环境监测上的应用
近场磁场探头的作用
美国两党激烈争夺国会控制权,佩洛西:我们可以说已控制了众议院
SL8700多功能平均电流型LED恒流驱动器概述及特点
5G带来“AI×IoT”革命 TCL智能电视是时代最大受益者
多层板减为两层板的方法
边缘计算的灾难恢复
安森美推出新的基于碳化硅的混合IGBT和相关的隔离型大电流IGBT门极驱动器
谷歌为ChromeOS加入新功能 可显示系统或安全性更新的期限