谷歌Live Transcribe语音识别技术可转文字

谷歌在其开源博客中宣布开源 android语音识别转录工具——live transcribe的语音引擎,它可以将语音或对话实时转录为文字,还能够为听障人士提供帮助。
live transcribe 是谷歌于今年2月推出的一款android应用程序,它的语音识别由谷歌最先进的cloud speech api提供。但是,依赖于云引入了一些复杂性,不断变化的网络连接、数据成本和延迟等等都带来一些考验。因此,谷歌把它开源出来,希望开发人员在已有的基础上进一步构建和开发。
cloud speech api目前无法支持无限的音频流,团队采取了一些措施来解决这一难题,例如在达到超时之前关闭并重新启动流式传输请求,这将有效减少会话中丢失的文本量。值得一提的是,live transcribe支持超过70种语言,并能够根据语音自动识别语种,其中也包括中文。
另外,由于是提供实时语音转录,转录出来的文本会随着语音的输入不断发生变化,降低延迟自然十分必要。该引擎能够大大降低延迟率,这都要归功于它的自定义opus编码器。

荣耀手机用什么蓝牙耳机好?适合荣耀手机的蓝牙耳机推荐
图像分割和图像边缘检测
ARM公司推出Cortex-A15 MPCore处理器
工地安装扬尘监测仪推荐厂家
英特尔推出了帮助Alexa进一步推广的基础语音硬件,助攻亚马逊!
谷歌Live Transcribe语音识别技术可转文字
C8051F040在基于CAN总线的分布式测控系统中的应用
Maxim发布最新喜马拉雅DC-DC降压转换器,快速实现工业安全标准
多式数据可视化微观服务
中国5G牌照年底或将全部发放
二极管在变频器中的作用
LENOVO 联想FLEX 11 CHROMEBOOK推出
索尼在年底准备增加库存,台积电日月光正准备更多芯片产能支持
LED封装质量非接触实时检测技术的研究
宝马致力于开发氢燃料电池动力系统
使用爱星物联平台,如何让设备快速入云?
发展车载资讯娱乐平台将成为移动通信产业跨足车联网的先锋市场
回映短讯 | 回映电子受邀参加桂电&成电“自动化与智能制造”专题研讨会
珠海航展上,JXF劲旋风召开了一场新品发布会
电导率分析仪在生命科学中的应用