nvidia 发布了 nvidia riva 在语音人工智能方面的新突破, nvidia nemo 在大规模语言建模( llm )方面的新突破。 riva 是一款 gpu 加速语音人工智能 sdk ,用于企业为其品牌和虚拟助手生成富有表现力的类人语音。 nemo 是语音和 nlu 的加速培训框架,它现在有能力开发具有数万亿参数的大规模语言模型。
语音和语言人工智能的这些进步使企业和研究机构能够轻松构建针对其行业和领域定制的最先进的对话人工智能功能。
英伟达 riva
nvidia 发布了一个具有定制语音功能的新版本,企业只需 30 分钟的语音数据即可轻松创建独特的语音来代表其品牌。
此外, nvidia 宣布了riva enterprise,这是一项付费计划,包括为需要大规模 riva 部署的企业提供 nvidia 专家支持。 riva 仍然免费提供给工作量较小的客户和合作伙伴。
亮点包括:
在 a100 上用一天 30 分钟的音频数据创建一个新的神经语音。
细粒度控件以生成富有表现力的声音。
a100 上的 fastpitch + hifigan 比 v100 上的 tacotron2 + waveglow 性能高 12 倍。
支持五种其他语言的世界级语音识别。
扩展到成百上千的实时流。
在任何云端、本地和边缘运行。
注册以接收有关 riva enterprise 的最新消息和更新,以进行大规模部署 》》
使用 riva 开发应用程序
阅读此introductory post to了解 riva 工作流中的组件。
接下来,按照本教程构建您自己的端到端语音识别服务:
parthart: 1-ec6
parthart: h2-em7
parthut: 3-ecen-18
有关构建virtual assistants和transcription with entity recognition等语音应用程序的更多教程,请访问riva getting started. 》》
nvidia nemo megatron 、 triton 多 – gpu 多节点推理和 megatron 530b
nvidia 还推出了为企业构建、定制和部署大型语言模型的功能。 nemo megatron 是 nemo 框架中的一项新功能,用于培训多达数万亿个参数的大型语言模型( llm )。
它包括megatron方面的进步,这是一个由 nvidia 研究人员领导的开源项目,旨在开发有效培训法学硕士的技术。企业可以使用 nemo megatron 定制 llm ,如 megatron 530b ,并使用 nvidia triton 推理服务器跨多个 gpu 和节点进行部署。
亮点包括:
在包含数十亿页文本的庞大数据集上自动化数据整理。
为新的域和语言培训megatron 530b等模型。
从单节点扩展到超级计算机,包括数十个dgx a100系统。
导出到多个节点和 gpu s ,用于使用 nvidia triton 推理服务器进行实时推理。
关于作者
siddharth sharma 是nvidia 加速计算的高级技术营销经理。在加入nvidia 之前, siddharth 是 mathworks simulink 和 stateflow 的产品营销经理,与汽车和航空航天公司密切合作,采用基于模型的设计来创建控制软件。
关于零欧姆电阻器额定功率
带宽,永远不够宽?
固态电池设计与性能估算工具
创维酷开智能电视系统5.5:基于用户体验 10s级开机速度
RCC时钟模块外设的详细分析和理解的资料概述
NVIDIA发布Riva语音AI和大型LLM软件
衍梓装备:业内首款改进工艺SiC栅氧制备设备
数的机器码表示,数的机器码表示原理图解
科大讯飞智能语音技术,能帮助听障人士“看见”声音 能人与人的交流
如何看待上汽通用五菱宏光的GSE小车平台长期发展?
如何用一种级联的并解决嵌套的实体的三元组抽取模型?
任正非:遵循各国政府对安全问题的监管,未来发展做出合理调整
三星S10将放弃虹膜解锁,采用屏下指纹和3D结构光技术
iPhone8跌破4000元:苹果手机降价能否挽回销量
光电传感器的应用领域以及工作特点介绍
FPGA的引脚配置技巧 分配fpga管脚时该怎么选择
比特币交易究竟是如何运作的
达实智能大厦为用户提供全生命周期的智慧空间与低碳节能服务
自适应均衡器系统电子电路剖析 —电路图天天读(202)
未来VR头显或将与太阳眼镜相似