Speech2Face模型主要是为了研究语音与相貌之间的关联性?

你相信吗?ai人工智慧最近已经进化到,只要花6秒的时间,听到你的声音除可以分辨出你的性别、年纪与种族外,甚至可以描绘出你的长相。
这款由麻省理工学院(mit)所打造出来的ai,研究人员用一个由数百万个影片剪辑而成的数据集,对一个名为speech2face的神经网络模型进行自我训练,而这款网络的运作大概分成两部分,一个是语音编码器,主要负责对输入的语音来进行分析,并预测出相关的脸部特征;另一个则是脸部解码器,主要对输入的脸部特征来进行整合并产生图像。从最终结果来看,仅用了6秒,就能靠着声音来还原人脸,效果上是令人满意的。
该研究团队表示,他们的目的并非为了准确还原说话者的模样,speech2face模型主要是为了研究语音与相貌之间的关联性。目前speech2face已经可以识别出性别,而对于白种人与亚洲人也能轻易分辨,在年纪部分从30、40、70岁的年龄段声音命中率会比较高一点。
除了基础的性别、年纪与种族外,speech2face还可以猜中一些脸部特征,像是鼻子结构、嘴唇厚度与形状、咬合等情况,也可以猜出大概的脸部骨架,基本上声音输入的时间越长,这款ai的准确率就越高;不过研究人员也坦言,ai的听觉也会有错,这款ai会将尚未经历变声期的小男生当作女性、对说话者的口音也会有判断错误的时候、甚至搞错年龄等。研究人员表示,speech2face之所以会有局限性,部分原因是因为数据集中的说话者,本身种族多样性不够丰富,所以让它在辨认不同种族人士声音这样的能力上是比较弱的。
不过也有人认为这项技术背后所隐藏的隐私与歧视等问题,令人担忧;他们认为虽然这是纯粹的学术调查,但脸部信息的潜在敏感性,是有必要进一步讨论当中的道德因素,应该要对此进行严谨的技术测试,并确保实际数据可以代表预期中的用户群。


风阻系数达0.27!别克威朗空气动力深度解析
什么是WiMAX(新3G标准)
按功能分集成电路有哪些类型 集成电路的工作速度主要取决于什么
平台稳定性里程碑 | Android 14 Beta 3 发布
华为在欧注册“方舟操作系统”商标
Speech2Face模型主要是为了研究语音与相貌之间的关联性?
cam350使用教程_cam350使用注意事项
进行PLC通讯和变频器的简洁结合设计
PPLN晶体详解,如何使用PPLN晶体
iGameRTX2080TiVulcanXOC评测 最强做工性能以及个性集于一身
全新的工艺型PLC S7-1500T常见故障集合
基于UC3845的单端反激AC-DC充电器
免拆诊断 | 2010 款雪佛兰科鲁兹车发动机故障灯异常点亮、加速无力
“宁王”迎最大对手!电池能量密度高两成
fpga和单片机的区别
为什么安卓手机的振动体验一直都不如苹果?
【2023埃森展】创想智控邀请您来参观 展位号16282
Q2季度我国光纤宽带价格在全部71个国家中排名前列
力矩电机用在什么地方_力矩电机应用范围
利用键合提高低噪声放大器射频性能的综合方法