只要6秒!AI人工智能只要听声音就能描绘你的长相
2020-07-29 12:53:30爱云资讯1231

你相信吗?AI人工智慧最近已经进化到,只要花6秒的时间,听到你的声音除可以分辨出你的性别、年纪与种族外,甚至可以描绘出你的长相。
这款由麻省理工学院(MIT)所打造出来的AI,研究人员用一个由数百万个影片剪辑而成的数据集,对一个名为Speech2Face的神经网络模型进行自我训练,而这款网络的运作大概分成两部分,一个是语音编码器,主要负责对输入的语音来进行分析,并预测出相关的脸部特征;另一个则是脸部解码器,主要对输入的脸部特征来进行整合并产生图像。从最终结果来看,仅用了6秒,就能靠着声音来还原人脸,效果上是令人满意的。
该研究团队表示,他们的目的并非为了准确还原说话者的模样,Speech2Face模型主要是为了研究语音与相貌之间的关联性。目前Speech2Face已经可以识别出性别,而对于白种人与亚洲人也能轻易分辨,在年纪部分从30、40、70岁的年龄段声音命中率会比较高一点。
除了基础的性别、年纪与种族外,Speech2Face还可以猜中一些脸部特征,像是鼻子结构、嘴唇厚度与形状、咬合等情况,也可以猜出大概的脸部骨架,基本上声音输入的时间越长,这款AI的准确率就越高;不过研究人员也坦言,AI的听觉也会有错,这款AI会将尚未经历变声期的小男生当作女性、对说话者的口音也会有判断错误的时候、甚至搞错年龄等。研究人员表示,Speech2Face之所以会有局限性,部分原因是因为数据集中的说话者,本身种族多样性不够丰富,所以让它在辨认不同种族人士声音这样的能力上是比较弱的。
不过也有人认为这项技术背后所隐藏的隐私与歧视等问题,令人担忧;他们认为虽然这是纯粹的学术调查,但脸部信息的潜在敏感性,是有必要进一步讨论当中的道德因素,应该要对此进行严谨的技术测试,并确保实际数据可以代表预期中的用户群。
相关文章
- 亿道数码携骁龙AI PC矩阵亮相高通科技日,定义移动办公轻时代
- 直击WAIC 2025 | 浩鲸科技联合蚂蚁数科发起“金融智能体应用联创联盟”
- 多模态AI融入日常交互 用三星Galaxy手机搭建效率工作流
- 引领智能运维!全新FortiAIOps 3.0重新定义IT运营
- 得瑞领新闪耀2025全球闪存峰会:D8000系列斩获创新大奖,强势赋能AI时代数据基石
- WAIC 2025 | SHIXP将与PPIO共建分布式智算枢纽平台
- 2025 WAIC落幕,深谋科技以技术与落地破局具身智能赛道
- AI赋能基层“智治” 湖北移动打造数字乡村治理新样本
- AI重磅奖项揭晓!用友大易荣膺人力资源服务业AI25强及思旗奖
- 中国最大黑客松AdventureX 2025杭州启幕,涂鸦赋能青年开发者引爆Physical AI变革
- WAIC2025:澳鹏发布新一代技术平台矩阵 助力大模型垂直应用落地
- 共建AI PC企业服务生态,京东政企业务携手高通打造骁龙AI PC生态科技日
- 2025 WAIC“智算技术创新与行业实践” 论坛圆满落幕 共绘智算生态新蓝图
- 四维图新亮相2025世界智能汽车大会:以AI新基建与数据闭环赋能智驾新范式
- 星辰聚智·才启未来:2025世界人工智能大会中国电信发布系列前沿能力及AI产品
- 神州云动CRM亮相2025浪潮AI向新 数字企业创新大会