只要6秒!AI人工智能只要听声音就能描绘你的长相
2020-07-29 12:53:30AI云资讯1362

你相信吗?AI人工智慧最近已经进化到,只要花6秒的时间,听到你的声音除可以分辨出你的性别、年纪与种族外,甚至可以描绘出你的长相。
这款由麻省理工学院(MIT)所打造出来的AI,研究人员用一个由数百万个影片剪辑而成的数据集,对一个名为Speech2Face的神经网络模型进行自我训练,而这款网络的运作大概分成两部分,一个是语音编码器,主要负责对输入的语音来进行分析,并预测出相关的脸部特征;另一个则是脸部解码器,主要对输入的脸部特征来进行整合并产生图像。从最终结果来看,仅用了6秒,就能靠着声音来还原人脸,效果上是令人满意的。
该研究团队表示,他们的目的并非为了准确还原说话者的模样,Speech2Face模型主要是为了研究语音与相貌之间的关联性。目前Speech2Face已经可以识别出性别,而对于白种人与亚洲人也能轻易分辨,在年纪部分从30、40、70岁的年龄段声音命中率会比较高一点。
除了基础的性别、年纪与种族外,Speech2Face还可以猜中一些脸部特征,像是鼻子结构、嘴唇厚度与形状、咬合等情况,也可以猜出大概的脸部骨架,基本上声音输入的时间越长,这款AI的准确率就越高;不过研究人员也坦言,AI的听觉也会有错,这款AI会将尚未经历变声期的小男生当作女性、对说话者的口音也会有判断错误的时候、甚至搞错年龄等。研究人员表示,Speech2Face之所以会有局限性,部分原因是因为数据集中的说话者,本身种族多样性不够丰富,所以让它在辨认不同种族人士声音这样的能力上是比较弱的。
不过也有人认为这项技术背后所隐藏的隐私与歧视等问题,令人担忧;他们认为虽然这是纯粹的学术调查,但脸部信息的潜在敏感性,是有必要进一步讨论当中的道德因素,应该要对此进行严谨的技术测试,并确保实际数据可以代表预期中的用户群。
相关文章
- 天翼云息壤2500万Tokens免费送,打通国产AI落地“最后一公里”
- “码”上有礼!仅需1元!跟随联通元景即刻解锁GLM-5,畅享AI编程新体验
- IBM推出AI智能体驱动的FlashSystem全闪存产品组合,开启“自主存储”新时代
- 查体智能辅助诊疗系统PC版正式发布暨AI中医应用示范医院挂牌
- AI问答正在取代搜索,品牌曝光逻辑彻底变了,软文街GEO帮你抢占新入口
- 爆火Elys + 声网对话式AI引擎,把社交交给AI赛博分身
- 陪伴机器人塞满马年购物车,涂鸦智能打造“AI新年货”
- 艾利特机器人发布“Elite PAI”具身智能大模型,定义工业场景的“有效智能”
- 思博伦通信推出首款面向网络测试与保障的Agentic AI解决方案
- AI中医可视化,把脉是否雷同心电图,看舌头可否归为影像学
- 中昊芯英“刹那®”TPU AI芯片Day0适配智谱GLM-5
- 五载同行!LED+AI+XR,揭秘2026春晚视觉幕后的“洲明力量”
- 500万用户追捧!百度地图岳云鹏文心AI副驾对话破亿,春节互动数据亮眼
- 安徽电信携手华为打造5G-A x AI大上行样板,助力合肥骆岗公园大型无人机灯光秀精彩呈现
- 白龙马变身文心AI副驾?岳云鹏携手百度地图上天津春晚,送出2亿红包!
- 山东移动携手中兴通讯:AI主动治盲,打造地下停车场感知标杆
人工智能企业
更多>>人工智能硬件
更多>>人工智能产业
更多>>人工智能技术
更多>>- 云知声Unisound U1-OCR大模型发布!首个工业级文档智能基础大模型,开启OCR 3.0时代
- 基石智算上线 MiniMax M2.5,超强编程与智能体工具调用能力
- 昇腾原生支持,科学多模态大模型Intern-S1-Pro正式发布并开源
- 百度千帆深度研究Agent登顶权威评测榜单DeepResearch Bench
- 在MoltBot/ClawdBot,火山方舟模型服务助力开发者畅享模型自由
- 教程 | OpenCode调用基石智算大模型,AI 编程效率翻倍
- 全国首个!上海上线规划资源AI大模型,商汤大装置让城市治理“更聪明”
- 昇思人工智能框架峰会 | 昇思MindSpore MoE模型性能优化方案,提升训练性能15%+









