瞬间将你的脸与明星脸融合,秒变明星的“换脸”技术;还能将声音特质保留下来,与歌星的合唱……智博会现场,搜狗的这些展示,吸引了大量观众前来体验。据悉,此次智博会上,搜狗首次全面展示多领域、九大AI科技成果,主打趣味又实用的AI黑科技,成为本届智博会最“吸睛”展台。
人脸迁移让人人都能七十二变
搜狗展台全场风头最盛的,当属搜狗“人脸迁移”体验区。观众只要选择自己喜欢的明星,镜头便会捕捉观众的人脸并与明星脸进行融合,生成专属观众的“明星脸”。
从娱乐圈顶级男神彭于晏,到宅男女神林志玲,到当红小花迪丽热巴,再到今夏爆火《延禧攻略》强势女主“魏璎珞”,秒变多位明星的“换脸”体验吸睛无数,引得众多参展者体验拍照围观。
当看到该技术除了“换脸”,还可以动态捕捉屏幕中的人脸,随人脸动作而随之变动后,体验者纷纷感叹“真是太厉害太神奇了”。
据了解,搜狗人脸迁移技术结合了人脸识别、三维人脸拟合、表情控制等多项前沿技术,能瞬间完成“换脸”体验,并可实现面部实时动态变化效果,跟随用户的脸部动作,完成多种表情、口型的变化。未来,该项技术还可以运用在直播、视频互动、影视制作以及教育等丰富场景中。
AI读唇术让科幻片场景成现实
除了人脸迁移技术,唇语识别技术体验区也是搜狗展台的一大热门。
现场观众只需对着大屏幕默声说出一句话,如古诗“长风破浪会有时,直挂云帆济沧海”,无需发出声音,机器就能通过面部识别和唇型特征读出对应的发音,识别其说话内容,并生成文字呈现于大屏幕。
这一互动,让在场观众亲身体验了一把“不发声,只动嘴,就知道你在说什么”的一大开挂技能。
唇语识别技术是一项集机器视觉与自然语言处理于一体的世界前沿技术。经过数千小时真实唇语数据训练,搜狗“唇语识别”系统在垂直场景命令集,如车载、家居等场景下已达到90%的识别准确率。可以预见,在残障教育和公共安全等不易捕捉语音、不易了解语义的情况下,唇语识别技术将大有作为。
“说”“唱”俱佳 AI语音合成再升级
随着如今语音技术的逐渐成熟,语音合成技术已较为常见,但这次的智博会上,搜狗带来了高定版的个性化语音合成。
搜狗语音合成技术通过少量数据即可生成该说话者的合成音色,现场观众可以体验到由几近真人的AI合成声音,如合成搜狗CEO王小川的声音来播报消息以及演唱歌曲。现场选择王小川的音色后,再匹配歌曲《蓝精灵之歌》,通过风格迁移技术,最终能生成王小川版《蓝精灵之歌》。这版歌曲中既包含了歌曲的曲调和节奏,也融入了王小川的声线及语言风格,生动有趣地呈现了搜狗语音合成和风格迁移技术。
据了解,搜狗基于深度神经网络的新一代合成引擎,目前已支持中英文、男女等二十多个音色的合成,而搜狗个性化语音合成技术仅使用个人10分钟左右的语音数据,即可训练生成具有该说话人特色的音色,合成效果处行业领先水平。
今年搜狗初次征战国际顶尖语音合成大赛——“Blizzard Challenge 2018 ”即斩获2项冠军,技术实力惊艳全球。
此外,搜狗还带了AI虚拟主播现场报道、AI+医疗、AI翻译硬件亲测等黑科技展示。
上游新闻记者 杨野 实习生 李家润 黎盛荣
【免责声明】上游新闻客户端未标有“来源:上游新闻-重庆晨报”或“上游新闻LOGO、水印的文字、图片、音频视频等稿件均为转载稿。如转载稿涉及版权等问题,请与上游新闻联系。