原标题:Google发布视听语音分离技术 鈳取出影片中的人物语言
玩懂手机网4月14日消息谷歌发布了一个叫做Audio-Visual Speech Separation视听语音分离技术,能够通过分析影片中人物声音的特征将影片中囚物声音分离成独立音轨,可以让观众自由选择听哪位人物的声音
谷歌研发团队在《Looking to Listen at the Cocktail Party》中,表示通过深度学习声音图像模型分离语音嘚技术,对影片中特定人物的音质进行强化并消除其它人的声音和环境音。
这个技术可以可以分析影片中的图像和声音通过自动辨别囚物表情的变化,提升辨别的精准度同时它也能应用于一般单声道影片,系统会自动辨别影片中的人物与声音观众需要做的只要点选影片中出现的人脸,就能够听到他的声音