这个周末,科大讯飞1024开发者节科博展在安徽合肥奥体中心继续进行。其中,科技馆主题展馆里的“AI+虚拟人”展区人气爆棚。
在这里,雍正帝的画像能开口“说话”,头部运动姿态、说话口唇对齐度与几乎真人一致。天目新闻记者了解到,这是一种拟人图像语音驱动方案,用户只需要输入一张包含人脸的图片和一段语音,就能让图片里的人说出预设的文字。该方案将语音驱动、3D拟合、人脸变形算法深度结合,可以应用于个性化视频、表情包制作,或语音聊天、视频会议等场景。
在另一个展台,天目新闻记者还看到了SMART-TTS语音合成技术。这里已经有二十余种多情感、多音色、多风格的AI语音,满足不同场景下的音频内容生产需求,帮助人们构建多样的虚拟形象。
版权和免责申明
凡注有"浙江在线"或电头为"浙江在线"的稿件,均为浙江在线独家版权所有,未经许可不得转载或镜像;授权转载必须注明来源为"浙江在线",并保留"浙江在线"的电头。
标签:雍正;画像;AI责任编辑:江小来