金融界2024年3月30日消息,据国家知识产权局公告,蔚来汽车科技(安徽)有限公司申请一项名为“说话人脸视频生成方法、计算机设备及存储介质“,公开号CN117789751A,申请日期为2023年12月。 专利摘要显示,本申请涉及计算机技术领域,具体提供一种说话人脸视频生成方法、计算机设备及存储介质,旨在解决现有方法生成的人脸视频质量较低的问题。为此目的,本申请的方法,包括:获取目标对象的初始图像帧,以及与待生成的说话人脸视频对应的音频数据和/或视频数据;基于音频数据和/或视频数据获取驱动信号,驱动信号包括头部位姿参数序列和面部表情参数序列;基于头部位姿参数序列和面部表情参数序列,以及初始图像帧生成目标图像帧序列;基于目标图像帧序列获得说话人脸视频。本申请将与音视频数据关联度不同的人脸参数分别处理,再基于处理结果生成目标图像帧序列,实现了对于说话人脸视频的人脸运动宏观控制和微观细节的补全。 |