在每个主体生成过程中的特征不会发生混淆的同时消除合成痕迹。
网科技讯(作者/戴雨欣) 2月19日,据媒体报道,OpenAI发布人工智能模型Sora,其能够通过文本提示生成逼真且富有想象力的视频,“文生视频”引发广泛讨论。
天眼查App显示,近日,清华大学申请的“一种定制化多主体文生视频方法、装置、设备及介质”专利公布。摘要显示,该申请涉及神经网络技术领域,基于第一损失、第二损失与第三损失对文生视频模型的参数进行优化,使优化的模型基于文本描述生成视频中的图像时,文本描述与定制化主体保持一致,且在每个主体生成过程中的特征不会发生混淆的同时消除合成痕迹。
图源 天眼查
图源 天眼查
此外,度小满科技(北京)有限公司也于2023年8月申请“文生视频生成方法、装置、电子设备及可读存储介质”专利,该申请已于同年11月公布,其能够以极低的资源实现任意长度长视频的生成。
图源 天眼查
图源 天眼查