震撼发布:Meta的Movie Gen引领媒体生成新时代!
🎬✨ Meta推出了Movie Gen,一套革命性的基础模型,能够生成高质量1080p视频,支持不同的宽高比和同步音频。更令人惊叹的是,它具备根据用户图像进行个性化视频生成和精准指令编辑的能力。
这套模型在多个任务上达到了新的高度:文本到视频合成、视频个性化、视频编辑、视频到音频生成,以及文本到音频生成。我们最大的模型拥有30B参数,能处理长达73K的视频令牌,相当于每秒16帧下生成16秒的视频。
我们的技术创新涵盖了架构简化、潜在空间优化、训练目标调整、数据策划、评估协议、并行化技术和推理优化。这些进步让我们在扩大预训练数据和模型规模方面取得了显著成效。
我们希望这一研究能推动媒体生成模型领域的进步与创新。了解更多请访问: https://t.co/fi0au2WfIU 📈🚀
发布时间:2024年10月4日 