美图的大模型已升级了视频生成功能,并正在逐步应用于美图秀秀、Wink、MOKI等产品中。
编辑日期:2024年09月24日
已支持1分钟、24FPS帧率、1080P分辨率的超长视频生成
9月23日,美图公司宣布其美图奇想大模型(MiracleVision)的视频生成能力已完成全面升级。此次升级不仅提升了生成能力和效率,还优化了模型性能。结合美图在计算机视觉领域的多项自主研发技术,视频生成在时长、画质、流畅性、真实性和可信度等方面均有显著提升。
目前,美图奇想大模型(MiracleVision)单次文本生成视频和图片生成视频的时长均为5秒,已支持生成长达1分钟、帧率24FPS、分辨率1080P的超长视频,并可输出任意视频尺寸。
基于美图公司在影像领域的长期积累,全新升级的美图奇想大模型(MiracleVision)结合了广泛的特征提取技术,实现了艺术风格、细腻画风和细节把控的高度平衡,并针对人像、动漫、国潮和商业设计等领域进行了优化,具备强大的风格泛化能力和兼具艺术审美的视觉表现力。此外,基于复杂的3D时空精准重构技术,视频生成能够重现真实的物理规律,支持大幅度流畅运动。
美图奇想大模型(MiracleVision)于2023年6月上线,2024年1月通过国家备案,并于2024年6月迭代至V5版本,采用结合Diffusion与Transformer模型的全新技术路线,采用DiT视频生成架构。
在这一新的技术路线下,美图奇想大模型(MiracleVision)相较于业界领先者,选择了优先攻克更具挑战性的问题。此次升级在技术层面上解决了主体一致性、运动连贯性和物理逻辑合理性等视频生成能力落地的核心问题。
目前,美图旗下的MiracleVision大模型已在其部分产品中启用了全新的视频生成功能。由于其高度模块化的可复用性,这一升级的优势将逐渐扩展到包括美图秀秀、美颜相机、Wink、开拍、美图设计室、WHEE、MOKI等一系列产品中,从而进一步增强美图在视频工具领域的应用深度和广度。
作为美图AI生态系统的核心,MiracleVision大模型一直坚持根据用户的具体需求来推动技术的研发,力求在用户体验和技术进步之间找到最佳平衡点。此次升级后,MiracleVision的架构得到了进一步优化和完善,从AI图像处理、AI视频生成以及AI设计三个方向全面支撑美图AI生态系统的丰富性和先进性,有效提升了用户体验和工作效率,并且加强了美图在电商、广告、游戏、动画及影视等领域的实际应用。
表情、动作、神情全都在线
“足以与Gen-2媲美”
CEO展示四段视频
国产大模型实践应用加速落地
太鬼畜了!
高质量描述,让视频生成质量更佳