飞搜侠

1、大规模参数与高效处理 · 2、非对称设计与模态融合 · 3、单一语言模型编码提示.

可以直接在本地进行部署，而且对本地配置的要求并不高，只需要16G 显存就可以生成视频。再来说效果，CogVideoX 应该是听雨用过的最好的开源AI 文生视频大模型了。好了，话不 ...

Pyramid Flow 是由北京大学、北京邮电大学以及快手科技的研究人员共同合作开发的。这款视频生成器具有许多独特的优势。它采用了一种新的技术，通过单个AI 模型分阶段生成 ...

可灵AI——快手旗下的视频生成大模型，它在短时间内迅速迭代升级。在本周，推出了最新的1.5版本！ 1.5版本在图像质量、 ...

继2周前推出成本直降46% 的Sora 训练推理复现流程后，Colossal-Al 团队全面开源全球首个类Sora 架构视频生成模型[Open-Sora 1.0，涵盖了整个训练流程，包括数据处理、所有训练 ...

Mochi 是一种基于Asymmetric Diffusion Transformer（AsymmDiT）架构的视频生成模型，该模型有100 亿个参数，应该是目前公开发布的规模最大的开源视频生成模型了。

Stable Video Diffusion是Stability AI 于2023 年11 月21 日发布的视频生成式大模型，一种用于高分辨率、先进的文本到视频和图像到视频生成的潜在视频扩散模型。

Runway发布了Gen-2模型，使用户仅需通过文本提示、图片或其他视频即可轻松生成完整视频。 Pika和Pika 1.0. 在首次发布时，Pika吸引 ...

Mochi 1 在视频生成领域带来了多项重要的进步。它具有高保真的运动效果和强大的指令遵循能力，能够根据用户详细的指令精确控制生成视频中的角色、场景和动作。这使得用户 ...

Sora是text-to-video模型（可能是 ; Datawhale x 魔搭社区(阿里巴巴达摩院模型开源社区modelscope)联合组织Sora原理与技术实战 ; Sora技术路径详解，并针对Sora原理中的核心 ...