飞搜侠

Mochi 是一种基于Asymmetric Diffusion Transformer（AsymmDiT）架构的视频生成模型，该模型有100 亿个参数，应该是目前公开发布的规模最大的开源视频生成模型了。

可以直接在本地进行部署，而且对本地配置的要求并不高，只需要16G 显存就可以生成视频。再来说效果，CogVideoX 应该是听雨用过的最好的开源AI 文生视频大模型了。好了，话不 ...

在视频生成领域，大多工作依赖于扩散模型，以从文本或图像条件中联合合成多个一致的帧。扩散模型通过学习从正态分布逐渐对样本进行去噪来实现迭代细化过程，并已成功应用于高 ...

可灵AI——快手旗下的视频生成大模型，它在短时间内迅速迭代升级。在本周，推出了最新的1.5版本！1.5版本在图像质量、美学表现、运动合理性以及语义理解方面都有显著提升。新 ...

Pyramid Flow 是由北京大学、北京邮电大学以及快手科技的研究人员共同合作开发的。这款视频生成器具有许多独特的优势。它采用了一种新的技术，通过单个AI 模型分阶段生成 ...

继2周前推出成本直降46% 的Sora 训练推理复现流程后，Colossal-Al 团队全面开源全球首个类Sora 架构视频生成模型[Open-Sora 1.0，涵盖了整个训练流程，包括数据处理、所有训练 ...

1、大规模参数与高效处理 · 2、非对称设计与模态融合 · 3、单一语言模型编码提示.

Stable Video Diffusion是Stability AI 于2023 年11 月21 日发布的视频生成式大模型，一种用于高分辨率、先进的文本到视频和图像到视频生成的潜在视频扩散模型。 SVD模型 ...

Stability AI推出了Stable Video Diffusion，这是一个具有里程碑意义的视频生成（generative video）模型，可在GitHub上开源访问。 ... Meta推出了Llama 2，这是其开源大语言模型( ...

与很多科技公司提供的视频生成器不同，Clapper 是一款开源AI 故事可视化工具，于一年前推出原型。它的设计目的并非取代传统视频编辑器，或使用3D 场景作为输入的现代AI 编辑器 ...