工具介绍:文本到音频扩散模型
更新时间:2024-05-28 10:08:16
MOTIA 视频处理内容外延画 MOTIA是一个基于测试时适应的扩散方法,利用源视频内的内在内容和
Make-Your-Anchor 视频生成扩散模型 Make-Your-Anchor是一个基于扩散
Diffusion-RWKV 扩散模型RWKV Diffusion-RWKV是一种基于RWKV架构
DIAMOND 机器学习强化学习 DIAMOND(DIffusion As a Model Of
MuLan 多语言图像生成 MuLan是一个开源的多语言扩散模型,旨在为超过110种语言提供无需额
AsyncDiff 分布式计算文本到图像 AsyncDiff 是一种用于并行化扩散模型的异步去噪加
DiffusionKit是一个用于在Apple Silicon上运行扩散模型的工具包,支持Core ML和MLX。
MarDini是一种新型视频生成模型,结合了掩码自回归和扩散模型的优势,支持多种视频生成任务,如视频插值、图像转视频和视频扩展,具有灵活性、可扩展性和高效性。