最新推荐
AI文字
AI工具
AI教程
AI绘画
AI插件
AI音乐
数字人
行业报告
扩散模型
Diffree
Diffree是一款创新的文本引导对象添加工具,基于扩散模型,无需人工干预即可在图像中无缝添加新对象。它通过OABench数据集训练,能准确预测新对象位置,保持背景一致性和空间适当性。
文本引导对象添加
扩散模型
图像编辑
Stable-Hair
Stable-Hair是一种创新的基于扩散模型的真实世界发型转换方法,能够稳健地转换各种复杂发型,同时保持原始身份内容和结构。该方法在各种具有挑战性的发型上展现出出色的性能。
发型转换
扩散模型
AI发型设计
Stable Audio Open
Stable Audio Open是一款先进的AI音频生成工具,可根据文本提示生成高质量的立体声音频。它结合了自动编码器、文本嵌入和扩散模型,能创造出长达47秒的音频内容。
AI音频生成
文本到音频
Stable Audio
Open-Sora-Plan
Open-Sora-Plan v1.2.0是一个开源的视频生成项目,采用3D全注意力架构,能更好地捕捉时空特征,提供了改进的视觉表示和视频生成架构。
视频生成
人工智能
开源项目
DiT-MoE
DiT-MoE是一种基于混合专家的扩展版扩散变换器模型,可扩展至160亿参数。它作为扩散变换器的稀疏版本,具有高度优化的推理能力,在保持与密集网络竞争力的同时实现了可扩展性。
扩散模型
混合专家
大规模预训练
Hallo
Hallo 图像动画扩散模型 Hallo是一个由复旦大学开发的肖像图像动画技术,它利用扩散模型生成
Hallo
肖像动画
扩散模型
ViViD
ViViD 视频试穿扩散模型 优质新品 ViViD是一个利用扩散模型进行视频虚拟试穿的新框架。它通
ViViD
扩散模型
视频试穿