最新推荐
AI文字
AI工具
MCP Servers
AI教程
AI绘画
AI插件
AI音乐
数字人
行业报告
音频同步
Masked Generative Video-to-Audio Transformers
MaskVAT是一种创新的视频到音频生成模型,通过结合高质量音频编解码器和序列到序列的masked生成模型,实现了高音质、语义匹配和时间同步性的平衡。
视频到音频生成
音频同步
深度学习