A lightweight, CPU-efficient real-time avatar that syncs mouth movements to audio inputs.
更新时间:2025-03-02 19:00:02
Lite-avatar是一个高效的实时2D聊天头像模型,通过音频输入实现面部动作的同步,能够在仅使用CPU的设备上以30fps的速度运行,无需GPU加速。该模型使用了先进的自动语音识别(ASR)技术,能够提取音频特征并生成与之同步的口型动作,适合用于实时视频互动、社交平台等场景。
使用Lite-avatar非常简单。首先,确保你的设备满足Python 3.10及CUDA 11.8版本要求。安装相关依赖后,只需通过命令行运行`python lite_avatar.py`并提供相应的音频文件路径,就可以生成同步口型的2D视频结果。用户还可以通过交互式演示进行实时视频聊天体验。
Lite-avatar是一个开源项目,代码托管在GitHub上,采用MIT许可证,完全免费使用。
HumanAIGC
Email: [email protected]
社交媒体:Twitter:@HumanAIGC,Instagram:@HumanAIGC