最新推荐
AI文字
AI工具
AI教程
AI绘画
AI插件
AI音乐
数字人
行业报告
计算机视觉
ViPer
ViPer是由EPFL-VILAB开发的Hugging Face空间项目,专注于视觉处理和分析。它提供了先进的图像处理功能,可能包括物体检测、图像分割或其他计算机视觉任务。
ViPer
Hugging Face
EPFL-VILAB
RapidOCR
RapidOCR是一个快速、多语言支持的开源OCR工具包,基于ONNXRuntime推理引擎,支持多平台离线部署,速度比PaddleOCR快4-5倍。
OCR
文字识别
深度学习
Masked Generative Video-to-Audio Transformers
MaskVAT是一种创新的视频到音频生成模型,通过结合高质量音频编解码器和序列到序列的masked生成模型,实现了高音质、语义匹配和时间同步性的平衡。
视频到音频生成
音频同步
深度学习
Live Portrait Monitor
Live Portrait Monitor 是一个基于 GitHub 项目的实时肖像动画工具,可以将静态图像转换为生动的视频肖像,支持网络摄像头和显示器输入。
实时肖像
动画生成
深度学习
VGGSfM
VGGSfM是一种创新的深度结构运动恢复方法,通过端到端训练实现全可微分的SfM流程。它利用深度2D点跟踪、同时相机恢复和可微分光束平差层,在多个数据集上达到了最先进的性能。
结构运动恢复
深度学习
计算机视觉
UbiOps
UbiOps是一个AI基础设施平台,提供快速部署和管理AI/ML工作负载的能力,无需复杂的DevOps操作。它支持LLM、计算机视觉等AI模型的高效部署和扩展。
AI基础设施
模型部署
MLOps
MASA
MASA 计算机视觉目标跟踪 优质新品 MASA是一个用于视频帧中对象匹配的先进模型,它能够处理复
MASA
目标跟踪
计算机视觉
CoreNet 深度学习神经网络
CoreNet 深度学习神经网络 CoreNet 是一个深度神经网络工具包,使研究人员和工程师能够
CoreNet
深度学习
神经网络
JavaVision 人工智能计算机视觉
JavaVision 人工智能计算机视觉 优质新品 JavaVision是一个基于Java开发的全
JavaVision
人工智能
计算机视觉
LiarLiar.ai 实时虚假检测技术
LiarLiar.ai 是一项突破性的 AI 虚假检测技术,将心理学方法与先进的计算机视觉相结合,旨
LiarLiar.ai
虚假检测
计算机视觉