人工智能图像识别
更新时间:2024-05-09 13:48:43
idefics-80b AI多模态 HuggingFaceM4/idefics-80b-instr
CLIP Interrogator 图像分析图像描述 Clip Interrogator是一个使用
Image Describer is a cutting-edge AI tool that uti
Florence-2-large 视觉模型多任务学习 Florence-2-large是由微软开发
HunyuanCaptioner 图像描述文本生成 优质新品 HunyuanCaptioner是一
MMStar 视觉语言模型基准测试 MMStar是一个旨在评估大型视觉语言模型多模态能力的基准测试
MiniGemini 多模态视觉语言模型 Mini-Gemini是一个多模态视觉语言模型,支持从2
VILA 视觉语言模型视频理解 VILA是一个预训练的视觉语言模型(VLM),它通过大规模的交错图