Phi-3.5-vision-instruct:开源多模态模型
更新时间:2024-08-23 08:36:22
Phi-3.5-vision-instruct是一种轻量级、 state-of-the-art 的开源多模态模型,适用于文本和视觉任务。该模型基于 Phi-3 模型家族,具有 128K 的上下文长度,可以支持多种任务。
Phi-3.5-vision-instruct 可以用于广泛的商业和研究用途,包括但不限于:记忆/计算约束环境、延迟绑定场景、通用图像理解、光学字符识别、图表和表格理解、多图像比较、多图像或视频摘要。
暂无信息
Microsoft
暂无信息
暂无信息