Mini-Gemini是由香港中文大学终身教授贾佳亚团队开发的多模态模型,具备精准的图像理解能力和高质量的训练数据。该模型结合图像推理和生成,提供不同规模的版本,性能与GPT-4和DALLE3相媲美。Mini-Gemini采用Gemini的视觉双分支信息挖掘方法和SDXL技术,通过卷积网络编码图像并利用Attention机制挖掘信息,同时结合LLM生成文本链接两个模型。
['精准的图像理解能力', '高质量的训练数据', '多模态输入处理', '图像生成能力', '性能与GPT-4和DALLE3相媲美']
['结合图像推理和生成技术', '提供不同规模版本满足不同需求', '采用Gemini的视觉双分支信息挖掘方法和SDXL技术', '利用Attention机制挖掘信息']
['面包制作过程指导', '电脑图片参数对比', '根据图片内容生成毛线小熊图片']
['高分辨率图像处理', '根据文本提示生成图像', '图像内容分析与对比']
[]