最新推荐
AI文字
AI工具
MCP Servers
AI教程
AI绘画
AI插件
AI音乐
数字人
行业报告
多模态
Mini-Omni
Mini-Omni是一款开源的多模态大型语言模型,具备实时语音输入和流媒体音频输出的对话能力,能够在思考的同时进行听觉和语言交流。
多模态
大型语言模型
实时语音输入
EMMA
Tencent EMMA 图像生成多模态 优质新品 EMMA是一个基于最前沿的文本到图像扩散模型E
EMMA
图像生成
多模态
Video-MME
Video-MME 多模态视频分析 Video-MME是一个专注于多模态大型语言模型(MLLMs)
Video-MME
视频分析
MLLMs