Apollo是一个创新的视频理解大规模多模态模型(LMM)系列,旨在深入探讨视频理解的机制。通过系统分析视频-LMM的设计空间,我们揭示了影响模型性能的关键因素,并提出了一系列可操作的优化建议。Apollo不仅为视频理解领域提供了新视角,还通过引入“缩放一致性”原则,显著降低了计算成本。
使用Apollo模型,用户可以通过配置不同的视频采样策略、训练时间表和数据组合,来优化模型的表现。Apollo的设计使得用户能够在较小的模型和数据集上进行有效的实验,进而将这些经验迁移到更大规模的模型中。
Apollo的定价信息尚未公开,具体价格将根据不同的使用需求而定。
Apollo由Meta GenAI及斯坦福大学的研究团队共同开发。
如需了解更多信息,请联系:[email protected]
社交媒体:Twitter:@apollo_lmms,Instagram:@apollo_lmms