Mistral-Nemo-Base-2407是一个由Mistral AI和NVIDIA联合开发的大型语言模型(LLM)。它拥有120亿参数,经过预训练可以生成文本。这个模型的独特之处在于它的性能显著优于同等规模或更小的现有模型。它采用了128k的上下文窗口进行训练,这意味着它可以处理更长的输入文本。另一个亮点是它在多语言和代码数据上进行了大比例的训练,使其在这些领域具有出色的能力。
使用Mistral-Nemo-Base-2407有多种方式。最推荐的方法是通过mistral-inference库。首先需要安装该库,然后从Hugging Face下载模型文件。之后可以使用mistral-demo命令行工具进行演示。另外,也可以通过Hugging Face的transformers库来使用。只需几行代码就可以加载模型并生成文本。值得注意的是,与之前的Mistral模型不同,Mistral Nemo需要较小的温度设置,建议使用0.3的温度值。
Mistral-Nemo-Base-2407是一个开源模型,根据Apache 2许可证发布。这意味着它可以免费使用,但具体的商业使用条款可能需要查看许可证详情。
Mistral AI
暂无信息
Twitter: @MistralAI