Steiner-preview是一个创新的推理模型系列,旨在通过合成数据和强化学习技术,探索多种推理路径。这些模型在推理过程中能够自我验证和回溯,从而实现对隐式搜索树的线性遍历,展现出独特的推理能力。
使用Steiner-preview非常简单,只需在推理请求中添加两个参数:“skip_special_tokens”设为false和“spaces_between_special_tokens”设为false。这样就能无缝接入现有的推理服务,便于开发者快速上手。
Steiner-preview目前为开源项目,无需额外费用即可使用,适合研究和开发者进行探索与实验。
Yichao Ji
Twitter:@peakji,Instagram:@peakji