Diffusion Dreams for Atari
更新时间:2024-05-25 11:30:16
NVIDIA Project GR00T 人工智能机器人 NVIDIA Project GR00T
LeRobot 机器学习强化学习 LeRobot 是一个旨在降低进入机器人领域的门槛,让每个人都能
RL4VLM 强化学习视觉-语言模型 RL4VLM是一个开源项目,旨在通过强化学习微调大型视觉-语
Nemotron-4-340B-Reward AI大型语言模型 Nemotron-4-340B-R
O1-CODER是一个旨在复制OpenAI O1模型的项目,专注于编程任务,通过强化学习和蒙特卡洛树搜索提升代码生成效率和逻辑性。
Unitree RL GYM是一个基于Unitree机器人的强化学习示例,支持多种机器人模型,包括Go2、H1、H1_2和G1,适合研究和开发者使用。
PRIME是一个可扩展的强化学习解决方案,旨在提升大型语言模型的高级推理能力,通过隐式奖励模型实现高效的奖励建模与强化学习。
RL Logging Board 是一款专为强化学习从人类反馈(RLHF)训练过程设计的可视化工具,旨在帮助用户深入理解训练动态并简化调试过程。