Git Personal Project 开源项目分类 人工智能 大模型 企业应用 科学研究 AI写开源项目 孵化优质开源项目 AI工具集合-AI导航

字节-强化学习大模型-critic-rl

香港大学和字节发表论文:通过强化学习教授语言模型进行批判