中国科学院自动化研究所强化学习运动控制算法工程师(J10514)中国科学院自动化研究所招聘信息事业单位岗位详情-粉笔职位库

- 熟练掌握 C++/Python 语言，具备高质量代码编写能力。 - 具备扎实的强化学习基础，熟悉在线和离线强化学习算法，如PPO、SAC等，熟练掌握一般强化学习技术，如域随机化、课程学习、奖励设置等。 - 在模型调参、奖励函数优化方面具备实践经验，有在人形机器人上进行训练和实机部署经验。 - 熟悉常用的模拟环境，如 MuJoCo、Isaac Gym/Isaac Sim等。加分项资质： - 有将模拟环境中学到的策略迁移到机器人硬件上的经验。 - 有为四足或双足机器人训练移动策略的经验。 - 有开发并部署双足机器人移动和 / 或操作算法并在机器人相关会议RSS、ICRA、IROS发表论文。