职位名称
强化学习运动控制算法工程师(J10514)
任职要求
- 熟练掌握 C++/Python 语言,具备高质量代码编写能力。
- 具备扎实的强化学习基础,熟悉在线和离线强化学习算法,如PPO、SAC等,熟练掌握一般强化学习技术,如域随机化、课程学习、奖励设置等。
- 在模型调参、奖励函数优化方面具备实践经验,有在人形机器人上进行训练和实机部署经验。
- 熟悉常用的模拟环境,如 MuJoCo、Isaac Gym/Isaac Sim等。
加分项资质:
- 有将模拟环境中学到的策略迁移到机器人硬件上的经验。
- 有为四足或双足机器人训练移动策略的经验。
- 有开发并部署双足机器人移动和 / 或操作算法并在机器人相关会议RSS、ICRA、IROS发表论文。