职位名称
GPU优化工程师(国际产品)
任职要求
1. 本科及以上学历,计算机、电子信息、软件工程等相关专业,3年以上GPU分布式训练或高性能计算相关工作经验。 2. 精通至少一种深度学习框架的分布式原理(如PyTorch DDP、Horovod),具备多节点GPU集群部署与调优实战经验。 3. 深入理解计算网络协议与架构(RDMA、TCP/IP、Infiniband),能独立完成网络性能测试、瓶颈定位及优化方案落地。 4. 熟练掌握C++/Python编程,熟悉Linux系统开发、Shell脚本,有容器化(Docker、K8s)部署分布式训练任务经验者优先。 5. 具备系统稳定性排查能力,能快速定位内存泄漏、网络丢包、节点宕机等问题,有大规模集群运维经验者加分。 6. 有大模型(千亿参数及以上)分布式训练优化、AI芯片(如A100/H100)性能调优经验者优先。