职位名称
大模型算法工程师
任职要求
【岗位要求】 1. 熟悉PyTorch框架及分布式训练技术。 2. 对大模型训练/推理技术,如Transformer架构、KV Cache管理、模型量化、编译优化等有一定了解。 3. 具备扎实的代码能力,能独立完成模块设计与性能调优。 4. 自驱力强,对技术有极致追求,能快速复现论文方案并解决工程难题。 【加分项】 1. 深入理解Attention及Transformer变体架构(RetNet/Mamba/NSA等)。 2. 具备修改Megatron-LM/vLLM等训练/推理框架源码的实际经验。 3. 具备大模型窗口长度扩展实战经验,如4k→32k工程适配等 。 4. 具备智能体系统开发经验。 5. 具备大型开源项目开发经验。