职位名称
算法工程师(NLP / LLM方向)
任职要求
1. 2026届计算机、人工智能、数学、统计学等相关专业,硕士及以上学历(优秀本科亦可);2. 扎实的数据结构与算法基础,熟悉常见机器学习算法(LR、SVM、GBDT、KMeans、CRF等)及其原理;3. 熟悉主流NLP模型与技术,如BERT、GPT、T5、LLaMA等,并具备模型微调或训练经验;4. 精通Python,熟悉PyTorch或TensorFlow框架及Hugging Face生态;5. 具备扎实的文本特征建模能力,熟悉embedding、attention、transformer结构、loss设计与优化技巧;6. 熟悉数据驱动的模型开发流程,能够独立进行样本分析、数据标注设计和模型评测;7. 良好的逻辑思维与分析能力,具备跨团队协作和问题解决能力。⸻加分项:• 有LLM大规模训练、分布式训练或模型蒸馏经验;• 掌握RAG、Agent框架、多模态模型(Vision-Language、Speech-Language)等前沿方向;• 熟悉ASR(Automatic Speech Recognition)模型的训练与微调,如Wav2Vec2、Whisper、Conformer等;• 熟悉TTS(Text-to-Speech)模型的训练与优化,如Tacotron、FastSpeech、VITS、CosyVoice等;• 具备语音与语言联合建模、Speech-LLM或语音理解生成类任务的研究经验;• 熟悉Prompt Engineering或对话式AI系统设计;• 在ACL、EMNLP、NeurIPS、ICLR等会议有论文或复现经验者优先。
岗位职责
1. 负责自然语言处理(NLP)相关算法的研究与优化,包括文本分类、意图识别、问答系统、命名实体识别、文本生成等方向;2. 参与大语言模型(LLM)的训练与微调,包括数据构建、指令微调(SFT)、RLHF、模型压缩与评测体系设计;3. 负责NLP基础算法的优化与落地,如分词、词向量、句向量、相似度计算、序列标注、文本匹配等;4. 设计与实现高质量的数据处理与算法流程,包括数据清洗、特征抽取、样本增强、标签一致性验证等;5. 基于业务需求,探索和验证算法在不同场景下的可行性与性能表现;6. 跟踪最新AI/NLP技术(Transformers、RAG、Distillation、LoRA、Prompt Tuning等),并推动模型在实际系统中的落地。