职位名称
数据工程师
单位名称
中电金信数字科技集团股份有限公司
招聘人数
2
任职要求
1. 2026届硕士研究生学历,具备扎实的机器学习(深度学习、强化学习)理论知识; 2. 熟悉常用的深度学习算法(CNN、LSTM、Transformer等)架构及原理; 3. 熟悉linux系统,能够熟练应用python编程、调用及封装,掌握PyTorch或TensorFlow开发框架; 4. 熟悉视觉、深度、位置等传感器特性; 5. 具备良好的语言表达、团队协作、文档撰写等能力,为人正派、工作踏实认真。 加分项: 1、有软件工程领域有相关项目经历优先; 2、有Palantir 本体论有相关的研究与项目经历优先; 3、有AIAgent 团队协作和工作经历优先。
岗位职责
1、负责增强服务领域训练LLM需要的大量领域数据,并通过数据学习与治理技术提升数据质量,通过自动化手段加速SFT数据构建,通过构建自动化数据质量评估、筛选机制、数据预测,解决数据质量评估与筛选难度大等问题; 2、主导领域数据收集、生成,包括预训练数据、微调数据、强化学习数据等多个方向,同时对生成数据多样性、复杂性、逻辑性负责,构建多人设融合、领域理解能力领域数据生成技术; 3、负责多模态数据解析,在文档多模态、语音、图像等多个数据模态实现数据高质量解析,为知识库构建提供数据; 4、从事AI4Data关键技术研究,包括基于LLM的新型数据工具链、数据分析Agent等,突破大模型数据应用中的关键技术。构建基于AI的存储和计算性能优化技术,包括但不限于参数自动调优、学习型索引、预测性IO等。