职位描述
岗位职责及目标:
1.研究实现AGI的关键能力,通过技术愿景驱动研究工作,负责大语言模型和多模态大模型的训练和优化(包括预规划、后训练等)长期课题的研究,提升大语言模型的能力,并在广泛业务场景中产生价值;
2.负责LLM训练相关的工作,包括后预训练、Instruction Tuning以及强化学习等;
3.深入参与数据及评估体系建设、大规模训练、指令微调、偏好对齐、模型优化等关键工作;
4.探索大模型底层技术突破,深入大模型基础架构前沿研究(如MoE、注意力机制、x等),探索新型架构和技术创新。
任职要求
1.扎实的机器学习、NLP、RL基础和出色的创新能力,在ACL/EMNLP/NAACL/NeurIPS/ICML/ICLR等顶级会议上发表论文者优先;
2.在预训练、后训练、强化学习方向有深刻研究;
3.优秀的代码能力、数据结构和基础算法功底,熟练C/C 或Python,ACM/ICPC、NOI/IOI、Top Coder、Kaggle等比赛获奖者优先;
4.在大模型领域、RL相关领域,主导过大影响力的项目或论文者优先;
5.对技术充满热情,主动了解前沿技术,并对行业发展有一定的见解。
符合京东价值观:客户为先、创新、拼搏、担当、感恩、诚信。