职位描述
职位描述:
1. 参与基础大模型和端侧大模型的研发工作,包括架构设计、预训练、后训练等,端到端构建通用大模型;
2. 负责大模型高阶能力(Coding、Agent等)的专项提升,打造模型长版特性;
3. 持续关注大模型最新研究,探索下一代大模型的架构和训练方法,做出有影响力的成果;
职位要求:
1. 硕士及以上学历,计算机科学、人工智能等相关专业;
2. 熟悉深度学习框架(例如pytorch等),具备大模型和端侧大模型的算法开发经验,具备数据处理、模型架构设计、大规模训练等经验;
3. 对大模型架构、训练、数据、系统优化中的某一方面有深入理解,以下符合1条以上:
- 能够提出创新性的大模型架构和端侧大模型架构,探索技术的下一跳;
- 熟练掌握强化学习(RL)和模型微调(SFT)等后训练技术,并可以提出创新的后训练方法;
- 对coding、math、agent等大模型高阶能力有深入思考;
- 熟练掌握大模型预训练的Know How,可以快速诊断并修复问题,提升模型能力;
- 对预训练数据、后训练数据的生产、合成方法有深入理解;
- 熟练模型训练/推理的系统优化方法,提升模型的实际训练、推理性能;
4. 有大模型/端侧大模型架构、训练、数据、系统优化等相关实战经验者优先,在NeurIPS/ICML/ICLR/ACL/EMNLP/CVPR/ICCV/TPAMI等AI顶会发表过相关论文者优先;
公司介绍:
三星电子中国研究院是三星电子在华投资设立的具有独立法人资格的研发机构,是具备博士后工作站运营资质、聚集了600人研发团队,并由国家批准认定的软件企业。研究院专注于人工智能、5G/6G通信技术研究和标准化等前沿技术,也积极进行商用化的开发、推动先进技术在三星产品中的商用化落地,提升三星电子产品的竞争力。
新时代,新机遇。三星电子中国研究院希望把握人工智能、5G/6G与IoT技术发展的时代机遇,凝聚海内外计算机、电子及通信领域的优秀人才,坚守“做中国人民喜爱的企业,贡献于中国社会的企业”的承诺,与您一起携手共赢、创造未来! 真诚欢迎您的加入!
※ 请应聘者在应聘过程中对现公司、 前公司的商业秘密进行保密
※ 请应聘者确认您投递的简历不包含现公司、前公司的商业秘密