职位描述
岗位职责:
1. 负责大模型的强化微调、蒸馏等算法开发、参数调整,结合强化学习技术,对预训练模型进行微调,提升模型在特定领域的性能。
2、针对业务需求,研究并实现先进的算法,提升模型的性能和效率;
3、跟进AI领域的最新研究动态,不断探索和创新,为公司的技术发展提供支持;
4、负责大规模数据、多模态处理,包括数据清洗、特征工程、数据增强等,构建高质量、多模态数据集,为模型训练提供可靠的数据支持;
5、参与大模型相关项目的开发与实施,确保项目顺利进行;
6、与团队合作,参与模型部署和上线,确保模型在实际应用中的稳定性和可扩展性;
7、编写技术文档,为团队提供算法支持和培训;
8、参与AI项目的需求分析、方案设计和技术评审。
任职要求:
1、硕士及以上学历,计算机科学、人工智能等相关专业,具备3年以上AI算法开发经验;
2、熟悉深度学习框架,如TensorFlow、PyTorch、Keras等,了解分布式训练框架deepspeed并有实际项目经验;
3、 掌握机器学习、深度学习的基本理论和常用算法,能够独立完成模型的设计和优化;
4、具备良好的编程能力,熟练掌握Python、C 等编程语言;
5、有大规模数据处理和优化经验,熟悉分布式计算框架,如Spark、Hadoop等;
6、大型AI模型的设计、开发、训练和优化,包括但不限于深度学习、自然语言处理、计算机视觉等领域;
7、具备良好的团队合作精神和沟通能力,能够承担一定的工作压力。
优先条件:
1、具备较强的科研能力,有在***会议或期刊发表过论文者优先;
2、有以下领域经验者优先:大模型训练、模型压缩与加速、跨模态学习等;
3、具备较强的创新意识和学习能力,能够快速适应新技术和新场景。