职位描述
岗位描述:1、负责AI中台核心算法体系建设,制定平台级算法规划与发展路线,涵盖大模型蒸馏、压缩、加速、NL2Code、行业微调、在线评估、模型适配等方向。
2、牵头智能标注、多模态模型微调、强化学习等模块的算法设计和落地,形成统一的算法服务框架。
3、推进大模型在垂类业务(如问答、多轮对话、图谱生成、文生图等)中的轻量化适配,优化低资源环境下的训推效率与效果。
4、参与构建高性能分布式训推体系,熟练使用开源大模型训练工具(如DeepSpeed、Megatron、vllm等)提升大模型在国产化服务器中训练、推理性能与资源利用率。
5、关注大模型技术前沿,组织前沿论文复现、新范式验证(如LoRA、MoE、GRPO等),形成沉淀与对外影响力。
- 岗位必需要求:
1. 35周岁以内,极其优秀者可放开年龄。
2. 全日制本科以上学历,5年以上AI算法或平台算法相关经验,具备大小模型算法产品落地经验。
3. 有过硬的Pytorch、TensorFlow、MindSpore等编程基础,熟悉主流模型调优策略、迁移学习技巧。
4. 熟悉大语言模型或多模态模型的核心训练范式,具备参数高效微调(LORA)、强化学习(如GRPO)、知识注入等实际经验。
5. 有强大的技术架构力或领导力,能带领虚/实线团队攻克技术难题,打造业界TOP级的技术竞争力。
6. 做过类似机器学习平台项目(诸如阿里云PAI、华为ModelArts、腾讯TI平台)优先
- 岗位加分项:
1. 主导过CV、语音、NLP、推荐系统、智能搜索、用户画像和知识图谱构建类项目优先。
2. 有大模型训练优化、行业模型微调、跨模态模型训练、评测体系构建等算法平台经验者优先。
3. 带领过20人以上技术团队且主导研发过知名(百度可搜)的AI类产品优先
4. 有2年以上互联网大厂类似部门的专家级(诸如阿里P7、腾讯T10、字节3-1)经历的优先。