岗位需求
Ø 负责主导全生命周期行业大模型开发的技术领袖,兼具战略规划能力(技
术路线制定/风险预判)与实战经验(至少 1 个完整大模型项目闭环经
验),能带领团队突破技术瓶颈;
Ø 负责主导航天领域大模型开发,重点解决航天特色场景下的模型优化问
题。
专业要求:
u 5 年以上大模型架构设计相关经验,主导过千亿参数级模型从开发到形
成产品的全流程工作(需提供项目文档/论文/代码仓库等证明),精通
Transformer 架构优化;
u 精通分布式训练框架(Megatron/DeepSpeed),具备分布式训练与推理
优化经验(如混合精度训练、ZeRO 优化);
u 精通计算-通信平衡策略、MoE 架构在稀疏计算中的应用(如Google Switch Transformer 实战经验);
u 掌握 CoT 技术的落地方法,掌握 CoT 提示工程和训练方法;
u 具备知识图谱与大模型融合经验;
u 掌握多模态大模型(如 Qwen-VL、DeepSeek-V2)的微调策略;
u 成功应用过模型蒸馏技术,如用 GPT-4 生成仿真数据训练轻量化模型。