当前位置:首页>职位列表>职位详情
模型部署量化与加速工程师(感知方向)(J20076) 40000-70000元
上海闵行区 应届毕业生 本科
上海钧正网络科技有限公司 2026-02-23 01:40:34 26人关注
职位描述
岗位职责: 1.负责自动驾驶/智能驾驶相关感知模型(如OD、OCC、Lane、TFL、TFS、E2E等)和端到端模型的高效量化与加速,推动模型在嵌入式终端平台的上线落地; 2.参与模型从训练到推理的全流程优化,包括模型转换、量化、剪枝、蒸馏、加速等,提升模型推理效率和部署性能; 3.负责模型在NVIDIA Orin、NVIDIA Thor等芯片平台上的性能优化与落地,针对硬件特性进行模型结构适配与算子优化; 4.根据业务需求,进行CUDA、DSP等底层加速优化,实现高性能推理; 5.跟进主流感知模型(如BEVFusion、Sparse4D、Transformer结构、稀疏卷积等)的前沿部署方案,并推进落地; 6.负责编写相关量化、加速流程文档和工具脚本,支持自动化部署与性能回归测试。 任职要求: 1.计算机、自动化、电子工程等相关专业本科及以上学历,2年以上AI模型量化与加速经验; 2.熟练掌握Python、C/C 编程,具备扎实的代码能力,熟悉主流深度学习框架(如PyTorch/ONNX/TensorRT等); 3.熟悉模型量化、剪枝、蒸馏等模型压缩与加速方法,具备实际项目经验; 4.熟悉CUDA开发及性能优化,或具备DSP等异构计算平台的优化经验; 5.有BEVFusion、BevFormer,UniAD,Sparse4D等主流感知模型的量化部署经验者优先; 6.有Transformer结构(如ViT、Swin Transformer等)、稀疏卷积(Sparse Convolution)相关模型的量化及部署经验者优先; 7.有NVIDIA Orin、Thor、TI TDA4、J5/J6、高通等芯片的模型加速部署经验优先; 8.具备良好的性能分析与调优能力,能够针对资源受限平台进行模型裁剪和推理加速; 9.具备良好的沟通、团队协作与主动学习能力。 加分项: - 有实际量产项目部署经验,或参与过自动驾驶感知系统的端到端上线; - 熟悉异构计算(如FPGA、NPU等)、多芯片协同调度、模型自动化部署工具链; - 英语良好,能阅读、撰写技术文档。
联系方式
注:联系我时,请说是在今日招聘网上看到的。
工作地点
地址:上海闵行区上海-闵行区旭辉·莘庄中心-1号楼上海闵行区旭辉莘庄中心1号楼6层
以担保或任何理由索取财物,扣押证照,均涉嫌违法,请提高警惕

若您已有简历,可直接登录登录

  • 省份

    注:0表示面议
    获取验证码
    保存并投递
    投递简历
      马上投递
      投递简历
        马上投递

        企业
        服务热线

        • 400-6680-889
        1. 登录
        2. 注册
        客户服务热线:
        400-6680-889
        在线客服:
        点击这里给我发消息 898995850
        工作日:
        8:30-18:00