模型部署量化与加速工程师（感知方向）(J20076)招聘_闵行区模型部署量化与加速工程师（感知方向）(J20076)招聘

当前位置：首页>职位列表>职位详情

模型部署量化与加速工程师（感知方向）(J20076) 40000-70000元

上海闵行区

应届毕业生

本科

上海钧正网络科技有限公司

2026-02-23 01:40:34

26人关注

已申请立即申请收藏职位

职位描述

岗位职责： 1.负责自动驾驶/智能驾驶相关感知模型（如OD、OCC、Lane、TFL、TFS、E2E等）和端到端模型的高效量化与加速，推动模型在嵌入式终端平台的上线落地； 2.参与模型从训练到推理的全流程优化，包括模型转换、量化、剪枝、蒸馏、加速等，提升模型推理效率和部署性能； 3.负责模型在NVIDIA Orin、NVIDIA Thor等芯片平台上的性能优化与落地，针对硬件特性进行模型结构适配与算子优化； 4.根据业务需求，进行CUDA、DSP等底层加速优化，实现高性能推理； 5.跟进主流感知模型（如BEVFusion、Sparse4D、Transformer结构、稀疏卷积等）的前沿部署方案，并推进落地； 6.负责编写相关量化、加速流程文档和工具脚本，支持自动化部署与性能回归测试。任职要求： 1.计算机、自动化、电子工程等相关专业本科及以上学历，2年以上AI模型量化与加速经验； 2.熟练掌握Python、C/C 编程，具备扎实的代码能力，熟悉主流深度学习框架（如PyTorch/ONNX/TensorRT等）； 3.熟悉模型量化、剪枝、蒸馏等模型压缩与加速方法，具备实际项目经验； 4.熟悉CUDA开发及性能优化，或具备DSP等异构计算平台的优化经验； 5.有BEVFusion、BevFormer,UniAD，Sparse4D等主流感知模型的量化部署经验者优先； 6.有Transformer结构（如ViT、Swin Transformer等）、稀疏卷积（Sparse Convolution）相关模型的量化及部署经验者优先； 7.有NVIDIA Orin、Thor、TI TDA4、J5/J6、高通等芯片的模型加速部署经验优先； 8.具备良好的性能分析与调优能力，能够针对资源受限平台进行模型裁剪和推理加速； 9.具备良好的沟通、团队协作与主动学习能力。加分项： - 有实际量产项目部署经验，或参与过自动驾驶感知系统的端到端上线； - 熟悉异构计算（如FPGA、NPU等）、多芯片协同调度、模型自动化部署工具链； - 英语良好，能阅读、撰写技术文档。

联系方式

点击查看

注：联系我时，请说是在今日招聘网上看到的。