职位描述
岗位职责:
1.研发基于多模态大模型(VLM、VLA、LMM)的场景理解、VQA与任务规划算法。
2.实现大模型对机器人动作序列生成与底层控制的端到端影响,探索World Model的应用。
3.构建与优化具身智能大模型的微调与提示词框架,利用仿真与真实世界数据进行迭代。
4.推动算法在仿真(如Isaac Gym) 与实物平台上的部署与性能调优,解决Sim2Real鸿沟。
岗位要求:
1.硕士及以上学历,具备扎实的深度学习、Transformer架构及多模态建模理论基础。
2.精通PyTorch,拥有大语言模型或多模态大模型的微调或应用开发经验。
3.熟悉机器人学基础(运动学、动力学)及ROS框架。
4.在以下一个或多个领域有深入研究:视觉语言模型、机器人操作、模仿学习、强化学习。