职位描述
职位描述:
1. 负责GPU算力集群调度与优化方案的设计、开发与落地,持续提升GPU算力集群利用率与易用性;
2. 负责GPU集群日常管理、运维。
3. 协助负责GPU集群的总体规划与建设;
4. 协助负责GPU算力销售的技术支持工作。
职位要求:
1. 计算机相关学科专业,基本功扎实,2( )年工作经验;
2. 在GPU算力/ 超算行业有过技术主管以上的工作经验;
3. 熟悉Linux平台,熟悉Python,熟悉K8S,docker;
4. 有集群特别是GPU集群的调度管理、优化经验者优先;
5. 有深度学习实际使用优化经验者优先;
6. 善于发现问题,有体系化思维,责任意识强,团队沟通协作能力强。