职位描述
工作职责
1、负责设计、开发基于云原生的 AI 算力平台;
2、负责分布式资源/作业调度相关功能需求分析、设计及实现;
3、参与或负责基于Kubernetes的任务调度系统系统开发;
4、和开源社区以及业界同行互动,双向反馈进步。
职责要求
1、本科及以上学历,计算机相关专业背景;
2、熟练掌握Python、C 、Golang任一语言编程;
3、熟悉至少一种主流的机器学习框架(Tensorflow/Pytorch等),并在需要再实际具体项目(科研项目或者产业项目)中实现机器学习应用的经验;
4、有kubeflow/MLflow等MLOps框架的实际经验;
5、熟悉Docker和Kubernetes,有生产实践经验;
6、熟悉Linux系统原理,熟练使用Linux操作系统。
加分项
1、有云原生、AI产品、toB企业级软件开发经验者;
2、有大模型的微调、训练等具体经验;
3、在以上相关领域有开源社区经验者优先;
4、熟悉区块链原理或有相关开发经验。