职位描述
KEY ACCOUNTIBILITIES:
独立处理复杂虚拟化/云平台工单及故障。主导虚拟化平台事件的分析、诊断与恢复。
主动监控虚拟化/云平台性能与资源利用率,分析瓶颈。实施平台配置优化与性能调优。
独立设计、规划并实施中等复杂度虚拟化/云平台变更(如集群维护、存储迁移、网络配置)。编写/评审变更方案与操作文档。
维护并更新关键虚拟化/云平台技术文档与架构图。分享平台运维经验与实践。
有效协调跨团队资源解决虚拟化/云平台问题。指导初级工程师工作。
参与虚拟化/云平台架构设计与评审,提供优化建议。
开发/应用脚本工具提升平台运维效率。
REQUIREMENTS:
相关工作经验:具备5年及以上IT基础架构运维、虚拟化平台、云平台或相关领域的工作经验,有大型企业或复杂环境下的实际运维和项目管理经验者优先。
IT服务管理经验:具备5年以上IT服务管理经验,熟练使用ServiceNow或类似ITSM平台进行工单处理、流程跟踪、服务请求、变更管理、问题管理等日常运维工作;深入理解并实践ITIL框架,能够根据ITIL实践优化服务流程、提升服务质量,具备跨部门协作和复杂用户需求处理经验。
虚拟化技术:精通Hyper-V和/或VMware vSphere平台的架构设计与集群部署,具备Hyper-V集群、VMware集群(HA/DRS/FT等)的搭建、维护与故障排查经验,能够进行虚拟机资源池管理、容量规划、性能调优和数据保护。
精通超融合架构(如Nutanix、VMware vSAN等),能够进行超融合集群的部署、管理和优化,具备存储虚拟化、分布式存储和高可用性设计能力。
自动化运维能力:熟练掌握自动化运维工具和脚本(如Ansible、PowerShell、Python、Terraform等),能够实现虚拟化、云平台及运维流程的自动化,提升运维效率和系统稳定性;有CI/CD流程设计与实施经验者优先。
公有云与混合云架构:具备阿里云、微软Azure等主流公有云平台的架构设计、资源部署和运维经验,能够进行云上网络、计算、存储、数据库等服务的规划与优化;熟悉混合云/多云环境的集成与管理,具备云平台自动化运维和成本优化能力。
自动化运维能力:熟练掌握自动化运维工具和脚本(如Ansible、PowerShell、Python、Terraform等),能够实现虚拟化、云平台及运维流程的自动化,提升运维效率和系统稳定性;
具备严谨的工作态度和极强的责任心,能够主动识别和推动问题闭环,具备较强的服务意识和团队协作能力。
拥有优秀的技术文档编写能力,能够输出规范化方案、流程和操作文档;具备良好的跨部门沟通、培训和技术分享能力,能够引导并提升团队整体水平。
对新技术、新工具有强烈的敏锐度和学习能力,能够主动研究并推动新技术在团队中的落地与应用,具备技术规划和创新能力。