职位描述
主要职责:
1.负责公司相关平台 7×24 小时不间断监控与应急响应,保障公司技术系统及相关基础平台的稳定运行;
2.对各基础平台(Zabbix、视频质量分析系统、CDN监控、阿里云、上海IPTV各平台现网)进行监控,及时发现平台运行异常;
3.针对监控中出现的告警事件,***时间反馈至二线技术团队,协助开展故障排查工作,对告警事件进行全流程跟踪,确保闭环管理;
4.参与公司相关系统、平台割接的验证工作,完成割接升级后的功能、性能验证,并及时反馈验证结果;
5.7×24 小时处理运营商转派的报障工单,响应运营商拨测群的反馈问题,快速定位并修复相关故障,保障用户体验;
6.IPTV和OTT节目应急运营工作,包含节目修复、节目单修正等运营工作支撑;
7.清晰准确地记录值班期间的所有操作步骤、现象分析、处理结果及相关数据,并每日形成值班报告,确保运维数据可追溯;
有高度的运维责任心,快速发现、及时处置,上报响应故障;
任职资格:
1.熟悉Linux系统并能使用常用命令,能进行基本的系统配置、日志查看与分析,了解数据库与存储的基本工作原理。
2.扎实掌握 IP 地址、子网掩码、路由、NAT、DNS 解析等基础网络概念,熟练使用 ping、traceroute、telnet 等常见网络工具进行网络故障诊断。
3.了解 IPTV/OTT 平台的基本架构、运行流程及节目分发逻辑,具备相关平台运维保障的实操能力。
4.熟练使用 Zabbix 等监控工具,能够理解监控指标含义,快速识别异常告警信息。
5.具备基本的故障分析与定位能力,能够配合二线团队开展故障排查,执行基础的故障处置操作。
有良好的团队精神和责任意识、积极主动、乐于接受挑战、能承受工作压力;有良好沟通协调能力。