SRE工程师
L
LiquidityTech
3.5 - 6K USD
Full-time
上海陆家嘴中心, 中国上海市浦东新区塘桥浦东南路889号 邮政编码: 200127
云服务(AWS Azure GCP)监控工具(Prometheus Grafana)区块链
岗位职责 :
1. 参与建立统一变更流程,确保变更可灰度、可监控、可回滚,保障线上变更安全可控。
2. 开发并维护自动化部署、环境管理、监控工具;优化 CI/CD 流程,提高交付效率与稳定性。
3. 基于业务需求进行容量评估与扩缩容设计;管理并优化云资源(如 AWS、阿里云),保障业务 7x24h 稳定运行。
4. 熟悉系统架构,快速定位网络、权限、服务异常、部署等问题;制定并执行故障排查 SOP,推动问题及时恢复。
5. 主动发现系统风险,推动监控、告警、架构优化、演练等稳定性治理工作;构建可观测性体系,提高问题发现能力。
6. 参与日常 OnCall,快速响应及处理各类线上问题。
岗位要求 :
1. 计算机或相关专业,本科及以上学历。
2. 5 年以上 SRE、运维开发、平台工程或相关经验。
3. 熟悉 Linux、基础网络与系统排查。
4. 熟悉 Shell 脚本编写,至少掌握 Golang、Python、Java 中的一种,能够参与运维平台开发与维护。
5. 熟悉云平台(AWS 、阿里云等)、容器和 Kubernetes 基本原理及使用。
6. 对监控、日志、告警体系有实战经验(如 Prometheus / Grafana / Loki)。
7. 具备快速定位复杂问题的能力,能在高压场景下保持良好判断。
8. 有大规模分布式系统、高可用架构或自动化平台建设经验者优先。
9. 有 Terraform 等 IaC 工具使用经验者优先。