hackquest logo

高级开发运维工程师

B

bossjob Web3 Agent

7 - 8.5K USD
Full-time
吉隆坡. 马来西亚吉隆坡
LinuxGitCI/CD

运维专家 / 运维负责人(SRE/DevOps Lead)


岗位职责

一、基础设施与服务器运维(核心职责)

负责公司服务器集群的架构设计、搭建、优化(OCI / AWS)。

管理 Linux 服务器、系统环境、用户权限、SSH 密钥、SFTP、Firewall、Security Group。

负责 Nginx、SSL、反向代理、域名、证书管理,维护高可用与安全。

维护虚拟机、负载均衡(LB)、对象存储、VPC/VCN 网络、子网、安全组策略。

处理生产环境问题:端口占用、权限错误、服务无法启动、磁盘满、网络异常等。


二、CI/CD 与发布部署管理

设计、搭建、维护 CI/CD 流水线(GitHub Actions / GitLab CI / Jenkins)。

编写并维护部署脚本、自动化构建脚本、环境变量管理、版本发布流程。

负责测试 / UAT / 生产环境的部署策略、回滚策略、蓝绿发布 / 灰度发布。

配合研发团队进行日常发布、紧急修复、配置管理。


三、系统稳定性与可用性(SRE 方向)

建立应用监控体系(Prometheus、Grafana、ELK、CloudWatch)。

负责报警系统建设:CPU/Memory/Disk、服务异常、接口异常。

负责 SLA、SLO、SLI 制定与落地,提高系统稳定性。

定期进行容量规划、性能优化、系统压测。


四、安全与权限管理

管理服务器账号、云平台账户、Git 仓库权限、Jira/Wiki 系统权限。

搭建/维护堡垒机(Jump Server/Bastion),执行最小权限原则。

编写安全基线策略,定期进行补丁升级、漏洞扫描、安全巡检。

配合安全/风控团队处理安全事件(暴力破解、异常流量、服务漏洞等)。


五、数据库与中间件维护

维护 MySQL / PostgreSQL / Redis / Kafka 等服务的部署、备份、主从配置。

数据库性能调优、慢 SQL 分析、连接池优化。

落实备份策略、自动备份、异地容灾、定期恢复演练。


六、文档与资产管理

维护服务器台账、域名证书台账、权限列表。

编写并维护运维文档:部署说明、上线流程、安全策略、架构图。

管理运维资产:服务器规格、监控面板、密钥、环境配置、网络拓扑图。


七、团队与流程建设

负责运维团队日常管理与培养。

推动生产变更流程、上线制度、权限管理制度、灾备制度落地。

跨团队协调研发、后端、DBA、安全团队,处理紧急故障。


任职要求

精通 Linux 系统管理、Shell 脚本、网络基础(三层/四层/七层)。

熟悉云平台运维:OCI / AWS。

熟练掌握 Nginx、SSL、反向代理、Keepalived、负载均衡。

熟悉 Docker/Kubernetes(至少 Docker + Compose 必须熟练)。

熟悉 CI/CD 流水线(GitHub Actions / GitLab CI / Jenkins)。

精通 MySQL 基础、主从复制、备份恢复、性能优化。

熟悉 Redis、Kafka、RabbitMQ 等至少一种常用中间件。

具备监控系统搭建经验:Prometheus / Grafana / ELK / Loki。


加分项

强逻辑能力与快速排查能力,能独立处理线上事故。

有完整的运维体系思维:监控、报警、安全、权限、流程。

良好的文档能力,能梳理资产表、网络拓扑、流程制度。

强沟通与跨团队协同能力。

有金融、交易所、区块链行业运维经验。

熟悉高并发、高可用架构设计。