hackquest logo

资深运维工程师

L

LINKEXPAND DIGITAL TRADING LIMITED

5 - 7K USD
Full-time
Remote

岗位职责

一、基础设施与服务器运维(核心职责)

  • 负责公司服务器集群的架构设计、搭建、优化(OCI / AWS)。
  • 管理 Linux 服务器、系统环境、用户权限、SSH 密钥、SFTP、Firewall、Security Group。
  • 负责 Nginx、SSL、反向代理、域名、证书管理,维护高可用与安全。
  • 维护虚拟机、负载均衡(LB)、对象存储、VPC/VCN 网络、子网、安全组策略。
  • 处理生产环境问题:端口占用、权限错误、服务无法启动、磁盘满、网络异常等。


二、CI/CD 与发布部署管理

  • 设计、搭建、维护 CI/CD 流水线(GitHub Actions / GitLab CI / Jenkins)。
  • 编写并维护部署脚本、自动化构建脚本、环境变量管理、版本发布流程。
  • 负责测试 / UAT / 生产环境的部署策略、回滚策略、蓝绿发布 / 灰度发布。
  • 配合研发团队进行日常发布、紧急修复、配置管理。


三、系统稳定性与可用性(SRE 方向)

  • 建立应用监控体系(Prometheus、Grafana、ELK、CloudWatch)。
  • 负责报警系统建设:CPU/Memory/Disk、服务异常、接口异常。
  • 负责 SLA、SLO、SLI 制定与落地,提高系统稳定性。
  • 定期进行容量规划、性能优化、系统压测。


四、安全与权限管理

  • 管理服务器账号、云平台账户、Git 仓库权限、Jira/Wiki 系统权限。
  • 搭建/维护堡垒机(Jump Server/Bastion),执行最小权限原则。
  • 编写安全基线策略,定期进行补丁升级、漏洞扫描、安全巡检。
  • 配合安全/风控团队处理安全事件(暴力破解、异常流量、服务漏洞等)。


五、数据库与中间件维护

  • 维护 MySQL / PostgreSQL / Redis / Kafka 等服务的部署、备份、主从配置。
  • 数据库性能调优、慢 SQL 分析、连接池优化。
  • 落实备份策略、自动备份、异地容灾、定期恢复演练。


六、文档与资产管理

  • 维护服务器台账、域名证书台账、权限列表。
  • 编写并维护运维文档:部署说明、上线流程、安全策略、架构图。
  • 管理运维资产:服务器规格、监控面板、密钥、环境配置、网络拓扑图。


七、团队与流程建设

  • 负责运维团队日常管理与培养。
  • 推动生产变更流程、上线制度、权限管理制度、灾备制度落地。
  • 跨团队协调研发、后端、DBA、安全团队,处理紧急故障。


任职要求

  • 精通 Linux 系统管理、Shell 脚本、网络基础(三层/四层/七层)。
  • 熟悉云平台运维:OCI / AWS。
  • 熟练掌握 Nginx、SSL、反向代理、Keepalived、负载均衡。
  • 熟悉 Docker/Kubernetes(至少 Docker + Compose 必须熟练)。
  • 熟悉 CI/CD 流水线(GitHub Actions / GitLab CI / Jenkins)。
  • 精通 MySQL 基础、主从复制、备份恢复、性能优化。
  • 熟悉 Redis、Kafka、RabbitMQ 等至少一种常用中间件。
  • 具备监控系统搭建经验:Prometheus / Grafana / ELK / Loki。


加分项

  • 强逻辑能力与快速排查能力,能独立处理线上事故。
  • 有完整的运维体系思维:监控、报警、安全、权限、流程。
  • 良好的文档能力,能梳理资产表、网络拓扑、流程制度。
  • 强沟通与跨团队协同能力。
  • 有金融、交易所、区块链行业运维经验。
  • 熟悉高并发、高可用架构设计。