Публикатор: Lex в Lex
DevOps Engineer
Публикатор: Lex Обсуждение: #opentowork #devops #sre #remote #резюме DevOps Engineer / SRE с сильным performance engineering background. Ищу remote-позицию в infrastructure / DevOps / SRE, где важны reliability, troubleshooting, observability и работа с production-нагрузкой. Формат: remote, full-time / contract Relocation: обсуждаемо Ожидания: от $3,000 Локация: Вьетнам / UTC+7 English: B2 5+ лет работаю с высоконагруженными распределёнными системами: ERP, микросервисы, Kubernetes / production-like окружения. Основной фокус — диагностика деградаций, bottleneck analysis, monitoring, stability и reliability. Стек: • Linux, Docker, Docker Compose, Kubernetes / k3s • CI/CD: GitLab CI, GitHub Actions, Jenkins, SSH-based deployment • GitOps: Argo CD, separate app/infra repo, GHCR image publishing • Observability: Prometheus, Grafana, logs, metrics, alerting • Git, Bash / Python automation • PostgreSQL, JVM, heap / GC / NMT, OOM, resource limits • Performance: Gatling / JMeter, p95/p99, RPS, throughput, saturation • Networking: TCP/IP, VPN, WireGuard / OpenVPN Практика и кейсы: • диагностировал деградации в микросервисных ERP-системах под нагрузкой: p95/p99, RPS, latency, saturation, CPU/memory, logs, traces • находил bottleneck’и на уровне сервисов, JVM/runtime, PostgreSQL, Kubernetes-ресурсов и внешних зависимостей • разбирал OOM, memory pressure, resource limits, JVM heap/GC/NMT и причины нестабильности сервисов • настраивал и дорабатывал Prometheus + Grafana monitoring для системных, сервисных и JVM-метрик • работал с Kubernetes troubleshooting: pod restarts, events, logs, requests/limits, deployments behavior under load • готовил технические отчёты и рекомендации для development / infrastructure команд • автоматизировал сбор диагностических данных и рутинные процессы через Bash / Python • развиваю personal DevOps lab: FastAPI/PostgreSQL сервис на k3s, Docker, CI/CD, GitOps через Argo CD, GHCR immutable image tags, Ingress, cert-manager TLS, Secrets, requests/limits, PreSync DB migrations, rollout/rollback • использую AI-инструменты для DevOps-рутины: runbook’и, документация, анализ логов, генерация проверок и автоматизация повторяемых задач Интересны команды, где нужно не просто “поддерживать инфраструктуру”, а разбираться в поведении систем, снижать деградации, улучшать observability и доводить сервисы до более стабильного production-ready состояния. CV / LinkedIn / GitHub отправлю в личку. Telegram: @LexY_w @DevOpsSRE_Jobs