Ищу SRE себе в команду. в Aleria LLC

DevOps Engineer

@devops_jobs 01.07.2026 12:07 Рекрутер: @aleria_infra

Ищу SRE себе в команду. Формат: удаленно(2 месяца испытательного), **обязателен релок после 2 месяцев в Абу Даби** Занятость: full-time Локация: Абу Даби Вилка: 5500-6.000$ remote, 8.000-8200$ onsite Компания: Aleria LLC Контакт: @aleria_infra ** Site Reliability Engineer** Aleria — компания из Абу-Даби, разрабатывающая AI-продукты для клиентов в ОАЭ и по всему миру. Небольшая команда, быстрый рост. Работаем на bare metal, без облака. Нужен инженер, который понимает каждый слой — от NIC до Kubernetes pod — и отвечает за то, чтобы всё это работало стабильно под нагрузкой и не падало посреди ночи. **Чем предстоит заниматься:** Обеспечивать надёжность и доступность сервисов на bare metal с Kubernetes поверх железа Строить и поддерживать observability (Prometheus, Grafana, Loki): метрики, дашборды, алерты, SLO/SLI Реагировать на инциденты, проводить post-mortem и устранять причины, а не симптомы Тюнить PostgreSQL и другие БД под продакшен-нагрузку, искать боттлнеки Поддерживать CI/CD (GHES, ArgoCD), снижать время и риск деплоев Сетевая инфраструктура: маршрутизация, сегментация, балансировка нагрузки, безопасность On-premise и air-gapped поставки (~10%) Capacity planning и работа над снижением toil Безопасность, которая не тормозит команду Взаимодействие с командой разработки и инженерами клиентов **Требования:** Глубокий опыт bare metal — без облачных абстракций Понимание внутреннего устройства Kubernetes, а не только манифестов Опыт устранения продакшен-инцидентов под давлением, умение быстро находить root cause Тюнинг БД под нагрузкой (приоритет — PostgreSQL) Опыт построения observability и систем алертинга с нуля Опыт on-prem и air-gapped развёртываний Сети: L2/L3, routing, firewall, VPN Продакшен Linux troubleshooting Подход security-mindset с балансом на скорость доставки Высокая автономность при работе с незнакомым стеком Видение инфраструктуры за пределами текущей задачи Английский B2+ **Будет плюсом:** Опыт с GPU-кластерами для AI Ceph/ZFS/распределённые хранилища Опыт hardening/compliance для гос. заказчиков Air-gap CI/CD **Не ищем:** YAML-инженеров, которые только применяют готовые манифесты. Нужен человек, который понимает, что происходит под капотом — и готов первым встать ночью, если что-то упало.

Похожие вакансии

После первого сообщения

Не теряйте контекст по этой вакансии: сначала отправьте короткий отклик, затем через 3–5 дней сделайте follow-up, если ответа не было.