Data Engineer в ЛИАН

IT-направление

@datajobschannel 02.07.2026 13:29 Рекрутер: @yanggilla

Вакансия: Data Engineer Аутстафф проект Компания: ЛИАН Занятость: фулл тайм Локация: весь мир ЗП: от 240 до 350 тыс Оформление: ИП (по СЗ при совместительстве) Грейд: middle+ и выше **Чем предстоит заниматься:** 1) Проектировать, внедрять и сопровождать пайплайны обработки информации и системы управления данными, построенные на платформе Databricks (с использованием Unity Catalog, Delta Lake и Workflows). 2) Проводить детальное исследование, профилирование и очистку наборов данных с целью их распределения по бизнес-доменам и выявления сведений, относящихся к персональным данным (PII). 3) Участвовать в создании архитектуры разграничения доступа к данным, уделяя внимание договорённостям о структуре данных (data contracts), управлению правами в каталоге, а также автоматизированному предоставлению и отзыву привилегий через подход «инфраструктура как код» на базе Terraform. 4) Взаимодействовать с командой для рецензирования и подтверждения того, что разработанные схемы доступа и контракты данных являются производительными, адаптируемыми и пригодными для многократного применения. 5) Обеспечивать корректный запуск продуктов обработки данных и механизмов контроля доступа в строгом соответствии с утверждёнными контрактами, исключая любые нежелательные побочные эффекты. 6) Готовить и актуализировать развёрнутую документацию, охватывающую контракты на данные, модели доступа и общие регламенты управления информационными активами. 7) Отслеживать работу развёрнутых пайплайнов и выполнять проверки качества данных, чтобы гарантировать их соответствие заданным показателям надёжности, скорости и точности. 8) Активно изучать существующие внутренние наработки и искать готовые решения, способствующие повторному использованию компонентов и унификации подходов в рамках общей платформы данных. ** Наши пожелания к кандидатам:** 1) Более 3 лет опыта работы в области проектирования данных; 2) Опыт работы с Python и широко используемых фреймворков для обработки данных (например, Spark/PySpark для потоковой, пакетной и асинхронной обработки данных); 3) Практический опыт работы с Unity Catalog и Delta Lake; 4) Опыт автоматизации развертывания объектов Databricks через Terraform (создание кластеров, заданий, секретов, управления доступом — не только инфраструктура, но и конфигурация сервисов); 5) Умение оптимизировать производительность Spark-задач (настройка партицирования, кэширования, выбор форматов, борьба с перекосом данных); 6) Опыт работы с потоковой обработкой (структурированный стриминг Spark, обработка событий); 7) Глубокие фундаментальные знания в области моделирования данных, распределенной обработки данных, SQL и архитектуры хранилищ/озерных баз данных; 8) Обязательным требованием является практический опыт развертывания облачных платформ и инфраструктуры данных (Databricks, GCP или AWS) с использованием Terraform, а также готовность к изучению новых технологий для целей интеграции; 9) Опыт внедрения CI/CD для кода обработки данных (автоматические тесты, линтинг, развертывание через Git-репозитории, интеграция с Jenkins/GitLab CI). 10) Способность проектировать решения для доступа к данным и управления данными, используя устоявшиеся шаблоны проектирования и различные инструменты проектирования; 11) Четкое понимание бизнес-ценности предоставляемых продуктов данных и механизмов управления; 12) Опыт разработки программного обеспечения. 13) Английский от B1 Для отклика писать в личные сообщения @yanggilla Прикрепляйте сразу CV

Похожие вакансии

После первого сообщения

Не теряйте контекст по этой вакансии: сначала отправьте короткий отклик, затем через 3–5 дней сделайте follow-up, если ответа не было.