Data Scientist (NLP|LLM) в бер

Data Scientist / ML Engineer

@job_python 19.05.2026 13:00 Рекрутер: @job_python

**Data Scientist (NLP|LLM)** #гибрид #middle Москва **Компания**: СберЗдоровье **☑️Что будешь делать?** -Проектировать и поддерживать полный цикл улучшения медицинских LLM: сбор, очистка, версионирование данных, обучение и дообучение (SFT, preference-tuning, DPO/ORPO, instruction tuning). -Строить датасеты и контуры разметки: схемы и гайдлайны, контроль согласованности, генерация синтетических данных, self-training, анализ ошибок и bias. -Разрабатывать LLM-based пайплайны и агентов для медицинских задач: RAG по клиническим рекомендациям и справочникам, tool-calling, маршрутизация, multi-step workflows, оркестрация (LangGraph и мультиагентные фреймворки), guardrails. -Создавать и развивать систему оценивания: тест-наборы и бенчмарки, автоматические метрики и LLM-as-a-judge там, где уместно, экспертная валидация с врачами, red-teaming, регрессионные прогоны, A/B тестирование в проде. -Проводить исследовательские итерации: формулировать гипотезы, ставить эксперименты, делать ablation-исследования, документировать результаты, готовить научные статьи и доводить материалы до публикации. ☑️**Необходимые технические навыки:** -3+ лет в NLP/ML, уверенный Python: типизация, тестирование, профилирование, аккуратный продакшн-код. -Практический опыт обучения и дообучения трансформеров: PyTorch + HuggingFace, понимание Accelerate, DeepSpeed или аналогов. -Опыт построения data-pipelines и воспроизводимых экспериментов: датасеты, версии, конфиги, трекинг (MLflow или ClearML), умение делать корректные сравнения. -Понимание LLM-систем: retrieval, tool-calling, агенты, деградации качества, галлюцинации, ограничения продакшна. -Навыки оценки качества: метрики, бенчмарки, error analysis, ablations, работа с разметкой и экспертной валидацией. ☑️**Будет плюсом** -Опыт в медицине или биомеде: клинические тексты, ICD-10, клин. рекомендации, понимание доменных рисков. -Опыт alignment: preference data, RLHF, DPO, safety eval, hallucination mitigation. -Практика продакшн-инференса: vLLM, оптимизация стоимости и задержки, Docker, K8s, мониторинг, трассировка. -Опыт с retrieval-стеком: hybrid search, rerankers, FAISS, Elastic, pgvector, продуманноеchunking, grounding. ☑️**Что мы можем предложить:** -Сильную команду профессионалов, увлеченных своим делом; -Возможность развития в команде ведущей MedTech-компании России; -Уютный офис в Сити с панорамным видом на город, гибридный формат работы; -Корпоративную технику; -Медицинскую программу, включающую телемедицинские консультации, очные приёмы в клиниках, психологов, стоматологию, лабораторные и инструментальные диагностики; -Оплачиваемые курсы английского языка; -Поддерживаем активный образ жизни — выбирай виды спорта по душе (корпоративные занятия сквошем, бегом, футболом в Москве и компенсация твоего спортивного абонемента); -СберУниверситет и оплату профильного обучения и курсов. **Контакты**: [email protected] **Python Job** 💬 [в Telegram](https://t.me/job_python) | 💙 [в VK](https://vk.com/job_python) | 💬 [в Max](https://max.ru/job_python)

🔒 Войти и сделать отклик Если не ответят: follow-up

Data Scientist (NLP|LLM) в бер

Похожие вакансии

После первого сообщения