Переход из аналитика в Data Engineer — частый карьерный шаг 2025-2026. Зарплаты DE на 30-60% выше (Mid DE 250-400K vs Mid Analyst 150-250K в РФ). Технологически — гораздо ближе чем «аналитик → ML инженер».
Этот roadmap основан на реальных кейсах перехода (Avito, Yandex, OZON, T-Bank). Я разбираю что учить, в каком порядке, и что НЕ нужно учить (мифы, которые задерживают).
Кто такой DE и чем отличается от аналитика
Аналитик — отвечает на бизнес-вопрос «почему упала выручка». Пишет SQL, делает дашборды, считает A/B.
Data Engineer — строит инфраструктуру, которая аналитика обслуживает: ETL pipelines, data warehouse, оркестрация, мониторинг качества данных.
| Что делает Analyst | Что делает DE |
|---|---|
| SQL запросы для отчётов | ETL pipelines (Airflow, dbt) |
| BI дашборды | DWH архитектура (схемы, partitioning) |
| A/B тесты | Streaming (Kafka, Flink, Debezium) |
| Презентации | Data quality (Great Expectations, dbt tests) |
| Метрики продукта | Schema evolution + миграции |
Общее: SQL, Python, понимание метрик. Главное отличие: DE мыслит системами, аналитик — отчётами.
Шаг 1: оцени свой baseline (неделя 1)
Прежде чем учиться — пойми что уже знаешь.
Сильные стороны аналитика (готовая база для DE):
- ✅ Сложный SQL (CTE, window, join optimization)
- ✅ Python для data manipulation (pandas, numpy)
- ✅ Бизнес-понимание (что такое NRR, retention, funnel)
- ✅ Git, code review, базовая работа в Linux
Чего у аналитика обычно НЕ хватает:
- ❌ Опыт оркестрации (Airflow, Prefect, Dagster)
- ❌ Data modeling (Kimball star schema, SCD types)
- ❌ Streaming / event-driven архитектура (Kafka)
- ❌ Большие данные (Spark, distributed compute)
- ❌ DWH-специфика (partitioning, clustering, materialized views)
- ❌ CI/CD pipelines
Шаг 2: roadmap 4 месяца
Месяц 1: SQL углубление + dbt (2-3 часа в день)
Цель: твой SQL должен быть на уровне Mid DE. Не «select * from», а explain plan reading, индексы, partitioning.
- Window functions в полную силу (LAG/LEAD/FIRST_VALUE/cumulative)
- EXPLAIN ANALYZE для PostgreSQL (см. гайд по EXPLAIN)
- Индексы (B-tree/GIN/BRIN — см. гайд по индексам)
- dbt: models / sources / refs / tests / snapshots (см. гайд по dbt macros)
- Materialized views (PG + CH)
Практика: подними локально PostgreSQL 16 + dbt-core. Сделай pet-project — ETL для open data (например, NYC Taxi или GitHub events).
Месяц 2: Airflow + Data Modeling
Цель: понимать оркестрацию и проектировать DWH.
- Airflow: DAG, operators, sensors, XCom, dynamic task mapping
- Idempotency: что значит «можно перезапустить таск без последствий»
- Kimball: star schema, fact/dim, SCD types 1-6 (см. гайд по dbt Snapshots SCD2)
- Data quality: GE / dbt tests / soda
Практика: добавь Airflow в pet-project. Schedule ETL по cron. Implement SCD Type 2 для одной dim-таблицы.
Месяц 3: streaming + Spark
Цель: понимать event-driven архитектуру и distributed compute.
- Kafka: producer/consumer, partitions, offsets, exactly-once
- Schema Registry (Avro / Protobuf)
- CDC (Change Data Capture) — Debezium / Apache Hudi
- Spark: RDD vs DataFrame, partitioning, broadcast joins, AQE
- pandas → PySpark переход (см. pandas vs polars гайд)
Практика: Kafka в Docker. Шли events из pet-project через Kafka, consume в Spark. Сложно — но именно это спросят.
Месяц 4: Cloud + DevOps + portfolio
Цель: production-ready навыки.
- AWS S3 / GCP / Yandex Cloud Storage
- Iceberg / Delta Lake / Hudi (см. Iceberg vs Delta гайд)
- Docker + docker-compose
- CI/CD: GitHub Actions / GitLab CI для dbt
- Terraform basics (опционально)
- Monitoring: Grafana + Prometheus
Практика: deploy pet-project в Yandex Cloud / AWS. Напиши README. Закоммить в GitHub — это твой portfolio для собеседований.
Шаг 3: переписать резюме
Аналитики ставят в первую строку «ad-hoc reports». Для DE-собеса это смерть. Перепиши acomplishments через infrastructure.
Было (Analyst tone):
«Сделал дашборд с retention по cohort'ам, помог продукт-команде принять решение»
Стало (DE tone):
«Спроектировал ETL pipeline в Airflow для cohort-retention (24 модели, 8 источников, daily refresh, SLA 99.7%)»
Подробнее про резюме — в нашем гайде по резюме аналитика 2026, но для DE-резюме акцент:
- DAG-ов сколько ты дизайнил
- Volume данных (TB / billion rows)
- Latency / throughput SLA
- Tech stack: Airflow + dbt + Snowflake / BigQuery / ClickHouse
- Failures: что упало, как чинил, что подкрутил
Шаг 4: к каким собесам готовиться
DE-собес отличается от аналитического. Структура (4-5 туров):
- Скрининг HR — мотивация перехода (важно, спросят)
- Tech interview 1: SQL + Python (LeetCode-style + DE-сценарии)
- Tech interview 2: Data modeling + ETL дизайн (live coding system design)
- Tech interview 3: Airflow / dbt / Spark deep dive (если в стэке)
- Final / hiring manager: behavioral + culture fit
Типичные DE-вопросы (не палю — это публичные):
- «Спроектируй ETL для аналитики e-commerce с 100M events/day. SLA 4 часа»
- «Разница между Snowflake и Kimball schema. Когда что выбрать»
- «Как ты реализуешь idempotent ingestion если source может присылать дубли»
- «SCD Type 2 — расскажи как ты пишешь dbt snapshot»
- «Kafka + Spark Streaming vs Flink — когда что»
Тренируйся на AI-интервью с DE-режимом, или прогоняй с друзьями. Системный дизайн нужно проговаривать вслух — это половина оценки.
Шаг 5: зарплатная вилка 2026 (РФ)
По данным Levels.fyi / hh.ru / Avito Tech Radar 2026:
| Грейд | Зарплата (₽/мес net) |
|---|---|
| Junior DE | 120-200K |
| Middle DE | 250-400K |
| Senior DE | 400-650K |
| Staff/Lead DE | 600-1200K |
Премии за стек: Spark / Kafka / streaming опыт — +30-50K к ML-вилке. Знание Iceberg / Hudi — +50K (рынок дефицита). Snowflake / BigQuery — +30K.
Подробнее про зарплаты — в нашем гайде по зарплате DE 2026.
Подводные камни перехода
Грабли 1: учить всё подряд
Spark + Flink + Beam одновременно — слишком много. Выбери один стек. Скорее всего у твоей будущей компании это Airflow + dbt + Snowflake/CH. Спарк нужен — но не первым.
Грабли 2: фокус на cert вместо проектов
AWS DE Cert — хорошо для резюме, но GitHub с pet-project'ом перевешивает любой cert. Без pet-project на DE-собесе нет о чём говорить.
Грабли 3: игнорировать DevOps
DE сидит на стыке data + infra. Если ты вообще не знаешь Docker / CI/CD — твой потолок «Junior DE» в команде где DevOps делает кто-то ещё. Для Mid+ — Docker обязателен.
Грабли 4: переход без понимания мотивации
«Хочу больше денег» — плохой ответ HR. Хороший: «Меня больше интересуют инфраструктурные задачи. Понял после X конкретной ситуации в продукте, что мне не хватает Y».
Частые вопросы
Сколько реально займёт переход?
С 4-месячным фокусом + 2-3 часа/день — 4-5 месяцев до Junior DE оффера. До Middle DE — 8-12 месяцев. Это в среднем по моим знакомым и кейсам Habr.
Нужно ли мне ML / MLOps?
Нет. DE и MLE — разные роли. MLE — отдельный карьерный трек. Можно перейти позже из DE → MLE если интересно ML.
Нужно ли мне переходить на Java / Scala?
99% DE-команд в РФ работают на Python (+ SQL). Scala нужен только если хочешь в команду где Spark на Scala (Avito, Yandex Lavka). Это редкость.
Что если меня не хотят брать без DE-опыта?
Сделай internal transfer: подойди к DE-команде в твоей текущей компании. Это самый частый и работающий путь. Compensation сначала не вырастет, но через 6-12 мес ты уже Middle DE на рынке.
Стоит ли идти в Junior DE если я уже Middle Analyst?
Только если стэк сильно отличается. Иначе — переход «Middle Analyst → Junior DE» с пониженной зарплатой 6 месяцев, потом восстановление + бонус. Это нормальный путь.
Что дальше
Если хочешь практику — попробуй SQL-тренажёр с автопроверкой (5 задач бесплатно). DE-собес начинается с SQL — там настоящий PostgreSQL 16, можно проверять EXPLAIN, индексы, оптимизацию.
Готов к собеседованиям? AI-интервью задаёт реальные DE-вопросы (system design, ETL дизайн, SQL deep dive), оценивает структурированность ответа. В Pro — безлимит мок-собесов + 491 SQL-задача + 612 тестовых заданий + 35+ блог-постов по dbt/Airflow/ClickHouse.
Смежные посты
- Зарплата Data Engineer 2026
- dbt для аналитика — первые шаги
- Airflow DAG patterns для аналитика
- Зарплата аналитика данных 2026
- Как пройти собеседование аналитика
Сравнить Free и Pro → (1999₽/мес, экономит часы рутины)
Источники
- Avito Tech Radar 2026 (avito.tech)
- Levels.fyi RU 2026: Data Engineer вилки
- hh.ru: «Data Engineer Москва 2026» (aggregate)
- Habr/T-Bank: «Переход аналитик → DE» (case studies)
- Yandex Practicum: «DE bootcamp curriculum»