**Данные:** events с разными event_type:
[см. код в задании]
**Задание:**
Построить **cohort retention table со step-level milestones**:
Для каждой когорты (week of signup):
- Cohort size
- % достигших activation (D1-D7)
- % достигших first_purchase (D7-D30)
- % churned (last activity > 30 дней назад)
- Average days to activation
- Average revenue per activated user
Используй `argMaxIf`, `countDistinctIf`, `avgIf` для multi-step aggregation в одном scan.
Структура для ориентира — реальные значения из эталонного решения.
CREATE TABLE events (
user_id UInt64,
event_time DateTime,
event_type LowCardinality(String),
-- ∈ ('signup', 'activation', 'first_purchase', 'churn')
revenue Decimal(18, 2) DEFAULT 0
) ENGINE = MergeTree
ORDER BY (event_time, user_id);
ClickHouse cohort argMaxIf retention multi-step
Это задание для уровня Senior. Senior-уровень — глубокое понимание темы, опыт решения нестандартных задач, обсуждение trade-off на собеседовании.
Подобные задания в категории «SQL» регулярно дают на собеседованиях аналитика данных в Яндекс, Сбер, Ozon, Авито, Тинькофф, Wildberries, T-Bank, X5, ВТБ и других крупных IT-компаниях. Тематика: ClickHouse, cohort, argMaxIf, retention, multi-step.
На реальном собеседовании на подобную задачу отводится 30-60 минут с обсуждением подходов, оптимизаций и trade-off. Для тренировки рекомендуем сначала решить самостоятельно, потом сверить с эталонным решением и подсказками.
На zasqlpython.ru есть 520+ SQL задач в песочнице с автопроверкой кода, конспекты SQL для аналитика, AI мок-собеседование с разбором ваших ответов.
← Все задания