**Данные:** raw events приходят из Kafka в real-time:
[см. код в задании]
**Задание:**
Спроектировать **real-time DAU dashboard** который читается за <100ms.
1. Создать **AggregatingMergeTree** таблицу для агрегатов DAU по дням
2. Создать **Materialized View** который автоматически обновляет агрегаты при INSERT в `events`
3. Написать SELECT который читает агрегаты для последних 30 дней
4. Обеспечить: latency < 100ms даже на 1B+ events
Структура для ориентира — реальные значения из эталонного решения.
CREATE TABLE dau_daily_state
(
day Date,
dau_state AggregateFunction(uniq, UInt64)
)
ENGINE = AggregatingMergeTree
ORDER BY day;
ClickHouse materialized view AggregatingMergeTree real-time
Это задание для уровня Middle. Для middle-аналитиков с опытом 1-3 года, требует уверенного владения темой и понимания edge cases.
Подобные задания в категории «SQL» регулярно дают на собеседованиях аналитика данных в Яндекс, Сбер, Ozon, Авито, Тинькофф, Wildberries, T-Bank, X5, ВТБ и других крупных IT-компаниях. Тематика: ClickHouse, materialized view, AggregatingMergeTree, real-time.
На реальном собеседовании на подобную задачу отводится 15-30 минут — оцениваются подход, корректность, обработка edge cases. Для тренировки рекомендуем сначала решить самостоятельно, потом сверить с эталонным решением и подсказками.
На zasqlpython.ru есть 520+ SQL задач в песочнице с автопроверкой кода, конспекты SQL для аналитика, AI мок-собеседование с разбором ваших ответов.
← Все задания