**Задача:** сырые события занимают терабайты. Нужно: хранить сырьё только 90 дней, но **не терять историю** — агрегированные дневные метрики должны жить вечно.
[см. код в задании]
**Задание:**
1. Настрой TTL: удалять сырые строки старше 90 дней.
2. Объясни, как сохранить агрегаты навсегда (паттерн с отдельной таблицей или TTL ... GROUP BY).
Структура для ориентира — реальные значения из эталонного решения.
ALTER TABLE events MODIFY TTL event_date + INTERVAL 90 DAY;
-- Дневные агрегаты живут вечно, наполняются через MV:
CREATE TABLE daily_revenue (
event_date Date,
revenue AggregateFunction(sum, Decimal(18, 2)),
dau AggregateFunction(uniq, UInt64)
) ENGINE = AggregatingMergeTree
ORDER BY event_date; -- TTL НЕТ → хранится навсегда
CREATE MATERIALIZED VIEW daily_mv TO daily_revenue AS
SELECT event_date, sumState(amount) AS revenue, uniqState(user_id) AS dau
FROM events GROUP BY event_date;
ClickHouse TTL retention rollup storage lifecycle
Это задание для уровня Middle. Для middle-аналитиков с опытом 1-3 года, требует уверенного владения темой и понимания edge cases.
Подобные задания в категории «SQL» регулярно дают на собеседованиях аналитика данных в Яндекс, Сбер, Ozon, Авито, Тинькофф, Wildberries, T-Bank, X5, ВТБ и других крупных IT-компаниях. Тематика: ClickHouse, TTL, retention, rollup, storage lifecycle.
На реальном собеседовании на подобную задачу отводится 15-30 минут — оцениваются подход, корректность, обработка edge cases. Для тренировки рекомендуем сначала решить самостоятельно, потом сверить с эталонным решением и подсказками.
На zasqlpython.ru есть 520+ SQL задач в песочнице с автопроверкой кода, конспекты SQL для аналитика, AI мок-собеседование с разбором ваших ответов.
← Все задания