**Задача:** разбить поток событий на сессии. Новая сессия начинается, если между событиями одного пользователя прошло **больше 30 минут**.
**Данные:**
[см. код в задании]
**Задание:**
1. Присвой каждому событию `session_id` (порядковый номер сессии внутри пользователя).
2. Посчитай длительность и число просмотров каждой сессии.
Структура для ориентира — реальные значения из эталонного решения.
CREATE TABLE pageviews (
user_id UInt64,
event_time DateTime,
url String
) ENGINE = MergeTree
ORDER BY (user_id, event_time);
ClickHouse сессионизация window functions lagInFrame runningAccumulate
Это задание для уровня Senior. Senior-уровень — глубокое понимание темы, опыт решения нестандартных задач, обсуждение trade-off на собеседовании.
Подобные задания в категории «SQL» регулярно дают на собеседованиях аналитика данных в Яндекс, Сбер, Ozon, Авито, Тинькофф, Wildberries, T-Bank, X5, ВТБ и других крупных IT-компаниях. Тематика: ClickHouse, сессионизация, window functions, lagInFrame, runningAccumulate.
На реальном собеседовании на подобную задачу отводится 30-60 минут с обсуждением подходов, оптимизаций и trade-off. Для тренировки рекомендуем сначала решить самостоятельно, потом сверить с эталонным решением и подсказками.
На zasqlpython.ru есть 520+ SQL задач в песочнице с автопроверкой кода, конспекты SQL для аналитика, AI мок-собеседование с разбором ваших ответов.
← Все задания