pandas: сессионизация событий (таймаут 30 минут)

Senior Python Общие

Условие задания

**Данные:** `df` событий с колонками `user_id`, `ts` (datetime). Новая сессия начинается, если между соседними событиями пользователя прошло **больше 30 минут**.

**Задание:** проставьте каждому событию `session_id` (уникальный в рамках пользователя) и посчитайте число сессий на пользователя.

Темы

pandas сессионизация diff cumsum time-series

Подсказки

Все тестовые задания →

Частые вопросы

Какой уровень знаний нужен для задачи "pandas: сессионизация событий (таймаут 30 минут)"?

Это задание для уровня Senior. Senior-уровень — глубокое понимание темы, опыт решения нестандартных задач, обсуждение trade-off на собеседовании.

На каких собеседованиях встречается такая задача?

Подобные задания в категории «Python» регулярно дают на собеседованиях аналитика данных в Яндекс, Сбер, Ozon, Авито, Тинькофф, Wildberries, T-Bank, X5, ВТБ и других крупных IT-компаниях. Тематика: pandas, сессионизация, diff, cumsum, time-series.

Сколько времени даётся на решение?

На реальном собеседовании на подобную задачу отводится 30-60 минут с обсуждением подходов, оптимизаций и trade-off. Для тренировки рекомендуем сначала решить самостоятельно, потом сверить с эталонным решением и подсказками.

Где ещё потренироваться по теме «Python»?

На zasqlpython.ru есть 530+ Python задачи с проверкой через Pyodide, конспекты Python и pandas, AI мок-собеседование с разбором ваших ответов.

← Все задания