Ozon: обработать 10ГБ access.log без загрузки в RAM

middle Маркетплейс 45 мин Live coding

Ситуация: На собесе дают 10ГБ nginx access.log. Задача: найти топ-10 URL по числу запросов, среднее response time, distribution status codes. Файл в RAM не помещается.

Реальный задавали в Ozon 2024-2025. Цель — оценить понимание Python generators, collections.Counter, обработку big data без pandas.read_csv.

Доступные данные

Задачи

Все кейсы для подготовки → ← Все кейсы