Question 1

Какие 5 агрегатных функций должен знать аналитик?

Accepted Answer

!Шпаргалка: 5 агрегатных функций COUNT/SUM/AVG/MIN/MAX с примерами вывода и поведением NULL | Функция | Что считает | Пример | |---|---|---| | COUNT(*) | Количество строк | COUNT(*) AS orders | | COUNT(col) | Количество не-NULL значений | COUNT(email) | | COUNT(DISTINCT col) | Уникальных значений | COUNT(DISTINCT user_id) | | SUM(col) | Сумма | SUM(amount) AS revenue | | AVG(col) | Среднее | AVG(amount) AS avg_check | | MIN(col) / MAX(col) | Минимум / Максимум | MAX(created_at) |

Question 2

Как работает GROUP BY?

Accepted Answer

GROUP BY группирует строки по значению колонки. Внутри каждой группы вычисляются агрегаты. !GROUP BY flow: строки группируются по колонке и схлопываются в агрегат !Анимация: строки схлопываются в группы по country, в каждой считается SUM(amount) Анимация — следи как строки переходят в свои группы:

Question 3

Что нельзя писать в SELECT при GROUP BY?

Accepted Answer

Правило: каждая колонка в SELECT должна быть либо в GROUP BY, либо внутри агрегата.

Question 4

Чем HAVING отличается от WHERE?

Accepted Answer

!Шпаргалка: HAVING vs WHERE — что в каком фильтре можно использовать, порядок выполнения SQL !Анимация: WHERE фильтрует строки до группировки, HAVING — готовые группы после агрегации - WHERE фильтрует строки до агрегации - HAVING фильтрует группы после агрегации

Question 5

Чем COUNT(*) отличается от COUNT(col)?

Accepted Answer

- COUNT(*) — все строки (включая с NULL) - COUNT(col) — только строки где col не NULL - COUNT(DISTINCT col) — уникальные не-NULL значения

Question 6

Какие 6 типичных задач аналитика через GROUP BY?

Accepted Answer

- Выручка по странам: SUM(amount) GROUP BY country - Уникальные юзеры в день: COUNT(DISTINCT user_id) GROUP BY DATE(event_ts) - Средний чек по категориям: AVG(amount) GROUP BY category - Топ-10 продуктов: COUNT(*) GROUP BY product_id ORDER BY COUNT(*) DESC LIMIT 10 - Когда последний заказ юзера: MAX(created_at) GROUP BY user_id - Конверсия по каналам: COUNT(CASE WHEN paid = TRUE THEN 1 END) * 100.0 / COUNT(*) GROUP BY channel

Question 7

Можно ли в GROUP BY использовать индексы колонок?

Accepted Answer

GROUP BY 1, 2 (по индексу колонки в SELECT). Работает, но плохо читается. Лучше явно GROUP BY country, region.

Question 8

Что делать если нужно агрегат внутри агрегата?

Accepted Answer

Подзапросы или CTE — разбираем в Части 6. Пример: «средняя выручка на пользователя» — сначала сумма по юзеру, потом среднее.

Функция	Что считает	Пример
`COUNT(*)`	Количество строк	`COUNT(*) AS orders`
`COUNT(col)`	Количество не-NULL значений	`COUNT(email)`
`COUNT(DISTINCT col)`	Уникальных значений	`COUNT(DISTINCT user_id)`
`SUM(col)`	Сумма	`SUM(amount) AS revenue`
`AVG(col)`	Среднее	`AVG(amount) AS avg_check`
`MIN(col)` / `MAX(col)`	Минимум / Максимум	`MAX(created_at)`

SQL с нуля. Часть 4: агрегаты, GROUP BY и HAVING

Что разберёшь в этом уроке

Частые вопросы