EXPLAIN + broadcast vs distributed JOIN optimization

Middle SQL data_engineering

Условие задания

**Контекст:** у тебя 2 таблицы в Hive (Iceberg):

[см. код в задании]

**Задание:**

1. Напиши SQL для подсчёта total amount по country за последний месяц
2. Запусти `EXPLAIN` и проанализируй: какой JOIN strategy выбрал оптимизатор?
3. Если оптимизатор выбрал WRONG strategy — заставь его через hint
4. Объясни trade-off broadcast vs distributed JOIN

**Цель:** запрос должен выполниться <30 секунд на 1B-row fact.

Темы

Trino EXPLAIN JOIN optimization broadcast

Подсказки

Все тестовые задания →

Частые вопросы

Какой уровень знаний нужен для задачи "EXPLAIN + broadcast vs distributed JOIN optimization"?

Это задание для уровня Middle. Для middle-аналитиков с опытом 1-3 года, требует уверенного владения темой и понимания edge cases.

На каких собеседованиях встречается такая задача?

Подобные задания в категории «SQL» регулярно дают на собеседованиях аналитика данных в Яндекс, Сбер, Ozon, Авито, Тинькофф, Wildberries, T-Bank, X5, ВТБ и других крупных IT-компаниях. Тематика: Trino, EXPLAIN, JOIN, optimization, broadcast.

Сколько времени даётся на решение?

На реальном собеседовании на подобную задачу отводится 15-30 минут — оцениваются подход, корректность, обработка edge cases. Для тренировки рекомендуем сначала решить самостоятельно, потом сверить с эталонным решением и подсказками.

Где ещё потренироваться по теме «SQL»?

На zasqlpython.ru есть 520+ SQL задач в песочнице с автопроверкой кода, конспекты SQL для аналитика, AI мок-собеседование с разбором ваших ответов.

← Все задания