NumPy векторизация: производительный Python для аналитика

32 задач Pyodide в браузере С эталонными решениями 2026 — с реальных собесов

NumPy — фундамент всех Python-data-инструментов: pandas, scipy, sklearn внутри используют numpy-массивы. Векторизация — главная фишка: вместо цикла по миллиону строк делается одна операция на весь массив, и это работает в 50-100 раз быстрее чем pure Python. На собесе на middle-аналитика и Data Scientist обязательно проверят: «перепиши цикл через векторизацию», «как работает broadcasting», «np.where vs условие в цикле».

Начать решать задачи →

Все задачи на «NumPy векторизация» (32)

Создание и reshape массива Лёгкая Яндекс arange reshape
Broadcasting: нормализация матрицы Средняя Сбер broadcasting normalization
Boolean indexing в numpy Лёгкая Тинькофф boolean_indexing clip
np.where для условной замены Лёгкая Ozon np_where
Перцентили массива Средняя Wildberries percentile statistics
Корреляция между массивами Средняя Сбер corrcoef correlation
Linspace для равномерной сетки Лёгкая Яндекс linspace sin vectorized
Конкатенация и стэкинг массивов Средняя VK vstack concatenate
Slicing матрицы Лёгкая Тинькофф slicing indexing
Уникальные значения и их частоты Средняя Ozon unique counts
Векторизованная обработка: np.where с условиями Лёгкая Ozon np.where vectorization conditional
Матричное умножение: взвешенные оценки Средняя Яндекс matmul argmax linear_algebra
Broadcasting: нормализация матрицы Средняя Сбер broadcasting normalization axis
np.select: множественные условия Лёгкая Тинькофф np.select conditions vectorization
Генерация синтетических данных Лёгкая VK random normal percentile statistics
Линейная алгебра: решение системы уравнений Сложная Яндекс linalg solve linear_system
Fancy indexing и маски Средняя Ozon fancy_indexing boolean_mask filtering
Einsum: эффективные тензорные операции Сложная Сбер einsum tensor trace linear_algebra
Матричное умножение: взвешенный скоринг Средняя Авито matmul dot argmax scoring
Broadcast: нормализация по столбцам Лёгкая Wildberries broadcasting normalization min_max
Булева маска: фильтрация по нескольким условиям Лёгкая Самокат boolean_mask filtering logical_operators
Vectorized string operations с numpy Средняя МТС unique argsort string_operations
Reshape и агрегация: месячные данные в квартальные Средняя Delivery Club reshape aggregation quarterly
Маскированные массивы: среднее без выбросов Сложная Lamoda masked_array zscore outliers
Бинарный поиск: np.searchsorted для тарифов Лёгкая Мегафон searchsorted binning tariff
Broadcasting: нормализация по столбцам Средняя general numpy broadcasting normalize
Top-K индексов через argpartition Средняя ML numpy argpartition top-k
Random sampling без повторов Лёгкая A/B-тесты numpy random sampling
Boolean indexing: отрицательные значения Лёгкая general numpy boolean indexing ReLU
np.where: классификация по threshold Лёгкая Yandex numpy vectorization where
np.cumprod: composite growth rate Средняя T-Bank numpy cumprod finance
np.select: сегментация клиентов по тратам Средняя Avito numpy vectorization select segmentation

FAQ: частые вопросы про numpy векторизация

Зачем учить numpy если есть pandas?

Pandas внутри это numpy + индекс. Знание numpy открывает: ускорение pandas-операций через .values + numpy-функции, написание sklearn-преобразований, понимание broadcasting (ошибки «shape mismatch» — это про numpy).

Что такое broadcasting?

Автоматическое выравнивание размерностей при операциях между массивами разных форм. np.array([1,2,3]) + 10 → [11,12,13] — 10 «броадкастится» на каждую строку. Работает по правилам совместимости shape.

Векторизация vs цикл — насколько быстрее?

На массиве 1М элементов: цикл for ~1 сек, np.sum() — 5мс. Разница 200×. Это потому что numpy под капотом C-код, а Python-цикл интерпретируется.

np.where или if-else в цикле?

np.where(condition, value_if_true, value_if_false) — векторная замена if-else. На больших данных в 100× быстрее. Поддерживает вложенность (np.where внутри np.where) для multi-condition.

Чем np.dot отличается от *?

* — поэлементное умножение (Hadamard product). np.dot или @ — матричное умножение (как в линейной алгебре). Путают на собесе ML-аналитика регулярно.

Связанные темы Python

Pandas: основы · Pandas groupby · Pandas merge / join · Pandas: временные ряды · scipy: A/B-тесты · sklearn для аналитика · Графики: matplotlib / seaborn

Связанные темы SQL

Агрегации

Открыть весь Python-тренажёр (561 задач) →