Теория вероятностей курс для аналитика — программа 2026

Теория вероятностей — фундамент для статистики и A/B-тестов. На собесе спросят: «какова вероятность что в 100 бросках монеты выпадет 60+ орлов?», «формула Байеса», «парадокс Монти Холла». Здесь — структурированная программа с 40+ задачами и 10+ Python playgrounds.
Содержание (5 разделов)
  1. Программа курса
  2. Топ-10 задач с собесов
  3. Пример: формула Байеса
  4. ЦПТ — что нужно знать
  5. Какие распределения учить

Программа курса

6 модулей. Каждый — 5-7 дней. К концу можешь объяснить ЦПТ, ЗБЧ, считать условные вероятности, решать parlor problems.

Топ-10 задач с собесов

Эти задачи спрашивают на 60% технических собесов аналитика (теория вероятностей секция):

Пример: формула Байеса

Классическая задача с собеса fintech. Тест на болезнь — sensitivity 99%, specificity 95%, prevalence 1%. Какая вероятность что больной если тест положительный?

# P(D|+) = P(+|D) * P(D) / P(+)
P_D = 0.01           # prevalence (доля больных)
P_pos_given_D = 0.99  # sensitivity (true positive rate)
P_pos_given_notD = 0.05  # 1 - specificity (false positive rate)

# P(+) — full probability
P_pos = P_pos_given_D * P_D + P_pos_given_notD * (1 - P_D)

# Bayes
P_D_given_pos = P_pos_given_D * P_D / P_pos

print(f"P(больной | положительный тест) = {P_D_given_pos*100:.1f}%")
# Output: 16.7% (а не 99% как кажется!)
# Это и есть base rate fallacy — типичная ловушка на собесе

ЦПТ — что нужно знать

Центральная предельная теорема — почему средние всего стремятся к нормальному распределению. На собесе спросят:

Какие распределения учить

Минимум что нужно знать на собесе аналитика:

РаспределениеПрименениеПараметры
БернуллиОдин эксперимент с двумя исходамиp
БиномиальноеN независимых Бернуллиn, p
ПуассонПоток редких событийλ
ГеометрическоеЧисло попыток до первого успехаp
НормальноеСумма независимых (через ЦПТ)μ, σ²
ЭкспоненциальноеВремя до события (memoryless)λ
РавномерноеСлучайная величина в интервалеa, b

Частые вопросы

Нужен ли матан для теорвера?

Интегралы — да, базово (для непрерывных распределений). Высшая алгебра — нет. Если забыл matan — повтори интегрирование за 1-2 дня.

Сколько задач решить?

Junior: 30-40 задач. Middle: 60-80. Senior: 100+ включая applied (A/B-тесты, causal). У нас 40+ задач уровня Junior-Middle в разделе /tasks/category/probability.

Что важнее: теорвер или статистика?

Идут вместе. Теорвер — фундамент (распределения, мат. ожидание). Статистика — applied (hypothesis testing, regression). На собесе спросят оба, статистику чаще.

Какие книги читать?

«Probability» (Ross) — стандарт. «Введение в теорию вероятностей» (Феллер) — классика на русском. «Probability and Statistics for Data Scientists» — applied.

Что после теорвера?

Статистика (наш курс /lp/statistika-course) — t-test, chi-square, multiple testing. Потом A/B-тесты (/lp/ab-testy) и causal inference.

Начать практику бесплатно →