Lyft: federated data lake через Trino

senior Мобильность 60 мин Системный дизайн

Ситуация: Lyft — ride-sharing с миллионами поездок/день. Разные данные в разных источниках: rides в MySQL, events в Hive S3, driver data в DynamoDB. Аналитики хотят cross-source SQL без ETL pipeline.

Lyft Engineering blog публикует архитектуру с Trino как central query engine. Раньше — много specialized pipelines. Теперь — federated Trino для self-service analytics.

Доступные данные

Задачи

Все кейсы для подготовки → ← Все кейсы