Lyft: federated data lake через Trino

Сложный Мобильность 60 мин Системный дизайн Lyft ✓ Реальный

Ситуация: Lyft — ride-sharing с миллионами поездок/день. Разные данные в разных источниках: rides в MySQL, events в Hive S3, driver data в DynamoDB. Аналитики хотят cross-source SQL без ETL pipeline.

Lyft Engineering blog публикует архитектуру с Trino как central query engine. Раньше — много specialized pipelines. Теперь — federated Trino для self-service analytics.