Le podcast 🎙️ AWS ☁️ en 🇫🇷

Hero

Episode 348

Doctolib : 20k requêtes/sec sur Graviton et Karpenter

Feb 20, 26 • 00:43:24

With Betrand Paquet, Principal SRE at Doctolib

Au sujet de cet épisode

Bertrand Paquet, Principal Reliability Engineer chez Doctolib, partage le retour d'expérience de la double migration vers Graviton et Karpenter. Doctolib gère 80 millions de patients avec un monolithe Ruby on Rails servant 20 000 requêtes par seconde sur 1500 pods, dont 80% tournent sur des instances spot. La migration vers Graviton visait deux objectifs : réduire les coûts et diminuer le taux de reclaim des instances spot. L'équipe a adopté une approche pragmatique en utilisant d'abord la cross-compilation avec QEMU malgré les temps de build allongés, avant de migrer progressivement les workloads. La migration vers Karpenter a remplacé les 14-15 node groups gérés par cluster autoscaler, simplifiant considérablement les mises à jour de cluster EKS et améliorant la gestion des préemptions spot grâce au bin packing. Bertrand détaille les défis rencontrés, notamment la nécessité d'ajouter des pod disruption budgets sur toutes les applications, et partage ses recommandations : ne pas hésiter à migrer vers Graviton car c'est souvent un non-sujet technique, et adopter Karpenter dès le départ pour tout nouveau cluster EKS.

Links

Vous trouverez ici les liens vers les outils, technologies et autres artciles mentionnés dans cet épsiode.