זה היה Black Friday, 03:00 לפנות בוקר. צוות ה-DevOps של חברת אי-קומרס ישראלית ישב עם הידיים על המקלדת ועיניים על ה-Grafana. התחזיות אמרו 3x תנועה. המציאות הייתה 11x. תוך 4 דקות, תורים ב-RabbitMQ עלו מ-200 הודעות ל-180,000. שרתי ה-checkout קרסו. ה-on-call engineer ניסה להריץ kubectl scale deployment checkout --replicas=40 ביד - אבל עד שהפודים עלו ועברו את בדיקות ה-readiness, עברו 6 דקות. נזק של כ-800,000 ש"ח בהזמנות שנעזבו.
הבעיה לא הייתה חוסר capacity. הייתה חוסר autoscaling. מי שמסתמך על scaling ידני בפרודקשן ב-2025 - פשוט מחכה לאירוע הזה.