מתקדם
SRE & Observability
אמינות מערכות ו-Observability
למדו את עקרונות ה-Site Reliability Engineering — SLIs, SLOs, Monitoring, Logging, Tracing, Incident Management, Chaos Engineering ועוד — כפי ש-Google המציאו.
4.6 לומדים שעות שיעורים
MonitoringLoggingSLOsIncident ManagementPrometheus
טכנולוגיות בקורס
Prometheus
Grafana
Datadog
Elasticsearch
התחילו ללמוד
2 שיעורים חינמיים מתוך 12
תוכן הקורס
12 שיעורים · 10 שעות
- 1מבוא ל-SRE — מה Google המציאו15 דק׳חינם
- 2SLIs, SLOs, SLAs — מדדי אמינות20 דק׳חינם
- 3Error Budgets — תקציב שגיאות20 דק׳
- 4Monitoring — Prometheus, Grafana, Datadog25 דק׳
- 5Logging — ELK Stack, Structured Logging25 דק׳
- 6Distributed Tracing — Jaeger, OpenTelemetry20 דק׳
- 7Alerting — On-Call, PagerDuty, Escalation Policies20 דק׳
- 8Incident Management — Postmortems, Blameless Culture20 דק׳
- 9Chaos Engineering — Chaos Monkey, Game Days20 דק׳
- 10Capacity Planning — תכנון קיבולת20 דק׳
- 11Toil Reduction — אוטומציה וצמצום עבודה ידנית15 דק׳
- 12SRE Best Practices — Building Reliable Systems20 דק׳