מתקדם
SRE & Observability
אמינות מערכות ו-Observability
למדו את עקרונות ה-Site Reliability Engineering - SLIs, SLOs, Monitoring, Logging, Tracing, Incident Management, Chaos Engineering ועוד - כפי ש-Google המציאו.
שעות שיעורים980 לומדים
MonitoringLoggingSLOsIncident ManagementPrometheus
טכנולוגיות בקורס
Prometheus
Grafana
Datadog
Elasticsearch
2 שיעורים חינמיים מתוך 12
תוכן הקורס
12 שיעורים · 10 שעות
- 1מבוא ל-SRE - מה Google המציאו15 דק׳חינם
- 2SLIs, SLOs, SLAs - מדדי אמינות20 דק׳חינם
- 3Error Budgets - תקציב שגיאות20 דק׳
- 4Monitoring - Prometheus, Grafana, Datadog25 דק׳
- 5Logging - ELK Stack, Structured Logging25 דק׳
- 6Distributed Tracing - Jaeger, OpenTelemetry20 דק׳
- 7Alerting - On-Call, PagerDuty, Escalation Policies20 דק׳
- 8Incident Management - Postmortems, Blameless Culture20 דק׳
- 9Chaos Engineering - Chaos Monkey, Game Days20 דק׳
- 10Capacity Planning - תכנון קיבולת20 דק׳
- 11Toil Reduction - אוטומציה וצמצום עבודה ידנית15 דק׳
- 12SRE Best Practices - Building Reliable Systems20 דק׳
קורסים נוספים שאולי יעניינו אתכם
Cloud Computing
מחשוב ענן
למדו את עולם הענן - AWS, GCP, Azure - כולל Compute, Storage, Databases, Serverless, Networking, Monitoring ואסטרטגיות Cloud Architecture.
13שיעורים
בינונירמה
15שעות
DevOps
דבאופס
למדו את עולם ה-DevOps מאפס - Git, Docker, Kubernetes, CI/CD, Terraform ועוד - עם דגש על Best Practices ותהליכי עבודה מודרניים.
23שיעורים
בינונירמה
20שעות