Senior Site Reliability Engineer (m/w/d) - Kubernetes Plattform
SysEleven · Berlin, DE
Deine Mission Als Senior Site Reliability Engineer (m/w/d) im MetaKube Accelerator Team nutzt du moderne Kubernetes- und Cloud-Native-Technologien, um die Zu...
Job description
Deine Mission Als Senior Site Reliability Engineer (m/w/d) im MetaKube Accelerator Team nutzt du moderne Kubernetes- und Cloud-Native-Technologien, um die Zuverlässigkeit, Skalierbarkeit und operative Exzellenz der MKA-Plattform zu maximieren. Du löst komplexe Plattform-Herausforderungen, entwickelst produktionsreife Systeme und trägst zu Shared Ownership und kontinuierlicher Verbesserung bei. Damit gestaltest du aktiv die Weiterentwicklung des MetaKube Accelerators und erhöhst die Zuverlässigkeit unserer Managed Services. Deine Aufgaben: - Entwerfen und Implementieren von Observability-Lösungen mit Prometheus, Loki und Mimir, einschließlich der Definition sinnvoller Alerts sowie der kontinuierlichen Verbesserung der Monitoring-Abdeckung - Analyse, Troubleshooting und Weiterentwicklung eigener Kubernetes-Controller, um Zuverlässigkeit und Stabilität sicherzustellen - Entwicklung und Wartung von Produktionsanwendungen mit Fokus auf Codequalität, Skalierbarkeit und operativer Einsatzfähigkeit - Betrieb, Automatisierung und kontinuierliche Weiterentwicklung der MKA-Plattform mit Fokus auf Effizienz und Wartbarkeit - Weiterentwicklung interner Tooling-Lösungen, um Automatisierung zu fö...