Site Reliability Engineer

vor 3 Wochen


Munich, Deutschland Workwise GmbH Vollzeit

Über uns
Über IONOS SEWir sind Europas führende Plattform für Cloud Services und Hosting-Dienstleistungen. Wir begleiten erfolgreich unsere Kund:innen bei ihrer Unternehmensentwicklung. Für unseren Unternehmenserfolg sind über 4000 Mitarbeitende in mehreren Ländern weltweit tätig, um die Anforderungen und Wünsche unserer 8,5 Millionen Kund:innen zu erfüllen.
Wir sind eine Marke der United Internet AG, einem börsennotierten Unternehmen mit rund 10.200 Mitarbeitenden.
Wir fördern die Entwicklung unserer Mitarbeitenden und deren unterschiedliche Talente, Interessen und Sprachen.Was erwartet dich?
- Du nimmst an Architektur-Reviews teil, um sicherzustellen, dass die Speicher-Infrastructure die Ziele für Leistung, Zuverlässigkeit und Skalierbarkeit erreicht
- Du entwickelst Automatisierungen für die Speicher-Provisionierung, das Monitoring und die Skalierung – zum Beispiel mit Ansible, SaltStack, Terraform oder eigenen Python/Go-Skripten
- Du richtest Self-Healing- und Alarmierungs-Mechanismen ein, die bei speicherbezogenen Problemen automatisch reagieren
- Du implementierst Observability für die Speichersysteme (Metriken, Logs, Tracing)
- Du analysierst und behebst komplexe Leistungs- oder Zuverlässigkeits-Probleme und unterstützt die On-Call-Rotation
- Du führst Root-Cause-Analysen (RCA) für Vorfälle durch und entwickelst präventive Maßnahmen
Was solltest du mitbringen?
- Du hast mindestens 5 Jahre Erfahrung in Linux-Systemengineering, Speicher-Infrastructure oder SRE-Rollen
- Du hast ein sehr gutes Verständnis der Protokolle RDMA, InfiniBand und RoCE
- Du hast fundierte Praxis mit Linux MD-RAID (mdadm) und LVM
- Du hast Erfahrung im Linux-Performance-Tuning und im Debuggen des Netzwerk-Stacks (ethtool, perf, tcpdump, ibstat, ibtop)
- Du hast starke Scripting- und Automatisierungs-Skills in Python, Bash und Go
- Du bist sicher im Umgang mit Konfigurations-Management-Tools wie SaltStack oder Ansible sowie mit Monitoring-Lösungen wie Prometheus, Loki und Grafana
Was bieten wir dir?
- Hybrides Arbeitsmodell mit Möglichkeit auf Homeoffice-Möglichkeit
- Flexible Arbeitszeiten durch Vertrauensarbeitszeit
- An einigen Standorten eine bezuschusste Kantine und verschiedene kostenfreie Getränke
- Moderne Büroflächen mit sehr guter Verkehrsanbindung
- Diverse Mitarbeiterrabatte für Aktivitäten und Produkte
- Mitarbeiterevents wie Sommer- und Winterfeiern, sowie Workshops
- Zahlreiche Weiterbildungs- und Entwicklungsmöglichkeiten
- Verschiedene Gesundheitsangebote, wie Sport- und Gesundheitskurse
Zur BewerbungUnser Jobangebot Site Reliability Engineer - Automatisierung / Python / Ansible (m/w/d) klingt vielversprechend?
Bei unserem Partner Workwise ist eine Bewerbung für diesen Job in nur wenigen Minuten und ohne Anschreiben möglich. Anschließend kann der Status der Bewerbung live verfolgt werden. Wir freuen uns auf eine Bewerbung über Workwise.



  • Munich, Bayern, Deutschland ICT Digital Solutions Vollzeit 80.000 € - 120.000 € pro Jahr

    Zur Verstärkung unseres Teams suchen wir zum nächstmöglichen Zeitpunkt einen Site Reliability Engineer (m/w/d) am Standort Ismaning bei München oder remote. Deine Aufgaben Gewährleistung der Verfügbarkeit, Leistung und Skalierbarkeit von digitalen Plattformen und Services.Entwicklung, Implementierung und Wartung von automatisierten Lösungen zur...


  • Munich, Bayern, Deutschland Workaround GmbH Vollzeit 96.000 € - 126.000 € pro Jahr

    #ProGloveAt ProGlove, we're tackling one of the biggest challenges of our time: shrinking and aging workforces in industries that can't simply automate their way forward. Most companies will rely on human workers for decades to come — and we build the technology that keeps those people safe, healthy, and hyper-efficient.  Our wearable solutions and...


  • Munich, Deutschland ICT Digital Solutions Vollzeit

    Zur Verstärkung unseres Teams suchen wir zum nächstmöglichen Zeitpunkt einen Site Reliability Engineer (m/w/d) am Standort Ismaning bei München oder remote. Deine Aufgaben Gewährleistung der Verfügbarkeit, Leistung und Skalierbarkeit von digitalen Plattformen und Services. Entwicklung, Implementierung und Wartung von automatisierten Lösungen zur...


  • Munich, Deutschland ICT Digital Solutions Vollzeit

    Zur Verstärkung unseres Teams suchen wir zum nächstmöglichen Zeitpunkt einen Site Reliability Engineer (m/w/d) am Standort Ismaning bei München oder remote. Deine Aufgaben Gewährleistung der Verfügbarkeit, Leistung und Skalierbarkeit von digitalen Plattformen und Services. Entwicklung, Implementierung und Wartung von automatisierten Lösungen zur...


  • Munich, Bayern, Deutschland Exaring AG Vollzeit 80.000 € - 120.000 € pro Jahr

    About Exaring AGOur platform offers IPTV live streaming: Free TV, Pay TV, NewTV, Video-on-Demand, recordings, restart, and timeshift – all in a single app on a wide range of devices, such as smartphones, tablets, and TVs (FireTV, Apple TV, Smart TVs, and our own stick).At Exaring AG, we operate the entire platform and handle the complete process: from...


  • Munich, Deutschland XEMPUS Vollzeit

    Who we are We are Xempus, Germany´s leading independent Software-as-Service (SaaS) platform for the management and distribution of pension, life and health insurance. Our mission: making pension, life and health insurance digital and understandable, efficient and accessible for everyone. Since 2007, we have been constantly working to drive the...


  • Munich, Deutschland ventx Vollzeit

    Deine Aufgaben Verantwortung für die Planung, Implementierung und Wartung der Public Cloud-Infrastruktur (z.B. Microsoft Azure, AWS, Google Cloud). Entwurf, Umsetzung und Optimierung von Lösungen für Überwachung, Alarmierung und Incident-Management, um eine hohe Verfügbarkeit und Performance sicherzustellen. Identifizierung von Engpässen und...


  • Munich, Bayern, Deutschland Google Vollzeit 80.000 € - 120.000 € pro Jahr

    Minimum qualifications:Bachelor's degree in Computer Science, a related field, or equivalent practical experience.8 years of experience with software development in one or more programming languages (e.g., Go, Java, C, C++).4 years of experience leading projects involving many teams.4 years of experience designing, analyzing, and troubleshooting distributed...


  • Munich, Bayern, Deutschland Google Vollzeit 70.000 € - 110.000 € pro Jahr

    Minimum qualifications:Bachelor's degree in Computer Science, a related field, or equivalent practical experience.5 years of experience with software development in one or more programming languages.3 years of experience in designing, analyzing, and troubleshooting large-scale distributed systems.2 years of experience leading projects and providing technical...


  • Munich, Bayern, Deutschland Google Vollzeit 80.000 € - 120.000 € pro Jahr

    Minimum qualifications:Bachelor's degree in Computer Science, a related field, or equivalent practical experience.5 years of experience with software development in one or more programming languages.3 years of experience in designing, analyzing, and troubleshooting large-scale distributed systems.2 years of experience leading projects and providing technical...