Site Reliability Engineer

Vor 2 Tagen


OskarJägerStraße Köln NW Köln Germany gridscale Vollzeit
Jobbeschreibung

Bei uns gilt #OneTeam Komm zu gridscale und gestalte mit OVH die Zukunft der Cloud.

Als führendes Tech-Unternehmen arbeiten wir seit über zwei Jahrzehnten daran, unseren ökologischen Fußabdruck zu reduzieren – mit innovativen Lösungen und einer offenen Cloud, die von Grund auf nachhaltig gedacht ist: #SustainableByDesign.

Als Platform-Team betreiben wir die zentrale API-Infrastruktur für unsere Edge-Standorte und stellen die Developer Tools bereit, die unsere Teams benötigen. Du brennst für standortübergreifende Cloud-Umgebungen und Edge-Technologien? Dann bist du hier richtig.

Unser Tech Stack 


•Kubernetes
•GitOps
•Ansible
•Terraform
•Prometheus


•FluxCD
•Grafana
•Linux 
•OpenStack
•Baremetal

Deine Rolle

Als SRE wirst du Teil eines Teams, das für unseren zentralen API-Stack an den Edge-Standorten verantwortlich ist. Du arbeitest an der Konzeption, Automatisierung und dem Betrieb unserer Plattform und treibst kontinuierliche Verbesserungen voran. Wir suchen jemanden, der sich in einem sicherheitsorientierten Umfeld mit hohem Automatisierungsgrad (GitOps) wohlfühlt. Während ein gewisser Fokus auf der Observability unserer Systeme liegt, bist du als Senior in der Lage, die Schwerpunkte deiner Rolle aktiv mitzugestalten, basierend auf deinen Stärken und Interessen. Du bist es gewohnt, in unklaren Situationen den Überblick zu bewahren, Systeme zu analysieren und auf dieser Basis fundierte Entscheidungen zu treffen.

Deine Aufgaben
  • Du entwickelst und pflegst unsere Infrastructure as Code mit Tools wie Ansible und Terraform

  • Du treibst die Weiterentwicklung unseres Kubernetes-Stacks und implementierst GitOps-Workflows (z. B. mit FluxCD)

  • Du entwickelst und betreibst Observability-Lösungen (Monitoring, Logging, Tracing) und stehst hier auch anderen Teams als Ansprechpartner und Mentor zur Seite

  • Du bringst dich aktiv in die Systemanalyse ein und leitest Verbesserungen ab – auch bei anfangs unklaren Anforderungen

  • Du nimmst an einer rotierenden Rufbereitschaft teil

Was wir Dir bieten
  • Die Möglichkeit, mit neuesten Technologien einen echten Mehrwert zu leisten

  • Spannende tägliche Herausforderungen und eine steile Lernkurve

  • Deutschlandweite Standorte: Wähle frei zwischen Köln, Frankfurt, Hamburg, München oder Saarbrücken- unser Team trifft sich regelmäßig im Kölner Office für Teamevents.

  • Deine Arbeitszeiten kannst Du frei und individuell gestalten

  • Ein offenes Ohr und Raum für eigene Ideen und Experimente

  • Persönliches Budget sowie Urlaubstage für Weiterbildungen, Schulungen und Konferenzen, über das du selbst entscheiden kannst

  • Ein attraktives, faires Gehalt und die von dir bevorzugte Hardware

  • Eine Pluxee Shopping Card in Höhe von 50 EUR netto/Monat

  • 27 Tage Urlaub sind nicht genug? Wir garantieren dir weitere 20 Tage unbezahlten Urlaub sowie die Möglichkeit auf Workation

Das bringst Du mit
  • Deine Berufserfahrung ist uns wichtiger als deine Ausbildung

  • Du bringst mehrjährige Erfahrung als Platform Engineer, DevOps Engineer oder SRE mit

  • Deine technischen Skills: Du hast Erfahrung in den Bereichen Infrastructure as code (Ansible, Terraform), GitOps (FluxCD), Kubernetes, OpenStack, sowie Monitoring-, Logging- und Tracing-Tools (z.B. Mimir, Loki, Grafana, Tempo)

  • Du hast Erfahrung damit, in sicherheitskritischen Umgebungen zu arbeiten und verstehst die damit verbundenen Anforderungen

  • Du bist in der Lage, dich schnell in neue Systeme einzuarbeiten und eigenständig Lösungen zu erarbeiten

  • Du bist kommunikationsstark und hast Spaß daran, dein Wissen weiterzugeben

  • Du fühlst dich wohl, in einem strukturierten Unternehmensumfeld (kein Start-up) zu arbeiten

  • Du sprichst fließend Englisch, Deutsch ist kein Muss

Standort flexibel
  • Köln, Nordrhein-Westfalen, Deutschland
Development Alles erledigt

Deine Bewerbung wurde übermittelt

Anderer Job

  • Amalienbadstraße b, Karlsruhe, Germany Tipico Technology Services Vollzeit

    Company Description Our LineupWe are Tipico, Germany's leading sports betting provider and one of the most dynamic tech companies in the industry. We approach every challenge like a Championship match, with a mission to excite the arena and elevate the betting experience for every customer. Our culture is energetic and ambitious—we play as a team to win...


  • Karlsruhe, Baden-Württemberg, Germany Ionos Se Vollzeit

    Was erwartet dich?Du bist hauptsächlich für die Weiterentwicklung der Infrastruktur unserer Produkte verantwortlich und integrierst neue Produkte/Webdienste in unsere Kubernetes- und Cloud-InfrastrukturDu sorgst für den stabilen und sicheren Betrieb unserer Produktplattform und führst tiefgreifende Analysen sowie Optimierungen unserer containerisierten...


  • Köln, Deutschland gridscale GmbH Vollzeit

    Bei uns gilt #OneTeam Komm zu gridscale und gestalte mit OVH die Zukunft der Cloud.Als führendes Tech-Unternehmen arbeiten wir seit über zwei Jahrzehnten daran, unseren ökologischen Fußabdruck zu reduzieren – mit innovativen Lösungen und einer offenen Cloud, die von Grund auf nachhaltig gedacht ist: #SustainableByDesign.Als Platform-Team betreiben wir...

  • Site Reliability Engineer

    vor 10 Stunden


    Hybrid, Remote in Germany coectAI Vollzeit

    Deine Mission / Your mission: As a Site Reliability Engineer (all genders), your mission is to help maintain and further develop our internal self-service platform. This platform enables our development teams to deploy, monitor, and scale their applications efficiently - while upholding the highest standards of security, and reliability.Du bist...

  • Site Reliability Engineer

    vor 15 Stunden


    Hafenstraße Münster, Germany Raidboxes Vollzeit

    Du möchtest in einem internationalen Engineering Team arbeiten, in dem du täglich Python und Linux verwendest? Bei uns kannst du mit modernen Technologien die optimale Lösung für unsere Kund:innen gestalten. Werde Teil von Raidboxes als Site Reliability Engineer (w/m/d), komplett remote oder in unserem Büro in Münster. Bewirb dich direkt onlineWas wir...

  • Project Engineer

    vor 2 Wochen


    Köln, Nordrhein-Westfalen, Deutschland g2 Recruitment Vollzeit

    Project EngineerG2 Recruitment are working alongside our client to hire an experienced Solar Project EngineerContract length:12-month initial contractHours:5 days per weekWorking Pattern (Flexible Hours/Remote):Predominantly remote work with occasional visits to client sites across Germany (expenses paid for visits)Job Details:In this role, you will work...

  • Site Reliability Engineer

    vor 17 Stunden


    Wildunger Straße Frankfurt am Main, Hessen, Germany Deutsche WertpapierService Bank AG Vollzeit

    Wir, die Deutsche WertpapierService Bank AG, sind der führende Dienstleister für Wertpapierservices im deutschen Finanzmarkt. Unser Ziel als verlässliche Bank und moderner Technologiedienstleister ist es, das Wertpapiergeschäft unserer rund 1.200 Kundeninstitute mit neuen Services und effizienten Prozessen zu fördern. Lassen Sie uns diese spannende...


  • Saarbrücker Str., Berlin-Bezirk Pankow, Germany Scalable Vollzeit

    Company Description Scalable Capital is a leading digital investment and banking platform with a full banking licence, empowering people across Europe to shape their own finances. Scalable Broker makes it easy and affordable for clients to invest professionally in stocks, ETFs, cryptocurrencies, and derivatives, as well as set up savings plans. Scalable...


  • Köln, Nordrhein-Westfalen, Deutschland MAM Gruppe Vollzeit

    Senior DevOps EngineerLocation: North Rhine-Westphalia | HybridOur client is driving a major European data and AI transformation, building a next-generation engineering platform. As a DevOps Engineer, you'll design and maintain scalable, automated infrastructure that powers analytics and AI across multiple locations. This is a hands-on engineering role...


  • Germany (remote) ClickHouse Vollzeit

    About ClickHouseRecognized on the 2025 Forbes Cloud 100 list, ClickHouse is one of the most innovative and fast-growing private cloud companies. With over 2,000 customers and ARR that has more than quadrupled over the past year, ClickHouse leads the market in real-time analytics, data warehousing, observability, and AI workloads. ClickHouse's incredible...