Site Reliability Engineer

Vor 2 Tagen

OskarJägerStraße Köln NW Köln Germany gridscale Vollzeit

Jobbeschreibung

Bei uns gilt #OneTeam Komm zu gridscale und gestalte mit OVH die Zukunft der Cloud.

Als führendes Tech-Unternehmen arbeiten wir seit über zwei Jahrzehnten daran, unseren ökologischen Fußabdruck zu reduzieren – mit innovativen Lösungen und einer offenen Cloud, die von Grund auf nachhaltig gedacht ist: #SustainableByDesign.

Als Platform-Team betreiben wir die zentrale API-Infrastruktur für unsere Edge-Standorte und stellen die Developer Tools bereit, die unsere Teams benötigen. Du brennst für standortübergreifende Cloud-Umgebungen und Edge-Technologien? Dann bist du hier richtig.

Unser Tech Stack

•Kubernetes
•GitOps
•Ansible
•Terraform
•Prometheus

•FluxCD
•Grafana
•Linux
•OpenStack
•Baremetal

Deine Rolle

Als SRE wirst du Teil eines Teams, das für unseren zentralen API-Stack an den Edge-Standorten verantwortlich ist. Du arbeitest an der Konzeption, Automatisierung und dem Betrieb unserer Plattform und treibst kontinuierliche Verbesserungen voran. Wir suchen jemanden, der sich in einem sicherheitsorientierten Umfeld mit hohem Automatisierungsgrad (GitOps) wohlfühlt. Während ein gewisser Fokus auf der Observability unserer Systeme liegt, bist du als Senior in der Lage, die Schwerpunkte deiner Rolle aktiv mitzugestalten, basierend auf deinen Stärken und Interessen. Du bist es gewohnt, in unklaren Situationen den Überblick zu bewahren, Systeme zu analysieren und auf dieser Basis fundierte Entscheidungen zu treffen.

Deine Aufgaben

Du entwickelst und pflegst unsere Infrastructure as Code mit Tools wie Ansible und Terraform
Du treibst die Weiterentwicklung unseres Kubernetes-Stacks und implementierst GitOps-Workflows (z. B. mit FluxCD)
Du entwickelst und betreibst Observability-Lösungen (Monitoring, Logging, Tracing) und stehst hier auch anderen Teams als Ansprechpartner und Mentor zur Seite
Du bringst dich aktiv in die Systemanalyse ein und leitest Verbesserungen ab – auch bei anfangs unklaren Anforderungen
Du nimmst an einer rotierenden Rufbereitschaft teil

Was wir Dir bieten

Die Möglichkeit, mit neuesten Technologien einen echten Mehrwert zu leisten
Spannende tägliche Herausforderungen und eine steile Lernkurve
Deutschlandweite Standorte: Wähle frei zwischen Köln, Frankfurt, Hamburg, München oder Saarbrücken- unser Team trifft sich regelmäßig im Kölner Office für Teamevents.
Deine Arbeitszeiten kannst Du frei und individuell gestalten
Ein offenes Ohr und Raum für eigene Ideen und Experimente
Persönliches Budget sowie Urlaubstage für Weiterbildungen, Schulungen und Konferenzen, über das du selbst entscheiden kannst
Ein attraktives, faires Gehalt und die von dir bevorzugte Hardware
Eine Pluxee Shopping Card in Höhe von 50 EUR netto/Monat
27 Tage Urlaub sind nicht genug? Wir garantieren dir weitere 20 Tage unbezahlten Urlaub sowie die Möglichkeit auf Workation

Das bringst Du mit

Deine Berufserfahrung ist uns wichtiger als deine Ausbildung
Du bringst mehrjährige Erfahrung als Platform Engineer, DevOps Engineer oder SRE mit
Deine technischen Skills: Du hast Erfahrung in den Bereichen Infrastructure as code (Ansible, Terraform), GitOps (FluxCD), Kubernetes, OpenStack, sowie Monitoring-, Logging- und Tracing-Tools (z.B. Mimir, Loki, Grafana, Tempo)
Du hast Erfahrung damit, in sicherheitskritischen Umgebungen zu arbeiten und verstehst die damit verbundenen Anforderungen
Du bist in der Lage, dich schnell in neue Systeme einzuarbeiten und eigenständig Lösungen zu erarbeiten
Du bist kommunikationsstark und hast Spaß daran, dein Wissen weiterzugeben
Du fühlst dich wohl, in einem strukturierten Unternehmensumfeld (kein Start-up) zu arbeiten
Du sprichst fließend Englisch, Deutsch ist kein Muss

Standort flexibel

Köln, Nordrhein-Westfalen, Deutschland

Development Alles erledigt

Deine Bewerbung wurde übermittelt

Anderer Job

Site Reliability Engineer

Vor 6 Tagen

Amalienbadstraße b, Karlsruhe, Germany Tipico Technology Services Vollzeit

Company Description Our LineupWe are Tipico, Germany's leading sports betting provider and one of the most dynamic tech companies in the industry. We approach every challenge like a Championship match, with a mission to excite the arena and elevate the betting experience for every customer. Our culture is energetic and ambitious—we play as a team to win...
Site Reliability Engineer für Application Hosting

vor 14 Stunden

Karlsruhe, Baden-Württemberg, Germany Ionos Se Vollzeit

Was erwartet dich?Du bist hauptsächlich für die Weiterentwicklung der Infrastruktur unserer Produkte verantwortlich und integrierst neue Produkte/Webdienste in unsere Kubernetes- und Cloud-InfrastrukturDu sorgst für den stabilen und sicheren Betrieb unserer Produktplattform und führst tiefgreifende Analysen sowie Optimierungen unserer containerisierten...
Site Reliability Engineer

Vor 4 Tagen

Köln, Deutschland gridscale GmbH Vollzeit

Bei uns gilt #OneTeam Komm zu gridscale und gestalte mit OVH die Zukunft der Cloud.Als führendes Tech-Unternehmen arbeiten wir seit über zwei Jahrzehnten daran, unseren ökologischen Fußabdruck zu reduzieren – mit innovativen Lösungen und einer offenen Cloud, die von Grund auf nachhaltig gedacht ist: #SustainableByDesign.Als Platform-Team betreiben wir...
Site Reliability Engineer

vor 10 Stunden

Hybrid, Remote in Germany coectAI Vollzeit

Deine Mission / Your mission: As a Site Reliability Engineer (all genders), your mission is to help maintain and further develop our internal self-service platform. This platform enables our development teams to deploy, monitor, and scale their applications efficiently - while upholding the highest standards of security, and reliability.Du bist...
Site Reliability Engineer

vor 15 Stunden

Hafenstraße Münster, Germany Raidboxes Vollzeit

Du möchtest in einem internationalen Engineering Team arbeiten, in dem du täglich Python und Linux verwendest? Bei uns kannst du mit modernen Technologien die optimale Lösung für unsere Kund:innen gestalten. Werde Teil von Raidboxes als Site Reliability Engineer (w/m/d), komplett remote oder in unserem Büro in Münster. Bewirb dich direkt onlineWas wir...
Project Engineer

vor 2 Wochen

Köln, Nordrhein-Westfalen, Deutschland g2 Recruitment Vollzeit

Project EngineerG2 Recruitment are working alongside our client to hire an experienced Solar Project EngineerContract length:12-month initial contractHours:5 days per weekWorking Pattern (Flexible Hours/Remote):Predominantly remote work with occasional visits to client sites across Germany (expenses paid for visits)Job Details:In this role, you will work...
Site Reliability Engineer

vor 17 Stunden

Wildunger Straße Frankfurt am Main, Hessen, Germany Deutsche WertpapierService Bank AG Vollzeit

Wir, die Deutsche WertpapierService Bank AG, sind der führende Dienstleister für Wertpapierservices im deutschen Finanzmarkt. Unser Ziel als verlässliche Bank und moderner Technologiedienstleister ist es, das Wertpapiergeschäft unserer rund 1.200 Kundeninstitute mit neuen Services und effizienten Prozessen zu fördern. Lassen Sie uns diese spannende...
Cloud Site Reliability Engineer

Vor 6 Tagen

Saarbrücker Str., Berlin-Bezirk Pankow, Germany Scalable Vollzeit

Company Description Scalable Capital is a leading digital investment and banking platform with a full banking licence, empowering people across Europe to shape their own finances. Scalable Broker makes it easy and affordable for clients to invest professionally in stocks, ETFs, cryptocurrencies, and derivatives, as well as set up savings plans. Scalable...
Senior DevOps Engineer

Vor 2 Tagen

Köln, Nordrhein-Westfalen, Deutschland MAM Gruppe Vollzeit

Senior DevOps EngineerLocation: North Rhine-Westphalia | HybridOur client is driving a major European data and AI transformation, building a next-generation engineering platform. As a DevOps Engineer, you'll design and maintain scalable, automated infrastructure that powers analytics and AI across multiple locations. This is a hands-on engineering role...
Database Reliability Engineer

Vor 6 Tagen

Germany (remote) ClickHouse Vollzeit

About ClickHouseRecognized on the 2025 Forbes Cloud 100 list, ClickHouse is one of the most innovative and fast-growing private cloud companies. With over 2,000 customers and ARR that has more than quadrupled over the past year, ClickHouse leads the market in real-time analytics, data warehousing, observability, and AI workloads. ClickHouse's incredible...

Amerika

Europa

Asien / Ozeanien

Afrika

Site Reliability Engineer