Site Reliability Engineer
Vor 2 Tagen
Bei uns gilt #OneTeam Komm zu gridscale und gestalte mit OVH die Zukunft der Cloud.
Als führendes Tech-Unternehmen arbeiten wir seit über zwei Jahrzehnten daran, unseren ökologischen Fußabdruck zu reduzieren – mit innovativen Lösungen und einer offenen Cloud, die von Grund auf nachhaltig gedacht ist: #SustainableByDesign.
Als Platform-Team betreiben wir die zentrale API-Infrastruktur für unsere Edge-Standorte und stellen die Developer Tools bereit, die unsere Teams benötigen. Du brennst für standortübergreifende Cloud-Umgebungen und Edge-Technologien? Dann bist du hier richtig.
Unser Tech Stack
•Kubernetes
•GitOps
•Ansible
•Terraform
•Prometheus
•FluxCD
•Grafana
•Linux
•OpenStack
•Baremetal
Als SRE wirst du Teil eines Teams, das für unseren zentralen API-Stack an den Edge-Standorten verantwortlich ist. Du arbeitest an der Konzeption, Automatisierung und dem Betrieb unserer Plattform und treibst kontinuierliche Verbesserungen voran. Wir suchen jemanden, der sich in einem sicherheitsorientierten Umfeld mit hohem Automatisierungsgrad (GitOps) wohlfühlt. Während ein gewisser Fokus auf der Observability unserer Systeme liegt, bist du als Senior in der Lage, die Schwerpunkte deiner Rolle aktiv mitzugestalten, basierend auf deinen Stärken und Interessen. Du bist es gewohnt, in unklaren Situationen den Überblick zu bewahren, Systeme zu analysieren und auf dieser Basis fundierte Entscheidungen zu treffen.
Du entwickelst und pflegst unsere Infrastructure as Code mit Tools wie Ansible und Terraform
Du treibst die Weiterentwicklung unseres Kubernetes-Stacks und implementierst GitOps-Workflows (z. B. mit FluxCD)
Du entwickelst und betreibst Observability-Lösungen (Monitoring, Logging, Tracing) und stehst hier auch anderen Teams als Ansprechpartner und Mentor zur Seite
Du bringst dich aktiv in die Systemanalyse ein und leitest Verbesserungen ab – auch bei anfangs unklaren Anforderungen
Du nimmst an einer rotierenden Rufbereitschaft teil
Die Möglichkeit, mit neuesten Technologien einen echten Mehrwert zu leisten
Spannende tägliche Herausforderungen und eine steile Lernkurve
Deutschlandweite Standorte: Wähle frei zwischen Köln, Frankfurt, Hamburg, München oder Saarbrücken- unser Team trifft sich regelmäßig im Kölner Office für Teamevents.
Deine Arbeitszeiten kannst Du frei und individuell gestalten
Ein offenes Ohr und Raum für eigene Ideen und Experimente
Persönliches Budget sowie Urlaubstage für Weiterbildungen, Schulungen und Konferenzen, über das du selbst entscheiden kannst
Ein attraktives, faires Gehalt und die von dir bevorzugte Hardware
Eine Pluxee Shopping Card in Höhe von 50 EUR netto/Monat
27 Tage Urlaub sind nicht genug? Wir garantieren dir weitere 20 Tage unbezahlten Urlaub sowie die Möglichkeit auf Workation
Deine Berufserfahrung ist uns wichtiger als deine Ausbildung
Du bringst mehrjährige Erfahrung als Platform Engineer, DevOps Engineer oder SRE mit
Deine technischen Skills: Du hast Erfahrung in den Bereichen Infrastructure as code (Ansible, Terraform), GitOps (FluxCD), Kubernetes, OpenStack, sowie Monitoring-, Logging- und Tracing-Tools (z.B. Mimir, Loki, Grafana, Tempo)
Du hast Erfahrung damit, in sicherheitskritischen Umgebungen zu arbeiten und verstehst die damit verbundenen Anforderungen
Du bist in der Lage, dich schnell in neue Systeme einzuarbeiten und eigenständig Lösungen zu erarbeiten
Du bist kommunikationsstark und hast Spaß daran, dein Wissen weiterzugeben
Du fühlst dich wohl, in einem strukturierten Unternehmensumfeld (kein Start-up) zu arbeiten
Du sprichst fließend Englisch, Deutsch ist kein Muss
- Köln, Nordrhein-Westfalen, Deutschland
Deine Bewerbung wurde übermittelt
Anderer Job-
Site Reliability Engineer
Vor 6 Tagen
Amalienbadstraße b, Karlsruhe, Germany Tipico Technology Services VollzeitCompany Description Our LineupWe are Tipico, Germany's leading sports betting provider and one of the most dynamic tech companies in the industry. We approach every challenge like a Championship match, with a mission to excite the arena and elevate the betting experience for every customer. Our culture is energetic and ambitious—we play as a team to win...
-
Site Reliability Engineer für Application Hosting
vor 14 Stunden
Karlsruhe, Baden-Württemberg, Germany Ionos Se VollzeitWas erwartet dich?Du bist hauptsächlich für die Weiterentwicklung der Infrastruktur unserer Produkte verantwortlich und integrierst neue Produkte/Webdienste in unsere Kubernetes- und Cloud-InfrastrukturDu sorgst für den stabilen und sicheren Betrieb unserer Produktplattform und führst tiefgreifende Analysen sowie Optimierungen unserer containerisierten...
-
Site Reliability Engineer
Vor 4 Tagen
Köln, Deutschland gridscale GmbH VollzeitBei uns gilt #OneTeam Komm zu gridscale und gestalte mit OVH die Zukunft der Cloud.Als führendes Tech-Unternehmen arbeiten wir seit über zwei Jahrzehnten daran, unseren ökologischen Fußabdruck zu reduzieren – mit innovativen Lösungen und einer offenen Cloud, die von Grund auf nachhaltig gedacht ist: #SustainableByDesign.Als Platform-Team betreiben wir...
-
Site Reliability Engineer
vor 10 Stunden
Hybrid, Remote in Germany coectAI VollzeitDeine Mission / Your mission: As a Site Reliability Engineer (all genders), your mission is to help maintain and further develop our internal self-service platform. This platform enables our development teams to deploy, monitor, and scale their applications efficiently - while upholding the highest standards of security, and reliability.Du bist...
-
Site Reliability Engineer
vor 15 Stunden
Hafenstraße Münster, Germany Raidboxes VollzeitDu möchtest in einem internationalen Engineering Team arbeiten, in dem du täglich Python und Linux verwendest? Bei uns kannst du mit modernen Technologien die optimale Lösung für unsere Kund:innen gestalten. Werde Teil von Raidboxes als Site Reliability Engineer (w/m/d), komplett remote oder in unserem Büro in Münster. Bewirb dich direkt onlineWas wir...
-
Project Engineer
vor 2 Wochen
Köln, Nordrhein-Westfalen, Deutschland g2 Recruitment VollzeitProject EngineerG2 Recruitment are working alongside our client to hire an experienced Solar Project EngineerContract length:12-month initial contractHours:5 days per weekWorking Pattern (Flexible Hours/Remote):Predominantly remote work with occasional visits to client sites across Germany (expenses paid for visits)Job Details:In this role, you will work...
-
Site Reliability Engineer
vor 17 Stunden
Wildunger Straße Frankfurt am Main, Hessen, Germany Deutsche WertpapierService Bank AG VollzeitWir, die Deutsche WertpapierService Bank AG, sind der führende Dienstleister für Wertpapierservices im deutschen Finanzmarkt. Unser Ziel als verlässliche Bank und moderner Technologiedienstleister ist es, das Wertpapiergeschäft unserer rund 1.200 Kundeninstitute mit neuen Services und effizienten Prozessen zu fördern. Lassen Sie uns diese spannende...
-
Cloud Site Reliability Engineer
Vor 6 Tagen
Saarbrücker Str., Berlin-Bezirk Pankow, Germany Scalable VollzeitCompany Description Scalable Capital is a leading digital investment and banking platform with a full banking licence, empowering people across Europe to shape their own finances. Scalable Broker makes it easy and affordable for clients to invest professionally in stocks, ETFs, cryptocurrencies, and derivatives, as well as set up savings plans. Scalable...
-
Senior DevOps Engineer
Vor 2 Tagen
Köln, Nordrhein-Westfalen, Deutschland MAM Gruppe VollzeitSenior DevOps EngineerLocation: North Rhine-Westphalia | HybridOur client is driving a major European data and AI transformation, building a next-generation engineering platform. As a DevOps Engineer, you'll design and maintain scalable, automated infrastructure that powers analytics and AI across multiple locations. This is a hands-on engineering role...
-
Database Reliability Engineer
Vor 6 Tagen
Germany (remote) ClickHouse VollzeitAbout ClickHouseRecognized on the 2025 Forbes Cloud 100 list, ClickHouse is one of the most innovative and fast-growing private cloud companies. With over 2,000 customers and ARR that has more than quadrupled over the past year, ClickHouse leads the market in real-time analytics, data warehousing, observability, and AI workloads. ClickHouse's incredible...