Site Reliability Engineer
vor 1 Woche
ATLAS ist die Servicegesellschaft der Deutschen Vermögensberatung AG (DVAG) und gestaltet zentrale Prozesse, Projekte und Services, die unsere Vermögensberater/-innen sowie ihre Kund/-innen erfolgreich machen. Im Herzen Frankfurts arbeiten wir mit Engagement, Eigenverantwortung und viel Gestaltungsfreiraum daran, die Basis für diesen Erfolg zu sichern – von IT über Organisation bis Kommunikation. Unsere Mitarbeitenden sind dabei der Schlüssel: Wir fördern Eigeninitiative, unterstützen einander und schaffen eine Arbeitsumgebung, in der man mit Neugier und Teamgeist viel bewegen kann.
StellenbeschreibungAls (Senior) Site ReliabilityEngineer (SRE) in der Abteilung IT Plattform übernehmen Sie eine entscheidende Rolle bei der Gewährleistung der nachhaltigen Betriebssicherheit unserer unternehmenskritischen Anwendungen. In dieser lateralen Führungsrolle arbeiten Sie eng mit den SREs in den Anwendungsentwicklungsteams zusammen, um Best Practices zu etablieren, die Zuverlässigkeit zu verbessern und operative Exzellenz zu fördern. Neben der strategischen Ausrichtung und dem Mentoring ist auch die operative Mitwirkung im Tagesgeschäft ein wichtiger Bestandteil Ihrer Aufgaben. Wir suchen eine Persönlichkeit mit ausgeprägter Hands-on-Mentalität, die bereit ist, sich aktiv in die Lösung komplexer Probleme einzubringen.
- Laterale Führung und Mentoring:
Sie agieren als Mentor/-in und Fachexpert/-in für SRE-Themen innerhalb der IT-Organisation, insbesondere für die SREs in den Entwicklungsteams. Sie fördern den Wissensaustausch und die Weiterentwicklung der SRE-Kompetenzen. - Entwicklung und Implementierung von SRE-Strategien:
In enger Zusammenarbeit mit den Entwicklungsteams und der IT Plattform definieren und implementieren Sie SRE-Prinzipien, Praktiken und Tools, um die Zuverlässigkeit, Performance und Effizienz unserer Anwendungen zu optimieren. - Definition und Überwachung von SLOs/SLAs:
Sie unterstützen die Entwicklungsteams bei der Definition von Service Level Objectives (SLOs) und Service Level Agreements (SLAs) für kritische Anwendungen und etablieren Mechanismen zur kontinuierlichen Überwachung und Einhaltung. - Incident Management und Post-Mortem-Analysen:
Sie wirken bei der Lösung von Incidents mit und fördern eine Kultur der transparenten Post-Mortem-Analysen, um aus Vorfällen zu lernen und präventive Maßnahmen abzuleiten. - Automatisierung und Infrastruktur als Code:
Sie treiben die Automatisierung wiederkehrender operativer Aufgaben voran und fördern den Einsatz von Infrastructure asCode (IaC), Praktiken zur Verbesserung der Stabilität und Reproduzierbarkeit unserer Infrastruktur. - Etablierung von Monitoring und Alerting:
Sie unterstützen bei der Konzeption und Implementierung von umfassenden Monitoring- und Alerting-Systemen, um Probleme frühzeitig zu erkennen und proaktiv zu handeln. - Operative Mitwirkung und Troubleshooting:
Sie packen aktiv mit an, wenn es um die Behebung von Incidents und die Durchführung von operativen Aufgaben geht. Die Analyse und das Troubleshooting komplexer Probleme in unserer Microservice-Architektur gehören ebenfalls zu Ihrem Verantwortungsbereich. - Förderung einer DevOps-Kultur:
Sie sind ein aktiver Verfechter der DevOps-Kultur und fördern die enge Zusammenarbeit und den Wissensaustausch zwischen Entwicklungs- und Betriebsteams.
- Qualifikation:
Abgeschlossenes Studium der Informatik, einer vergleichbaren Fachrichtung oder entsprechende Berufserfahrung. - Erfahrung:
Fundierte Erfahrung im Bereich Site Reliability Engineering (SRE) oder in einer vergleichbaren Rolle im operativen Umfeld komplexer IT-Systeme. - Zusammenarbeit:
Erfahrung in der Zusammenarbeit mit agilen Entwicklungsteams und ein tiefes Verständnis für den Softwareentwicklungszyklus. - Automatisierung:
Erfahrung mit Automatisierungswerkzeugen und Scripting-Sprachen und der Nutzung von Monitoring- und Logging-Tools (OpenTelemetry). - Cloud:
Vertrautheit mit Cloud-Umgebungen (Azure) und Containerisierungstechnologien (Kubernetes) und Erfahrung mit modernen Microservice-Architekturen und deren spezifischen Herausforderungen im Betrieb. - Mentalität:
Ausgeprägte analytische Fähigkeiten und eine strukturierte Herangehensweise bei der Problemlösung mit einer ausgeprägten Hands-on-Mentalität und die Bereitschaft, sich aktiv in operative Aufgaben und das Troubleshooting proaktiv einzubringen. - Kommunikation:
Hervorragende Kommunikations- und Kollaborationsfähigkeiten, um effektiv mit verschiedenen Teams und Stakeholdern zusammenzuarbeiten.
- Abwechslungsreiche Aufgaben
Vielseitige Projekte, Eigenverantwortung und Raum für individuelle Weiterentwicklung prägen Ihren Arbeitsalltag bei uns. - Faire und transparente Vergütung
Ihre Leistung honorieren wir mit einem attraktiven Vergütungspaket – klar strukturiert und nachvollziehbar. - Erholungszeit, die wirklich zählt
30 Urlaubstage pro Jahr sowie zusätzlich frei am 24. und 31. Dezember sorgen für spürbare Erholung. - Modernes Arbeitsumfeld
Unsere hochwertig ausgestatteten Arbeitsplätze und die moderne IT-Infrastruktur bieten optimale Bedingungen für produktives Arbeiten. - Flexibles Arbeiten
Arbeiten aus dem Home Office ist teils möglich – für mehr Freiheit bei der Gestaltung Ihres Alltags. - Kulinarische Vielfalt
Unser hauseigenes Restaurant serviert täglich frische Gerichte. Kaffeebars und kostenfreie Getränke stehen Ihnen auf allen Etagen zur Verfügung. - Zentrale Lage
Unser Standort im Herzen Frankfurts ist hervorragend mit dem Fahrrad, Bus und Bahn erreichbar. - Mehr als nur Benefits
Ob vergünstigtes Deutschlandticket, JobRad, EGYM Wellpass, Gesundheitsangebote oder betriebliche Altersvorsorge – bei uns profitieren Sie von zahlreichen Extras.
Und jetzt?
Neugierig geworden?
Dann freuen wir uns auf Ihre Bewerbung
Bei Fragen zur Position oder zum Bewerbungsprozess steht Ihnen unser Recruiting-Team gerne zur Seite.
Unser Bewerbungsverfahren ist transparent, unkompliziert – und Sie erhalten zeitnah eine Rückmeldung.
Werden Sie Teil von ATLAS – und gestalten Sie mit uns die Zukunft im Herzen Frankfurts.
-
Site Reliability Engineer
Vor 6 Tagen
Frankfurt am Main, Hessen, Deutschland Solactive AG Vollzeit 60.000 € - 120.000 € pro JahrCompany DescriptionSince its foundation in 2007, Solactive AG has evolved into one of the world's most important and fastest-growing index providers. From our headquarters in Frankfurt, we power global investment products across ETFs, structured products, and mandates. Our reputation is built on innovation, speed, flexibility, and strong partnerships.Job...
-
Senior Site Reliability Engineer
Vor 7 Tagen
Frankfurt am Main, Deutschland Crytek Vollzeit 80.000 € - 120.000 € pro JahrFrankfurt (Onsite) Programming / Engineering Hunt: Showdown 1896Crytek is looking for an experienced Senior Site Reliability Engineer to support Hunt: Showdown's NetOps department in our Frankfurt Studio.The person in this position will serve as the key liaison between development teams and the network operations team. They will drive operational excellence,...
-
Site Reliability Engineer
Vor 5 Tagen
Frankfurt am Main, Berlin, Deutschland Solactive AG Vollzeit 60.000 € - 120.000 € pro JahrCompany Description Since its foundation in 2007, Solactive AG has evolved into one of the world's most important and fastest-growing index providers. From our headquarters in Frankfurt, we power global investment products across ETFs, structured products, and mandates. Our reputation is built on innovation, speed, flexibility, and strong partnerships.Job...
-
Site Reliability Engineer
vor 1 Woche
Amalienbadstraße b, Karlsruhe, Germany Tipico Technology Services Vollzeit 80.000 € - 120.000 € pro JahrCompany Description Our LineupWe are Tipico, Germany's leading sports betting provider and one of the most dynamic tech companies in the industry. We approach every challenge like a Championship match, with a mission to excite the arena and elevate the betting experience for every customer. Our culture is energetic and ambitious—we play as a team to win...
-
Site Reliability Engineer
Vor 7 Tagen
Frankfurt am Main, Deutschland Crytek Vollzeit 90.000 € - 120.000 € pro JahrFrankfurt (Onsite) Programming / Engineering Hunt: Showdown 1896Crytek is looking for an experienced Site Reliability Engineer to support Hunt: Showdown's NetOps department in our Frankfurt Studio.The person in this position will serve as liaison between different development teams and the network operations team. They will work closely with the production...
-
Karlsruhe, Baden-Württemberg, Germany Ionos Se Vollzeit 60.000 € - 120.000 € pro JahrWas erwartet dich?Du bist hauptsächlich für die Weiterentwicklung der Infrastruktur unserer Produkte verantwortlich und integrierst neue Produkte/Webdienste in unsere Kubernetes- und Cloud-InfrastrukturDu sorgst für den stabilen und sicheren Betrieb unserer Produktplattform und führst tiefgreifende Analysen sowie Optimierungen unserer containerisierten...
-
Site Reliability Engineer
vor 3 Stunden
Frankfurt am Main, Hessen, Deutschland ATLAS Vertriebsservice GmbH Vollzeit 80.000 € - 120.000 € pro JahrUnternehmensbeschreibungATLAS ist die Servicegesellschaft der Deutschen Vermögensberatung AG (DVAG)und gestaltet zentrale Prozesse, Projekte und Services, die unsere Vermögensberater/-innen sowie ihre Kund/-innen erfolgreich machen. Im Herzen Frankfurts arbeiten wir mit Engagement, Eigenverantwortung und viel Gestaltungsfreiraum daran, die Basis für...
-
Site Reliability Engineer
Vor 7 Tagen
Frankfurt, Deutschland Deutsche WertpapierService Bank AG VollzeitSite Reliability Engineer (m/w/d) bei Deutsche WertpapierService Bank AG | softgarden View job here Site Reliability Engineer (m/w/d) Voll- oder Teilzeit Remote (hybrid) Mit Berufserfahrung 06.11.25 Wildunger Straße 14, 60487 Frankfurt am Main / Derendorfer Allee 2, 40476 Düsseldorf Einzigartiger Service braucht ein großartiges TeamWir, die Deutsche...
-
Site Reliability Engineer
vor 1 Woche
Frankfurt, Deutschland Deutsche WertpapierService Bank AG VollzeitSite Reliability Engineer (m/w/d) bei Deutsche WertpapierService Bank AG | softgarden View job here Site Reliability Engineer (m/w/d) Voll- oder Teilzeit Remote (hybrid) Mit Berufserfahrung 06.11.25 Wildunger Straße 14, 60487 Frankfurt am Main / Derendorfer Allee 2, 40476 Düsseldorf Einzigartiger Service braucht ein großartiges TeamWir, die Deutsche...
-
Site Reliability Engineer
Vor 5 Tagen
Frankfurt, Deutschland Solactive AG VollzeitCompany Description Since its foundation in 2007, Solactive AG has evolved into one of the world’s most important and fastest-growing index providers. From our headquarters in Frankfurt, we power global investment products across ETFs, structured products, and mandates. Our reputation is built on innovation, speed, flexibility, and strong partnerships. Job...