Senior Site Reliability Engineer

Eckdaten

Deutschland

Site Reliability Engineering (SRE)

Arbeitsmodell

Vollständig remote

Österreich +28 weitere

vor 3 Tagen

Stellenbeschreibung

Über Remote

Remote löst die größte Herausforderung moderner Unternehmen: die einfache und regelkonforme globale Beschäftigung. Wir ermöglichen es Unternehmen jeder Größe, internationale Teams einzustellen, zu bezahlen und zu verwalten. Mit unseren Grundwerten im Herzen und einer zukunftsorientierten Arbeitskultur arbeitet unser Team unermüdlich an ehrgeizigen Problemen – asynchron und rund um den Globus. Remoter arbeiten von 6 verschiedenen Kontinenten aus und alle unsere Stellen sind vollständig remote.

Da Innovation einer unserer Grundwerte ist, haben wir Automatisierungs- und KI-Funktionen in die Anforderungen für jede Rolle integriert.

Wir ermutigen jedes Mitglied des Remote-Teams, seine Talente, Erfahrungen und Kultur einzubringen, um die beste HR-Plattform ihrer Klasse aufzubauen.

Wenn Sie energiegeladen, neugierig, motiviert und ehrgeizig sind, werden Sie Teil unserer Welt. Bewerben Sie sich jetzt und definieren Sie die Zukunft der Arbeit!

Diese Position

Als Senior SRE bei Remote arbeiten Sie mit einem hohen Maß an Autonomie an komplexen Zuverlässigkeits- und Plattformproblemen. Sie planen und führen Funktionen und Projekte innerhalb unseres SRE/Plattform-Bereichs aus. Sie tragen zur Architektur und Zuverlässigkeitsstrategie der Plattform bei, übersetzen vage Anforderungen in robuste, wartbare Lösungen und heben das technische Niveau der Ingenieure um Sie herum, während Sie eng mit Produkt- und Sicherheitsteams in einer asynchronen, vollständig remote arbeitenden Umgebung zusammenarbeiten.

Sie arbeiten täglich KI-nativ und erstellen wiederverwendbare KI-Workflows, die das gesamte Team schneller und zuverlässiger machen, nicht nur Sie selbst.

Was Sie mitbringen

Fundierte Berufserfahrung in SRE, DevOps oder Platform Engineering.
Fundierte praktische Erfahrung mit Kubernetes: Betrieb und Skalierung von Produktionsclustern und Container-Tooling (Docker) sowie dessen Ökosystem.
Erfahrung im Aufbau und der Verwaltung von Cloud-Infrastruktur auf AWS (oder ähnlich).
Starke Infrastructure-as-Code-Praxis mit Terraform.
Erfahrung mit Zuverlässigkeits-Frameworks: SLOs, SLIs, Fehlerbudgets, Alarmierungsstrategien.
Fundierter Hintergrund im Bereich Observability: OpenTelemetry, Grafana/Prometheus oder ähnlich.
Kenntnisse in CI/CD (GitLab CI, GitHub Actions oder ähnlich) und Deployment-Automatisierung.
Sicherer Umgang mit Golang, Bash/Scripting; weitere Programmierkenntnisse sind ein Plus.
Praktische, eingebettete Nutzung von KI in Infra/Ops/Dev-Arbeit, agentische Workflows mit konkreten, beobachtbaren Ergebnissen.
Klare und durchdachte Kommunikation, insbesondere in einem asynchronen, globalen Umfeld.
Proaktiv, neugierig und bereit, Verantwortung für Herausforderungen zu übernehmen.
Kollaborativ und respektvoll gegenüber verschiedenen Kulturen, Zeitzonen und Hintergründen.

Wünschenswert

Erfahrung mit einer Backend-Programmiersprache (Elixir, Nodejs, Python, etc.).
Erfahrung im Betrieb und der Konfiguration von Linux-Systemen in einer Nicht-Cloud-Umgebung.
Sicherheitskenntnisse und -fähigkeiten aus defensiver und offensiver Sicht.

Ihre Aufgaben

Leitung der Lösungsfindung und Bereitstellung für Zuverlässigkeits- und Infrastrukturprobleme mit echter Mehrdeutigkeit, Komplexität oder Umfang.
Beitrag zur Architektur, den Tools und der Roadmap der Plattform.
Definition und Betrieb von Zuverlässigkeitspraktiken für unsere Plattform: SLOs/SLIs, Fehlerbudgets, Alarmierung, Observability.
Lösung von teamübergreifenden Anfragen, Identifizierung systemischer Probleme und Umwandlung in wiederverwendbare Korrekturen und Runbooks.
KI-natives Arbeiten und Operationalisierung für das Team: Standardmäßige Nutzung agentischer Workflows; Erstellung wiederverwendbarer Prompts, Skills und Tools.
Mentoring und konstruktives Feedback an weniger erfahrene Ingenieure; Teilnahme an Einstellungen, Onboarding und RFC-Diskussionen.
Zusammenarbeit mit der Sicherheit bei der Plattformhärtung und Risikominderung; Beitrag zur Kapazität und Kosteneffizienz der Infrastruktur.
Teilnahme an Incident-Response und On-Call-Rotationen.

Praktisches

Sie berichten an: SRE Team Lead
Team: Engineering
Standort: Aufgrund von Diversitäts- und Zeitzonenanforderungen priorisieren wir Europa.
Startdatum: So bald wie möglich.

Bewerbungsprozess

Interview mit Recruiter
Interview mit dem Hiring Manager
(Asynchrone) Infrastruktur-Übung (2 - 4 Stunden)
Interview mit dem Team
Bar Raiser Interview
Executive Interview
Angebot & Hintergrundüberprüfung

Vergütung & Vorteile

Die jährliche Gehaltsspanne für diese Vollzeitstelle beträgt 53.300 - 119.850 USD.

Arbeit von überall
Flexible bezahlte Freistellung
Flexible Arbeitszeiten (wir arbeiten asynchron)
16 Wochen bezahlte Elternzeit
Unterstützung bei psychischer Gesundheit
Aktienoptionen
Lernbudget
Home-Office-Budget & IT-Ausstattung
Budget für lokale soziale Events oder Co-Working-Spaces

Wie Sie sich bewerben

Bitte füllen Sie das untenstehende Formular aus und laden Sie Ihren Lebenslauf im PDF-Format hoch.
Wir bitten Sie, Ihre Bewerbung und Ihren Lebenslauf auf Englisch einzureichen.
Wenn Sie keinen aktuellen Lebenslauf haben, können Sie stattdessen einen Link zu Ihrem LinkedIn-Profil hinzufügen.

Wir ermutigen Menschen aller ethnischen Gruppen, Geschlechter, sexuellen Orientierungen, Altersgruppen, Fähigkeiten und Hintergründe, sich zu bewerben. Wir priorisieren ein Gefühl der Zugehörigkeit. Bitte teilen Sie uns mit, falls Sie während des Prozesses eine Unterkunft benötigen.

Weitere Remote Jobs im Bereich Site Reliability Engineering (SRE)

Head of Observability

Jobgether

Gestalten Sie die Observability-Strategie für eine skalierbare Plattform. Wir suchen eine Führungspersönlichkeit für eine Remote-Rolle in Deutschland.

Vollständig remote· Nur DE

vor 4 Tagen

DevOps Engineer Kubernetes / Go | Site Reliability Engineer | 100% remote mögl., bis 120.000 € (mwd)

Vesterling AG

Gestalten Sie als DevOps Engineer (mwd) eine Cloud-Plattform mit Kubernetes & Go. 100% remote möglich, bis 120.000 €. Jetzt bei Vesterling bewerben!

Vollständig remote· Nur Deutschland

vor 5 Tagen

Alle Remote Jobs im Bereich Site Reliability Engineering (SRE) anzeigen