Senior Site Reliability Engineer

Eckdaten

Deutschland
Site Reliability Engineering (SRE)

Arbeitsmodell

Vollständig remote
Österreich +28 weitere
vor 3 Tagen
Stellenbeschreibung

Über Remote

Remote löst die größte Herausforderung moderner Unternehmen: die einfache und regelkonforme globale Beschäftigung. Wir ermöglichen es Unternehmen jeder Größe, internationale Teams einzustellen, zu bezahlen und zu verwalten. Mit unseren Grundwerten im Herzen und einer zukunftsorientierten Arbeitskultur arbeitet unser Team unermüdlich an ehrgeizigen Problemen – asynchron und rund um den Globus. Remoter arbeiten von 6 verschiedenen Kontinenten aus und alle unsere Stellen sind vollständig remote.

Da Innovation einer unserer Grundwerte ist, haben wir Automatisierungs- und KI-Funktionen in die Anforderungen für jede Rolle integriert.

Wir ermutigen jedes Mitglied des Remote-Teams, seine Talente, Erfahrungen und Kultur einzubringen, um die beste HR-Plattform ihrer Klasse aufzubauen.

Wenn Sie energiegeladen, neugierig, motiviert und ehrgeizig sind, werden Sie Teil unserer Welt. Bewerben Sie sich jetzt und definieren Sie die Zukunft der Arbeit!

Diese Position

Als Senior SRE bei Remote arbeiten Sie mit einem hohen Maß an Autonomie an komplexen Zuverlässigkeits- und Plattformproblemen. Sie planen und führen Funktionen und Projekte innerhalb unseres SRE/Plattform-Bereichs aus. Sie tragen zur Architektur und Zuverlässigkeitsstrategie der Plattform bei, übersetzen vage Anforderungen in robuste, wartbare Lösungen und heben das technische Niveau der Ingenieure um Sie herum, während Sie eng mit Produkt- und Sicherheitsteams in einer asynchronen, vollständig remote arbeitenden Umgebung zusammenarbeiten.

Sie arbeiten täglich KI-nativ und erstellen wiederverwendbare KI-Workflows, die das gesamte Team schneller und zuverlässiger machen, nicht nur Sie selbst.

Was Sie mitbringen

  • Fundierte Berufserfahrung in SRE, DevOps oder Platform Engineering.
  • Fundierte praktische Erfahrung mit Kubernetes: Betrieb und Skalierung von Produktionsclustern und Container-Tooling (Docker) sowie dessen Ökosystem.
  • Erfahrung im Aufbau und der Verwaltung von Cloud-Infrastruktur auf AWS (oder ähnlich).
  • Starke Infrastructure-as-Code-Praxis mit Terraform.
  • Erfahrung mit Zuverlässigkeits-Frameworks: SLOs, SLIs, Fehlerbudgets, Alarmierungsstrategien.
  • Fundierter Hintergrund im Bereich Observability: OpenTelemetry, Grafana/Prometheus oder ähnlich.
  • Kenntnisse in CI/CD (GitLab CI, GitHub Actions oder ähnlich) und Deployment-Automatisierung.
  • Sicherer Umgang mit Golang, Bash/Scripting; weitere Programmierkenntnisse sind ein Plus.
  • Praktische, eingebettete Nutzung von KI in Infra/Ops/Dev-Arbeit, agentische Workflows mit konkreten, beobachtbaren Ergebnissen.
  • Klare und durchdachte Kommunikation, insbesondere in einem asynchronen, globalen Umfeld.
  • Proaktiv, neugierig und bereit, Verantwortung für Herausforderungen zu übernehmen.
  • Kollaborativ und respektvoll gegenüber verschiedenen Kulturen, Zeitzonen und Hintergründen.

Wünschenswert

  • Erfahrung mit einer Backend-Programmiersprache (Elixir, Nodejs, Python, etc.).
  • Erfahrung im Betrieb und der Konfiguration von Linux-Systemen in einer Nicht-Cloud-Umgebung.
  • Sicherheitskenntnisse und -fähigkeiten aus defensiver und offensiver Sicht.

Ihre Aufgaben

  • Leitung der Lösungsfindung und Bereitstellung für Zuverlässigkeits- und Infrastrukturprobleme mit echter Mehrdeutigkeit, Komplexität oder Umfang.
  • Beitrag zur Architektur, den Tools und der Roadmap der Plattform.
  • Definition und Betrieb von Zuverlässigkeitspraktiken für unsere Plattform: SLOs/SLIs, Fehlerbudgets, Alarmierung, Observability.
  • Lösung von teamübergreifenden Anfragen, Identifizierung systemischer Probleme und Umwandlung in wiederverwendbare Korrekturen und Runbooks.
  • KI-natives Arbeiten und Operationalisierung für das Team: Standardmäßige Nutzung agentischer Workflows; Erstellung wiederverwendbarer Prompts, Skills und Tools.
  • Mentoring und konstruktives Feedback an weniger erfahrene Ingenieure; Teilnahme an Einstellungen, Onboarding und RFC-Diskussionen.
  • Zusammenarbeit mit der Sicherheit bei der Plattformhärtung und Risikominderung; Beitrag zur Kapazität und Kosteneffizienz der Infrastruktur.
  • Teilnahme an Incident-Response und On-Call-Rotationen.

Praktisches

  • Sie berichten an: SRE Team Lead
  • Team: Engineering
  • Standort: Aufgrund von Diversitäts- und Zeitzonenanforderungen priorisieren wir Europa.
  • Startdatum: So bald wie möglich.

Bewerbungsprozess

  • Interview mit Recruiter
  • Interview mit dem Hiring Manager
  • (Asynchrone) Infrastruktur-Übung (2 - 4 Stunden)
  • Interview mit dem Team
  • Bar Raiser Interview
  • Executive Interview
  • Angebot & Hintergrundüberprüfung

Vergütung & Vorteile

Die jährliche Gehaltsspanne für diese Vollzeitstelle beträgt 53.300 - 119.850 USD.

  • Arbeit von überall
  • Flexible bezahlte Freistellung
  • Flexible Arbeitszeiten (wir arbeiten asynchron)
  • 16 Wochen bezahlte Elternzeit
  • Unterstützung bei psychischer Gesundheit
  • Aktienoptionen
  • Lernbudget
  • Home-Office-Budget & IT-Ausstattung
  • Budget für lokale soziale Events oder Co-Working-Spaces

Wie Sie sich bewerben

  • Bitte füllen Sie das untenstehende Formular aus und laden Sie Ihren Lebenslauf im PDF-Format hoch.
  • Wir bitten Sie, Ihre Bewerbung und Ihren Lebenslauf auf Englisch einzureichen.
  • Wenn Sie keinen aktuellen Lebenslauf haben, können Sie stattdessen einen Link zu Ihrem LinkedIn-Profil hinzufügen.

Wir ermutigen Menschen aller ethnischen Gruppen, Geschlechter, sexuellen Orientierungen, Altersgruppen, Fähigkeiten und Hintergründe, sich zu bewerben. Wir priorisieren ein Gefühl der Zugehörigkeit. Bitte teilen Sie uns mit, falls Sie während des Prozesses eine Unterkunft benötigen.