SRE Network BareMetal

À propos

OVHcloud, leader européen du cloud computing, est présent dans une quinzaine de pays et fournit des solutions d’hébergement et de cloud sécurisées, fiables et accessibles.

Dans un monde où le numérique occupe une place prédominante et est en constante évolution, nous croyons que l’avenir réside dans un cloud ouvert, fiable et durable, qui permet aux utilisateurs de choisir en toute liberté la façon dont ils souhaitent gérer leurs données.

Nous privilégions toujours le collectif, c’est pourquoi nous travaillons de manière rapprochée avec et pour notre écosystème composé tout d'abord de nos collaboratrices et collaborateurs, de nos clients, de nos partenaires et d’acteurs institutionnels.

  • Fondée en 1999
  • 2 900 collaborateurs dans 15 pays
  • 40+ data centres

Descriptif du poste

SRE Network BareMetal H/F/N

Au sein de votre équipe #OneTeam

  • Au sein du groupe Infrastructure, rejoindre l'équipe en charge de soutenir l'ambition et la croissance d'OVHcloud en mettant à l'échelle, déployant, opérant et gérant toutes les infrastructures réseau, tout en supportant les services réseau associés.
  • En tant que Site Reliability Engineer, vous contribuerez à construire une plateforme résiliente, scalable et efficiente en réduisant les coûts opérationnels et en favorisant l'excellence des services.


Vos principales responsabilités
  • Évaluer et prioriser les incidents affectant l'infrastructure et les plateformes logicielles d'OVHcloud
  • Dépanner les problèmes techniques complexes et coordonner les efforts interfonctionnels pour les résoudre
  • Proposer et mettre en œuvre les meilleures pratiques pour garantir que les incidents sont traités de manière permanente et ne se reproduisent pas
  • Participer aux rotations d'astreinte pour assurer la continuité des services
  • Collaborer avec les équipes de développement et d'infrastructure pour éliminer les goulots d'étranglement, améliorer les performances et réduire les coûts opérationnels
  • Contribuer aux revues post-incidents et aux post-mortems
  • Fournir un support technique aux propriétaires d'applications et aux parties prenantes des pipelines CI/CD
  • Travailler dans un environnement d'infrastructure IT fortement orienté réseau


Votre futur impact

Dans 6 mois
  • Vous gérerez les incidents de manière autonome, en apportant des solutions concrètes et durables. Vous aurez contribué activement aux astreintes et maîtrisé nos outils de monitoring.
  • Vous aurez identifié et commencé à résoudre des points faibles précis de l'infrastructure, notamment via des automatisations en Python ou Go.
  • Vous serez un membre essentiel de l'équipe, apportant votre expertise lors des revues post-incidents et soutenant les équipes applicatives.


Et dans 1 an
  • Vous piloterez des projets majeurs pour améliorer la performance et réduire les coûts, en intégrant des solutions SRE avancées et en étant un référent technique.
  • Vos contributions auront un impact direct sur la stratégie d'infrastructure. Vous partagerez votre savoir et contribuerez à faire évoluer les pratiques d'excellence au sein d'OVHcloud.
  • Vous maîtriserez en profondeur l'écosystème réseau et logiciel, capable de résoudre les défis les plus complexes et de proposer des améliorations structurelles.


Compétences requises :
  • Vous maîtrisez l'anglais et le français, tant à l'écrit qu'à l'oral
  • Vous avez une solide connaissance des systèmes internes Unix/Linux
  • Vous êtes compétent en développement logiciel (Python, Go, Perl)
  • Vous avez de l'expérience dans l'exploitation de systèmes distribués
  • Vous êtes familier avec les technologies de conteneurisation (Docker, Kubernetes)
  • Vous avez une bonne compréhension des outils, plateformes et processus liés au CI/CD/CA
  • Vous avez une expérience pratique avec les pipelines de données et les systèmes de messagerie/pub-sub (RabbitMQ, Redis, Kafka)
  • Vous avez une bonne connaissance des outils de monitoring (Prometheus, Grafana) et des meilleures pratiques associées
  • Vous faites preuve d'un solide esprit d'analyse et d'une capacité à résoudre des problèmes complexes.
  • Vous possédez d'excellentes compétences en communication et en collaboration d'équipe
  • Vous êtes enthousiaste à l'idée de travailler sur des infrastructures à grande échelle et à haute disponibilité


C'est un +
  • Vous êtes à l'aise avec les réseaux (la connaissance de VXLAN est un atout)

Informations complémentaires

  • Type de contrat : CDI
  • Lieu : Paris
  • Unknown