À propos

OVHcloud, leader européen du cloud computing, est présent dans une quinzaine de pays et fournit des solutions d’hébergement et de cloud sécurisées, fiables et accessibles.

Dans un monde où le numérique occupe une place prédominante et est en constante évolution, nous croyons que l’avenir réside dans un cloud ouvert, fiable et durable, qui permet aux utilisateurs de choisir en toute liberté la façon dont ils souhaitent gérer leurs données.

Nous privilégions toujours le collectif, c’est pourquoi nous travaillons de manière rapprochée avec et pour notre écosystème composé tout d'abord de nos collaboratrices et collaborateurs, de nos clients, de nos partenaires et d’acteurs institutionnels.

  • Fondée en 1999
  • 2 900 collaborateurs dans 15 pays
  • 40+ data centres

Descriptif du poste

SRE - BareMetal H/F/N

Au sein de votre équipe #OneTeam

  • Rejoindre l'équipe opérationnelle BareMetal.
  • Assurer un haut niveau de disponibilité et une restauration rapide des services en cas d'incident. Vous devrez œuvrer pour réduire les coûts liés au maintien des infrastructures et proposer un niveau de service maximal en automatisant les tâches. Participer à la maintenance de notre automatisation.
  • Participer au développement et au déploiement de nouvelles solutions telles que le monitoring des infrastructures, à la création de nouveaux outils ou l'amélioration des outils existants. Proposer et mettre en place de nouvelles technologies permettant d'améliorer la qualité de service.

Vos principales responsabilités
  • Troubleshooter et identifier les root causes des incidents.
  • Traiter les demandes transmises par les équipes support client ou d'autres équipes opérationnelles.
  • Créer et assurer le suivi des PostMortem en cas d'incident majeur.
  • Assurer la continuité de service 24h/24 (avec participation à des périodes d'astreintes, après plusieurs mois de présence).
  • Déployer et maintenir le parc interne BareMetal (Serveurs dédiés, VPS, Conteneur, API).
  • Proposer et mettre en place des solutions d'amélioration à court/moyen/long terme.
  • Développer des outils pour les équipes opérationnelles (niveau 1 et 2).
  • Développer et déployer des patchs et des nouvelles fonctionnalités pour gérer les infrastructures.


Votre futur impact

Dans 6 mois vous aurez
  • Maîtrisé l'environnement et les bases du support : Vous serez à l'aise avec les infrastructures BareMetal d'OVHcloud, capable de troubleshooter les incidents courants et de traiter les demandes des équipes internes, tout en contribuant aux tâches de maintenance et d'automatisation.
  • Développé des compétences opérationnelles concrètes : Vous aurez approfondi vos connaissances en système et réseau Unix, et mis en pratique vos compétences en scripting Bash pour développer des outils simples ou améliorer l'automatisation existante au sein de l'équipe BareMetal.


Et dans 1 an vous aurez
  • Assuré la continuité de service et l'amélioration continue : Vous serez un acteur clé des astreintes 24h/24, gérant les incidents majeurs avec des PostMortem efficaces, et aurez proposé et mis en place des solutions concrètes pour améliorer la qualité de service et optimiser les infrastructures.
  • Contribué activement au développement et au déploiement : Vous aurez participé de manière significative au développement de nouvelles solutions (monitoring, outils) et au déploiement de fonctionnalités ou patchs, en appliquant les bonnes pratiques CI/CD et en renforçant votre expertise technique sur le parc BareMetal.


Compétences requises :
  • Vous avez une maîtrise de l'anglais, tant à l'écrit qu'à l'oral, essentielle dans notre environnement international.
  • Vous possédez des connaissances solides en réseau (Unix et Cisco/Arista) et en système (Unix).
  • Vous maîtrisez le scripting Bash et avez de bonnes connaissances dans au moins un des langages suivants : Perl, Python et Go.
  • Vous faites preuve d'une compréhension des méthodes agiles et vous maîtrisez les bonnes pratiques de CI/CD.
  • De plus, vous êtes reconnu pour votre autonomie, votre prise de recul et sens analytique, ainsi que votre réactivité et votre rigueur.
  • Vous démontrez un fort sens du service client et une excellente notion des priorités face à des situations complexes.


C'est un +
  • La connaissance des référentiels ITIL v3/v4 et de Kubernetes est un atout supplémentaire qui serait apprécié.

Informations complémentaires

  • Type de contrat : CDI
  • Lieu : Toulouse
  • Unknown