Site Reliability Engineer

À propos

OVHcloud, leader européen du cloud computing, est présent dans une quinzaine de pays et fournit des solutions d’hébergement et de cloud sécurisées, fiables et accessibles.

Dans un monde où le numérique occupe une place prédominante et est en constante évolution, nous croyons que l’avenir réside dans un cloud ouvert, fiable et durable, qui permet aux utilisateurs de choisir en toute liberté la façon dont ils souhaitent gérer leurs données.

Nous privilégions toujours le collectif, c’est pourquoi nous travaillons de manière rapprochée avec et pour notre écosystème composé tout d'abord de nos collaboratrices et collaborateurs, de nos clients, de nos partenaires et d’acteurs institutionnels.

  • Fondée en 1999

  • ∼3000 collaborateurs dans 14 pays

  • 46 datacentres

Descriptif du poste

Site Reliability Engineer H/F/N

Au sein de votre équipe #OneTeam
Vous intégrez la Squad GPIO NEOS pour devenir un pilier de la nouvelle équipe SRE.
Votre rôle est hybride : vous êtes le garant du socle SRE moderne (K8s, Auto), tout en apportant une expertise réseau et en pilotant l'adoption de l'IA pour nos opérations.

Vos principales responsabilités

  • Infrastructure & Cloud : Vous maintenez et faites évoluer des clusters Kubernetes et des environnements OpenStack via Terraform et Ansible.
  • Administration Système : Vous assurez l'ingénierie système avancée sous Linux tout en garantissant l'intégration fluide avec les environnements Windows et MacOS.
  • Réseau Interne : Vous appliquez vos connaissances réseaux avancées pour gérer la connectivité et la segmentation des services internes.
  • Développement & Automatisation : Vous concevez des outils d'automatisation et des scripts de maintenance en Python ou Go intégrés aux pipelines CI/CD.
  • Observabilité : Vous configurez la surveillance proactive des systèmes et des réseaux via la stack Prometheus / Grafana.
  • Outillage IA : Vous utilisez et intégrez des assistants de code IA (Cursor, Copilot) pour accélérer le développement et optimiser les scripts de l'équipe.
  • Interface Utilisateur : Vous développez ponctuellement des dashboards internes en React pour visualiser l'état des services.


Votre futur impact

Dans 4 à 6 mois
  • Vous serez autonome sur l'administration complète de notre stack interne (OpenStack/K8s) et la gestion des interconnexions réseaux.
  • Vous contribuerez à moderniser nos opérations en ayant automatisé les tâches récurrentes grâce à vos développements assistés par l'IA.


Compétences requises :
  • Vous êtes issu(e) d'une formation BAC+5 avec un solide bagage en infrastructure et système.
  • Vous maîtrisez l'environnement Linux (niveau avancé) ainsi que les conteneurs (Docker, Kubernetes).
  • Vous possédez de solides compétences en Réseau (Routage, TCP/IP, Firewalling) indispensables pour ce poste.
  • Vous êtes à l'aise avec le développement logiciel backend (Python, Go) et avez des bases en frontend (React).
  • Vous avez une expérience concrète de l'Automatisation (Ansible, Terraform, CI/CD) et de l'observabilité (Prometheus).
  • Vous êtes expert Linux et curieux(se) des nouvelles méthodes de développement (IA Generative).


C'est un +
  • Vous avez déjà mis en place des solutions de monitoring intelligentes (IA).
  • Vous avez des connaissances sur la sécurisation des postes de travail (Network).


Cette offre ne répond pas tout à fait à vos attentes ? Candidatez malgré tout !
C'est l'occasion de partager votre profil avec nos recruteurs, vous faire remarquer et peut-être recontacter pour une autre opportunité.

Cette offre ne répond pas tout à fait à vos attentes ? Candidatez spontanément sur le portail candidat pour rejoindre l'une de nos équipes !
L'occasion de partager votre profil avec nos recruteurs, vous faire remarquer et peut-être recontacter pour une autre opportunité.

Informations complémentaires

  • Type de contrat : CDI
  • Lieu : Roubaix
  • Unknown