AI-Native - TechLead SRE H/F/N

À propos

OVHcloud, leader européen du cloud computing, est présent dans une quinzaine de pays et fournit des solutions d’hébergement et de cloud sécurisées, fiables et accessibles.

Dans un monde où le numérique occupe une place prédominante et est en constante évolution, nous croyons que l’avenir réside dans un cloud ouvert, fiable et durable, qui permet aux utilisateurs de choisir en toute liberté la façon dont ils souhaitent gérer leurs données.

Nous privilégions toujours le collectif, c’est pourquoi nous travaillons de manière rapprochée avec et pour notre écosystème composé tout d'abord de nos collaboratrices et collaborateurs, de nos clients, de nos partenaires et d’acteurs institutionnels.

  • Fondée en 1999

  • ∼3000 collaborateurs dans 14 pays

  • 46 datacentres

Descriptif du poste

AI-Native - TechLead SRE H/F/N

Au sein de votre équipe #OneTeam

  • Chez OVHcloud, Kafka constitue une brique partagée centrale : sa disponibilité, ses performances et sa bonne utilisation impactent l'entierté du SI.
  • Prendre des décisions d'architecture, de capacité et de gouvernance ayant un impact important chez nos utilisateurs, notamment pour anticiper les évolutions ou migrations.
  • Garantir la qualité de la plateforme qui influence directement la capacité d'OVHcloud à intégrer ses systèmes, partager des données en temps quasi réel et accélérer la livraison de projets internes.
  • Endosser un rôle de Tech Lead impliquant des prises de décisions et de la communication avec les différents acteurs lors d'incidents à la gravité variable. Porter une part de responsabilité budgétaire et de durabilité au regard des objectifs de fiabilité et de coût.


Vos principales responsabilités
  • Assurer la QoS et les SLO de la plateforme Kafka
  • Garantir l'application des bonnes pratiques SRE
  • Maintenir en condition opérationnelle (MCO) l'offre actuelle
  • Définir la roadmap technique du périmètre
  • Planifier les tâches au sein des sprints et les prioriser
  • Conseiller les clients dans leurs choix architecturaux relatifs à Kafka ou RabbitMQ


Votre futur impact

Dans 6 mois
  • Vous aurez acquis une vue d'ensemble de l'infrastructure et pris en main le RUN.
  • Vous maîtriserez votre périmètre en ayant instauré des standards de déploiement, d'observabilité et de sécurité.
  • Vous aurez commencé à orienter les choix techniques pour améliorer la résilience globale.


Et dans 1 an
  • Vous serez devenu le référent reconnu par l'entreprise sur les sujets Kafka/RabbitMQ.
  • Vous aurez généralisé l'automatisation pour que chaque tâche récurrente soit optimisée.
  • Vous aurez permis au périmètre de grandir sereinement sans impacter la charge de run.


Compétences requises :
  • Vous possédez une expertise Linux (système et réseau).
  • Vous maîtrisez la gestion de serveurs Bare Metal ainsi que l'administration de VMs sous VMware.
  • Vous avez une expérience confirmée avec Kubernetes.
  • Vous maîtrisez les outils "as code" et les gestionnaires de configuration (Terraform, Puppet, Ansible).
  • Vous développez dans l'un des langages suivants : Golang, Python ou Java.
  • Vous faites preuve de leadership, de capacité à déléguer et à prendre des décisions stratégiques rapidement (planification, vision roadmap, ouverture au changement).


C'est un +
  • Vous disposez d'une expertise sur Apache Kafka et/ou RabbitMQ.


Cette offre ne répond pas tout à fait à vos attentes ? Candidatez malgré tout !
C'est l'occasion de partager votre profil avec nos recruteurs, vous faire remarquer et peut-être recontacter pour une autre opportunité.

Cette offre ne répond pas tout à fait à vos attentes ? Candidatez spontanément sur le portail candidat pour rejoindre l'une de nos équipes !
L'occasion de partager votre profil avec nos recruteurs, vous faire remarquer et peut-être recontacter pour une autre opportunité.

Informations complémentaires

  • Type de contrat : CDI
  • Lieu : Nantes
  • Unknown