Analista de SRE Pleno (Remoto)

Descrição da vaga:

Papel da empresa: Estamos buscando um(a) Analista de SRE Pleno para atuar na sustentação e evolução de ambientes produtivos críticos, com foco em confiabilidade, disponibilidade e melhoria contínua. Se você gosta de resolver problemas complexos, trabalhar com cloud e ambientes containerizados e evoluir práticas de observabilidade e automação, essa oportunidade é para você.


Como será o seu dia a dia:

  • Atuar na sustentação e troubleshooting de ambientes produtivos.
  • Participar da resposta a incidentes, apoiando mitigação e análise de causa raiz.
  • Implementar e acompanhar práticas de SRE (SLI, SLO, melhoria contínua baseada em dados).
  • Criar e evoluir dashboards, métricas e alertas, com foco em redução de ruído.
  • Apoiar a condução e execução de mudanças (GMUD), garantindo validação e acompanhamento pós-implantação.
  • Atuar na operação de workloads em cloud e ambientes containerizados.
  • Contribuir com iniciativas de automação e melhoria estrutural da operação.
  • Trabalhar de forma colaborativa com times de desenvolvimento, infraestrutura e arquitetura.


O que buscamos:

  • Experiência com operação/sustentação de ambientes produtivos.
  • Conhecimento em Docker e Kubernetes Noções de Prometheus.
  • Experiência ou familiaridade com Zabbix Conhecimento em Datadog e/ou OpenTelemetry.
  • Conhecimento em fundamentos de AWS (Cloud Practitioner ou equivalente).
  • Noções em Azure (AZ-900) e/ou GCP (Cloud Digital Leader).
  • Entendimento de redes em cloud, IAM, alta disponibilidade e serviços gerenciados.
  • Conhecimento em ITIL v4 Vivência com Change Management (GMUD).
  • Boa capacidade analítica, pensamento crítico e comunicação clara.
  • Perfil proativo e orientado a melhoria contínua.


Hard Skills:

  • Experiência com sustentação e troubleshooting de ambientes produtivos.
  • Vivência em resposta a incidentes e análise de causa raiz.
  • Noções práticas de SRE, como definição e acompanhamento de SLI e SLO.
  • Experiência com monitoramento e observabilidade utilizando ferramentas como Prometheus, Zabbix ou Datadog.
  • Conhecimento em containers com Docker e orquestração com Kubernetes.
  • Fundamentos de cloud, preferencialmente Amazon Web Services, com noções em outras clouds.
  • Entendimento básico de redes, IAM e alta disponibilidade em cloud.
  • Conhecimento em ITIL e processos de Change Management.


Soft Skills:

  • Boa capacidade analítica para investigação de problemas.
  • Comunicação clara e objetiva.
  • Perfil colaborativo para atuação com times técnicos.
  • Proatividade e foco em melhoria contínua.
  • Organização e responsabilidade em ambientes críticos.


Diferenciais:

  • Noções de Kafka.
  • Experiência ou familiaridade com RabbitMQ Noções em MySQL, PostgreSQL e MongoDB.
  • Experiência prévia em ambientes de alta disponibilidade.
  • Participação em iniciativas de automação ou melhoria de confiabilidade.


O que oferecemos:

  1. 🏥 Auxílio médico: ajuda de custo mensal para apoiar na contratação do seu plano de saúde.
  2. 💪 Wellhub, pra manter corpo e mente ativos, do jeito que você gosta.
  3. 🧠 Terapia online 100% custeada pela empresa, porque saúde mental importa.
  4. 🥗 Atendimento em nutrição online, com até 2 consultas mensais para cuidar da sua saúde alimentar.
  5. 🛡️ Seguro de vida com apólice no valor de R$ 125 mil, garantindo mais segurança para você e sua família.
  6. 🎉 Day off no aniversário, porque o seu dia merece ser especial.
  7. 🌴 Descanso remunerado, para que você possa recarregar as energias.
  8. 🏆 Gamificação interna, transformando conquistas em prêmios e reconhecimento.
  9. 🎓 Parcerias educacionais com faculdades como FIAP, Anhanguera e Instituto Infnet, pra apoiar seu crescimento e aprendizado.
  10. 📚 Bônus por certificação técnica, reconhecendo e recompensando seu esforço em aprender.


Valorizamos cada voz e cada pessoa, porque sabemos que a diversidade nos torna mais inovadores e fortes.

Localização
Modelo de contratação
Modelo de trabalho
São Paulo, SP, BR
Autônomo PJ
Remoto