Please mention DailyRemote when applying
Whitestack despliega nubes privadas en distintas capitales de Latinoamérica. En cada uno de estos sitios opera decenas o incluso cientos de servidores, interconectados mediante redes de alta velocidad y diseñados para soportar aplicaciones de misión crítica incluyendo el tráfico de voz de operadores móviles, lo que exige niveles de disponibilidad cercanos al 99,999%.
Por esta razón estamos buscando a los mejores ingenieros para su área de Cloud Support, puestos de gran relevancia para garantizar la continuidad de la operación de grandes centros de datos, los que soportan las aplicaciones e infraestructura de telecomunicaciones críticas e ininterrumpidas que desplegamos.
El Cloud NOC Engineer es el guardián de esta infraestructura. Su misión es el monitoreo proactivo 24/7 de la salud de los centros de datos, detectando anomalías antes de que afecten el servicio. Es el primer frente de respuesta, encargado de la gestión integral de incidentes: desde la detección y apertura de tickets hasta la resolución de fallas de complejidad baja/media y el escalamiento técnico estructurado hacia los niveles L1/L2.
Este rol está disponible para trabajo remoto desde las siguientes ubicaciones: México, Chile, Argentina, Colombia, Uruguay y Perú.
Shifts disponibles: México, Colombia, Perú desde la 1PM. / Argentina, Chile, Uruguay desde las 8AM.
Monitoreo Proactivo: Vigilancia constante de dashboards y alertas (infraestructura física, virtual y servicios) para garantizar la disponibilidad del 99,999%.
Gestión de Incidentes (Triage): Recepción, categorización y priorización de alertas. Apertura y seguimiento riguroso de tickets bajo metodologías ITIL.
Resolución Técnica Inicial: Diagnóstico y resolución de fallas de complejidad baja y media (ej. reinicio de servicios, limpieza de logs, ajustes de cuotas, verificación de conectividad básica).
Escalamiento Estructurado: Cuando la complejidad supera el nivel inicial, escalar a L1/L2 entregando un reporte técnico completo (logs, trazas de red, pasos de reproducción y contexto del cliente).
Documentación de Casos: Mantener actualizada la bitácora de eventos y la base de conocimientos (KB) sobre incidentes recurrentes.
Comunicación Externa: Notificar a los clientes sobre estados de salud, ventanas de mantenimiento e incidentes en curso de forma clara y oportuna.
Health Checks: Ejecución de rutinas periódicas de validación de salud en plataformas productivas.
Velar por el cumplimiento de SLA de incidencias y disponibilidad de red y servicios
Generación y análisis de reportes de disponibilidad de las plataformas
Experiencia:
Al menos 1-2 años en centros de monitoreo (NOC), soporte técnico de primer nivel o administración de sistemas.
Experiencia en manejo de tickets y procesos de soporte (Jira, ServiceNow u otros), incluyendo documentación clara de diagnóstico, evidencias y comunicación.
Experiencia en manejo de herramientas de Monitoreo/Observabilidad como Prometheus, Grafana, Elasticsearch, Opensearch, OpenNMS. Lectura e interpretación de métricas, eventos, logs, alarmas.
Experiencia en sistemas productivos de misión crítica, incluyendo gestión de incidentes, coordinación de acciones en producción, escalamiento y comunicación efectiva.
Formación:
Ingeniería Informática, Ingeniería de Sistemas, Ingeniería Electrónica, o afín.
Conocimientos Específicos / Requisitos Técnicos:
Linux en entornos productivos: troubleshooting de servicios y sistema operativo (systemd, journalctl), permisos/usuarios, procesos, filesystem y redes.
Networking en Linux: configuración y diagnóstico de interfaces, VLANs, rutas, bonding y MTU; troubleshooting con herramientas como tcpdump (sniffing), ip, ss, ethtool, ping/traceroute
Kubernetes: operación/administración y troubleshooting en producción (Pods, Deployments/DaemonSets, Services, eventos/logs, readiness/liveness; nociones de storage PV/PVC).
Virtualización: experiencia operando y dando soporte a entornos virtualizados (KVM/VMware/Hyper-V u otros), incluyendo diagnóstico de fallas comunes de cómputo, red y almacenamiento.
Automatización: capacidad para resolver tareas repetibles mediante Bash y Ansible y/o Python (recolección de información, checks operativos, remediación básica, scripts seguros para producción).
Inglés intermedio para leer/escribir documentación técnica, realizar actualizaciones a stakeholders e interactuar con proveedores/fabricantes ante casos de soporte.
Requisitos Profesionales
Autonomía (para lograr los mejores resultados)
Adherencia a estándares de clase mundial
Orientación al objetivo.
Apertura de aprender nuevas tecnologías
Pensamiento analítico
Trabajo en equipo (para coordinar con equipos de desarrollo y despliegue de productos)
Rápida adaptación a un entorno altamente dinámico
Requisitos Deseables Técnicos
Experiencia en OpenStack (operación, troubleshooting o administración) y/o KVM
Conocimientos del modelo de operación de una red Fija o Móvil.
Experiencia integrando y operando proyectos de código abierto en ambientes productivos.
Networking intermedio: BGP, EVPN-VXLAN, etc.
Certificaciones: Linux, OpenStack, Kubernetes Administrator (CKA u otras).
Cursos en Ansible y/o Bash scripting.
Conocimientos en ITIL (Gestión de Incidentes, Requerimientos, Problemas, Cambios) y/o Scrum.
Whitestack es una empresa líder en Latinoamérica especializada en soluciones en la nube e infraestructura digital híper-escalable. Trabajamos con tecnología de código abierto y los más altos estándares de la industria para impulsar la transformación digital en toda la región. Somos un Great Place to Work, donde la innovación, la colaboración y el desarrollo personal son parte de nuestra esencia.
¿Por qué unirte a Whitestack?
🌎 Proyección internacional: Participa en iniciativas globales y viaja para colaborar con equipos en distintos países.
⚖️ Equilibrio real: Diseñamos políticas que se ajustan a tu estilo de vida y te permiten trabajar con autonomía y propósito.
📈 Crecimiento claro: Te ofrecemos una línea de carrera sólida en liderazgo y tecnología.
Salud primero: Seguro médico privado para ti y tu familia.
📚 Aprendizaje sin límites: Acceso a cursos, libros, materiales y reembolso de certificaciones.
🌐 Idiomas para el mundo: Cursos de idiomas para que tu crecimiento no tenga fronteras.
💻 Tecnología en tus manos: Renovamos tu equipo cada 3 años... ¡y es tuyo al finalizar el período!
🏆 Reconocimiento al esfuerzo: Bonos por rendimiento y éxito en proyectos.
🎉 Tiempo para ti: 15 días de vacaciones mínimo, un día libre por tu cumpleaños y descansos extra antes de Fiestas Patrias, Navidad y Año Nuevo.
🤝 Conexión y diversión: Presupuesto para actividades recreativas e integración.
💡 Cultura de innovación: Tus ideas importan. Promovemos la participación estratégica desde cualquier rol.
Conoce más sobre nuestras prestaciones aquí.
Stop the endless job search. Our AI finds and applies to the best jobs for you.
Discover remote opportunities in Software Development
Answer easy questions
200,000+ jobs across 15+ categories
Get your best job matches
Only hand-screened, legit jobs
Find a remote job faster
No ads, scams, or junk
“ I was the first applicant for a remote marketing position that got listed on the company website the same day I applied. Had an interview within 48 hours!