10530 - Data Engineer (Engenheiro de Dados) - Pleno

 Posted an hour ago
  
 Worldwide
  
2-5 years experience
Apply Now

Please mention DailyRemote when applying

AI Summary

Design and build scalable ETL/ELT pipelines using dbt and PySpark, including ingestion workflows for GenAI and RAG applications. Plan and execute data migration projects while ensuring data governance, security, and quality through automated testing.

Este é um cargo remoto.

Oportunidade: Data Engineer (Engenheiro de Dados) - Pleno
Requisitos Obrigatórios:
Experiência comprovada no desenvolvimento e implementação de pipelines de dados em escala de produção.
Forte domínio de Python, PySpark e SQL avançado (window functions, CTEs, otimização de performance).
Experiência prática em projetos de migração de dados.
Experiência com pelo menos uma grande plataforma de cloud (AWS, Azure ou GCP).
Experiência com Databricks, serviços de dados da AWS ou Microsoft Fabric para desenvolvimento de pipelines.
Experiência com data warehouses modernos, como Snowflake, BigQuery, Redshift ou Databricks.
Experiência com bancos de dados relacionais (PostgreSQL, MySQL) e NoSQL (MongoDB, DynamoDB).
Experiência com ferramentas de migração de dados para ambientes on-premises ou cloud (ex.: SSIS).
Experiência prática com Apache Spark / PySpark e agendamento de workflows (AWS Glue ou similar).
Familiaridade com Infrastructure as Code (Terraform, Docker).
Experiência com pipelines de CI/CD (preferencialmente GitHub Actions).
Forte conhecimento em modelagem de dados (Star Schema, Data Vault, Modelagem Dimensional).
Diferenciais:
Experiência em estratégia e planejamento de migração de dados.
Experiência na implementação de soluções de Change Data Capture (CDC).
Conhecimento em tecnologias de streaming, como Kafka ou Kinesis.
Experiência com desenvolvimento de pipelines RAG e aplicações baseadas em GenAI.
Conhecimento de arquiteturas orientadas a eventos e integração com microservices.
Principais Responsabilidades:
Projetar e construir pipelines de dados ETL/ELT escaláveis utilizando dbt, PySpark e outras ferramentas modernas de transformação.
Desenvolver e manter pipelines de ingestão de dados para workloads de GenAI, incluindo processamento de documentos, chunking e workflows de embeddings.
Orquestrar workflows utilizando Airflow, Dagster ou ferramentas nativas de orquestração em cloud.
Planejar e executar projetos de migração de dados, incluindo análise da fonte de dados, mapeamento de schema, validação e estratégias de rollback.
Implementar soluções de Change Data Capture (CDC) utilizando ferramentas padrão do mercado.
Construir e manter frameworks de qualidade de dados com testes automatizados e validações.
Garantir governança, segurança e conformidade dos dados, incluindo tratamento adequado de PII (dados pessoais identificáveis) e aplicação de políticas RBAC (controle de acesso baseado em funções).
Colaborar com Engenheiros de IA e Desenvolvedores Full Stack para dar suporte a pipelines RAG e aplicações baseadas em GenAI.
Aplicar conceitos de arquitetura orientada a eventos para projetar soluções de processamento de dados escaláveis e confiáveis.
Idioma: Ingles - Avançado
Modelo de atuação: Remoto
Período de Alocação: 8 semanas (Possível Prorrogação) 



Similar Jobs

See all Remote Software Development jobs →

Personalize your Remote Job Search in 3 Easy Steps!

Discover remote opportunities in Data Engineer

Answer easy questions

Answer easy questions

200,000+ jobs across 15+ categories

Get your best job matches

Get your best job matches

Only hand-screened, legit jobs

Find a remote job faster

Find a remote job faster

No ads, scams, or junk

I was the first applicant for a remote marketing position that got listed on the company website the same day I applied. Had an interview within 48 hours!

Sarah J. — Sarah J. · Marketing Manager ★★★★★ Verified