
Grupo Stefanini
Informações da vaga:
Atenção as exigências da vaga!
Descrição da vaga:
Engenheiro de Dados Pleno (IA) – Grupo Stefanini – Home Office
Responsabilidades e atribuições
Atuar no desenvolvimento de pipelines de ingestão, transformação e enriquecimento de dados para uso em IA
Trabalhar com dados estruturados e não estruturados (textos, PDFs, HTML, áudios, entre outros)
Implementar processos de chunking, embeddings e indexação vetorial
Construir e manter datasets voltados à matriz de conhecimento corporativa
Desenvolver pipelines utilizando Databricks (Spark / PySpark)
Atuar com arquitetura medalhão (bronze, prata e ouro)
Integrar dados com bancos vetoriais (Azure AI Search, pgvector, entre outros)
Garantir performance, escalabilidade e confiabilidade dos pipelines
Aplicar boas práticas de qualidade de dados (completude, consistência e versionamento)
Implementar políticas de atualização, retenção e expurgo de dados
Garantir rastreabilidade e auditabilidade dos dados utilizados pelos modelos
Atuar em conjunto com times de AI/ML na preparação e otimização de dados
Apoiar estratégias de recuperação de informação (RAG)
Otimizar dados para melhorar a relevância e precisão das respostas dos modelos
Requisitos e qualificações
Experiência sólida em engenharia de dados;
Conhecimento em Python e/ou PySpark;
Experiência com Databricks e Spark (batch e/ou streaming);
Experiência com pipelines de dados (ETL/ELT);
Modelagem de dados (Data Lake / Lakehouse);
Experiência com dados não estruturados (documentos, textos, etc.);
Integração e consumo de APIs;
Capacidade de atuar com autonomia na construção de pipelines;
Conhecimento em arquitetura moderna de dados;
Experiência com processamento e preparação de dados para IA;
Atuação em ambientes complexos com múltiplas integrações;
Ter uma das certificações a seguir: Microsoft DevOps Engineer Expert; AWS Developer; Google Cloud Architect; Azure Developer Associate; IBM Cloud ou variações ou ITIL 4 Foundation;
Requisitos desejáveis
Experiência com RAG (Retrieval-Augmented Generation);
Conhecimento em embeddings e bancos vetoriais;
Experiência com chunking de documentos;
Vivência com LangChain ou frameworks similares;
Conhecimento em OpenAI, Azure OpenAI ou outros LLMs;
Conhecimento em indexação semântica e busca vetorial;
Experiência com ingestão de documentos corporativos (PDF, Word, HTML);
Vivência com pipelines de dados voltados para IA;
Experiência em ambientes corporativos complexos ou projetos de grande porte.
Candidate-se, clicando no botão “Candidatar-se à vaga” abaixo
Vaga divulgada no RJEMPREGOS.NET
Obs: em vagas que solicitam o envio de curriculo por e-mail, sempre envie o curriculo no corpo do e-mail e em anexo.
Clique no botão abaixo "Candidatar-se à Vaga" para acessar o link, e-mail, local de comparecimento ou whatsapp da empresa contratante.
Dica: tenha atenção ao anunciado da vaga, as vezes por algum detalhe você pode ser eliminado da seleção, não esqueça de manter seu curriculo atualizado, boa sorte!
Candidate-se no botão abaixo.
Para se candidatar a esta vaga visite stefanini.gupy.io.
