Vaga de Desenvolvedor
Descrição completa da vaga
Buscamos um(a) cientista de dados sênior para liderar iniciativas de extração e estruturação de informações a partir de documentos estruturados e não estruturados, atuando com nlp, inteligência artificial generativa e modelagem de regras baseada em grafos. O que você vai fazer no dia a dia: - Desenvolver pipelines de nlp/genai para extração de informações de documentos (pdfs, imagens digitalizadas, documentos estruturados e não estruturados) - Implementar técnicas de ia generativa para aprimorar a extração de dados - Criar pipelines eficientes para extração, limpeza e estruturação de dados textuais - Desenvolver modelos baseados em grafos para representação de conhecimento e inferência de regras - Colaborar com times de engenharia de dados e software para integração dos modelos em produção - Monitorar e avaliar a performance dos modelos, propondo melhorias contínuas - Explorar técnicas de ml supervisionado, não supervisionado e auto-Supervisionado aplicadas à extração e enriquecimento de informações Requisitos: - Formação superior em ciência da computação, engenharia, matemática, estatística ou áreas correlatas - experiência comprovada em nlp (técnicas clássicas e avançadas: regex, tf-Idf, embeddings, transformers, bert, gpt, llms) - experiência com extração de entidades e modelagem de regras em documentos complexos - Conhecimento em grafos, ontologias e frameworks baseados em gnns - experiência com bibliotecas e frameworks como spacy, nltk, stanford nlp, hugging face, openai api, neo4j, networkx - Forte domínio de python e bibliotecas de ml (tensorflow, pytorch, scikit-Learn) - experiência com bancos de dados relacionais e nosql - Familiaridade com técnicas de ocr para extração de texto Diferenciais: - Conhecimento em serviços cloud aplicados ao problema (plus para gcp) - experiência com ia generativa para nlp (fine-Tuning, rag, openai, hugging face ou modelos open-Source) - experiência com processamento de documentos jurídicos, médicos ou financeiros - experiência em deploy de modelos de ia escaláveis em cloud (aws, gcp, azure) - experiência com arquiteturas de deep learning aplicadas à nlp Benefícios: - 22 dias úteis de férias + 1/3 constitucional - Plano de saúde 100% pago para o colaborador e 70% para dependentes - Flash no valor de R$ 1.080,00.
Sobre a empresa
Nome: Confidencial