Back to search
Darwoft Himalayas · Posted 3d ago

090L - Data Engineer (Neo4j / Graphs / RAG) · SemiSenior · Remoto · ARG

Argentina USD Full time

Data Engineering Graph Database Engineering Knowledge Graph Engineering RAG Engineering
Continue to application Add your email once, then Caio opens the original posting.

Indexed description

Data Engineer (Neo4j / Graphs / RAG) · SemiSenior · Remoto · ARG

Ubicación: Argentina
Modalidad: Remoto
Proyecto: Plataforma de inteligencia legal, tributaria y regulatoria
Zona horaria: Argentina
Nivel de inglés: Técnico / lectura de documentación

Conocé Darwoft

En Darwoft creamos software que genera impacto real. Pero somos mucho más que tecnología: somos personas trabajando con propósito, colaboración y ganas de construir soluciones digitales relevantes.

Somos una compañía latinoamericana que trabaja junto a clientes de distintas partes del mundo, desarrollando productos tecnológicos con foco en calidad, escalabilidad e innovación. Muchos nos diferencia por nuestra gran naturalización de la IA.

Trabajamos de manera presencial, remota, colaborativa y con una cultura basada en aprendizaje continuo, evolución, excelencia y cercanía humana.

Sobre el rol

Estamos buscando un/a Data Engineer Ssr ( 3, 4, 5 años de experiencia) con experiencia en Neo4j, Knowledge Graphs y arquitecturas RAG para sumarse a un proyecto de alto impacto vinculado a una plataforma de inteligencia legal, tributaria, contable y regulatoria.

La posición combina responsabilidades propias de Data Engineering —modelado de datos, pipelines de ingesta, transformación, calidad, performance y escalabilidad— con un componente avanzado de modelado semántico en grafos.

El objetivo principal será transformar taxonomías, ontologías y relaciones semánticas definidas por el equipo de Data Science en un modelo de grafos productivo, mantenible y escalable, capaz de alimentar un sistema de recuperación semántica basado en RAG.

Vas a trabajar sobre un ecosistema donde conviven extracción de entidades, procesamiento documental, embeddings, búsqueda vectorial, Neo4j y modelos de recuperación semántica. Es una oportunidad ideal para una persona con base sólida en ingeniería de datos y ganas de profundizar en Knowledge Graphs, GraphRAG y AI-powered search.

Qué vas a hacer

  • Diseñar, implementar y mantener modelos de datos en Neo4j para representar conceptos, entidades, relaciones semánticas, jerarquías, versiones y dependencias entre contenidos.
  • Traducir ontologías y taxonomías definidas por el equipo de Data Science en un esquema de grafos eficiente, utilizando labels, relationship types, properties, índices y constraints.
  • Construir y optimizar pipelines de ingesta hacia Neo4j desde fuentes documentales, extractores de entidades, procesos de NLP, Computer Vision u otros sistemas internos.
  • Participar en el diseño de flujos de ETL/ELT para carga, transformación, validación y actualización de datos en el grafo.
  • Implementar estrategias de chunking, generación de embeddings, indexación y recuperación semántica.
  • Trabajar con Neo4j Vector Index para combinar búsqueda vectorial con recorridos de grafos.
  • Diseñar soluciones de retrieval híbrido, combinando graph search, vector search, multi-hop retrieval y patrones similares a GraphRAG.
  • Desarrollar y optimizar consultas avanzadas en Cypher, incluyendo subqueries, patrones complejos, APOC y, cuando aplique, Neo4j GDS.
  • Optimizar performance de consultas y procesos de carga utilizando EXPLAIN, PROFILE, índices, constraints, page cache y tuning de memoria.
  • Colaborar con Data Scientists, equipos de extracción de entidades y equipos de desarrollo backend para integrar el grafo con servicios en Node.js o Python.
  • Definir prácticas de calidad de datos, validaciones, pruebas sobre grafos y monitoreo de consistencia.
  • Documentar decisiones de modelado, supuestos, trade-offs técnicos y criterios de evolución del modelo.
  • Contribuir a que la plataforma pueda escalar en volumen, complejidad semántica y necesidades futuras de búsqueda inteligente.

Lo que buscamos

  • Experiencia sólida como Data Engineer, Data Platform Engineer, Graph Data Engineer o similar.
  • Experiencia avanzada trabajando con Neo4j, idealmente versión 5.x o superior.
  • Dominio de Cypher, incluyendo consultas complejas, optimización, subqueries, APOC y buenas prácticas de performance.
  • Experiencia modelando datos en esquemas tipo property graph para dominios complejos.
  • Capacidad para transformar modelos conceptuales, taxonomías u ontologías en estructuras de datos productivas.
  • Experiencia construyendo pipelines de ingesta, transformación, validación y actualización de datos.
  • Conocimiento práctico de procesos de ETL/ELT y manejo de cargas masivas hacia bases de datos.
  • Experiencia usando Python o Node.js para integración, automatización o desarrollo de pipelines.
  • Conocimiento de embeddings, búsqueda semántica, vector search o arquitecturas RAG.
  • Experiencia trabajando con índices vectoriales o recuperación híbrida.
  • Buen criterio para diseñar estructuras escalables, mantenibles y observables.
  • Capacidad para trabajar con equipos interdisciplinarios, especialmente Data Science, Backend, NLP o Computer Vision.
  • Buen nivel de documentación técnica y comunicación clara para explicar decisiones de modelado a perfiles técnicos y no técnicos.
  • Autonomía para hacerse dueño/a de un componente técnico desde el diseño hasta la evolución productiva.

Será un plus

  • Experiencia previa con Knowledge Graphs, GraphRAG o semantic search.
  • Conocimiento de estándares o enfoques semánticos como SKOS, OWL, RDF, SHACL o modelos ontológicos custom.
  • Experiencia con Neo4j GDS Library, PageRank, similarity algorithms o graph-based ranking.
  • Experiencia con frameworks como LangChain, LlamaIndex o Haystack integrados con Neo4j.
  • Experiencia en dominios legales, tributarios, contables, regulatorios o de compliance.
  • Conocimiento sobre versionado temporal, jerarquías normativas, vigencia de documentos, relaciones entre normas o estructuras documentales complejas.
  • Experiencia con herramientas de mensajería o procesamiento distribuido como Kafka o RabbitMQ.
  • Experiencia con monitoreo y observabilidad usando Prometheus, Grafana, Neo4j Bloom u otras herramientas similares.
  • Experiencia realizando pruebas sobre datos, queries o grafos mediante golden datasets, tests de Cypher o validaciones automatizadas.
  • Experiencia desplegando Neo4j en AuraDB, Kubernetes, self-hosted environments, clustering o arquitecturas multi-tenant.
  • Portfolio, repositorios, papers o casos previos relacionados con grafos, búsqueda semántica o plataformas de datos.

Qué ofrece Darwoft

  • Contrato full-time en relación de dependencia con pago en ARS
  • Trabajo 100% remoto
  • Salario competitivo
  • Licencias legales y días de vacaciones
  • Días personales extra por año
  • Acceso a plataformas de aprendizaje
  • Tarjeta de beneficios y descuentos
  • Welcome kit
  • Programas de reintegro
  • Clases de inglés
  • Programa de referidos
  • Regalo de cumpleaños
  • Healthy Break
  • Celebraciones estilo Darwoft: aniversarios, fiestas de fin de año, cumpleaños y actividades de team building

Explore this and other opportunities at:

www.darwoft.com/careers

Originally posted on Himalayas

Free. 20 seconds. No password. See every match in this search.

Create a free Caio profile to unlock more results and save your role and location preferences.

Unlock free search
Want help applying to roles like this? Search Caio for free. If the repetitive CV tweaking gets heavy, Daniel can help set up Caio Agent.
Ask about Agent