Senior Data Scientist – GenAI & RAG (LATAM)
Indexed description
Competencias Críticas (Excluyentes)
Curado y limpieza de texto no estructurado proveniente de múltiples fuentes (chats, llamadas transcritas, registros CRM).Diseño de curado y limpieza de texto no estructurado para preparación de contenido destinado a modelos de lenguaje.Generación, gestión y versionado de embeddings.Implementación y administración de bases de datos vectoriales (ej. pgvector, Qdrant, Chroma, Weaviate, Pinecone, Milvus) y búsqueda híbrida.Construcción de pipelines RAG (Retrieval-Augmented Generation) completos, incluyendo evaluación y trazabilidad de respuestas.Integración con APIs de modelos de lenguaje (LLM), tanto en servidores propios/internos como proveedores externos (Anthropic, OpenAI, Azure OpenAI, Google Gemini), con diseño agnóstico al proveedor.Requisitos TécnicosProgramación y DatosPython. SQL. PySpark. Apache Spark. Big Data. Desarrollo de procesos ETL/ELT. Manipulación y análisis de grandes volúmenes de datos.Ciencia de Datos e IAAnálisis exploratorio de datos. Feature Engineering. Evaluación y optimización de modelos.Herramientas y FrameworkBases de datos vectoriales (Pinecone, Weaviate, Chroma, Qdrant, Milvus o similares). Git.CloudAzure. Servicios de almacenamiento y procesamiento de datos.Projects
Buscamos incorporar un profesional para participar en una iniciativa estratégica de Inteligencia Artificial Generativa enfocada en el desarrollo de capacidades de análisis semántico y agentes conversacionales.
El proyecto tiene como objetivo transformar grandes volúmenes de información no estructurada proveniente de diversas fuentes, como chats, transcripciones de llamadas y registros CRM, en conocimiento accionable mediante el uso de tecnologías de IA Generativa, Large Language Models (LLMs), embeddings y arquitecturas RAG (Retrieval-Augmented Generation).
La persona seleccionada participará en el diseño e implementación de soluciones que permitan mejorar la recuperación inteligente de información, la trazabilidad de respuestas y la experiencia de interacción conversacional.
Principales Responsabilidades
Diseñar e implementar soluciones de Ciencia de Datos e Inteligencia Artificial.Procesar, limpiar y transformar grandes volúmenes de datos provenientes de distintas fuentes.Desarrollar pipelines de datos para la automatización de procesos analíticos.Construir modelos predictivos, analíticos y de IA Generativa según las necesidades del negocio.Implementar soluciones basadas en Large Language Models (LLMs).Generar embeddings y trabajar con bases de datos vectoriales.Participar en la definición de arquitecturas de datos y analítica avanzada.Integrar distintas fuentes de información para generar modelos y automatizaciones.Colaborar con equipos de negocio para identificar oportunidades de uso de datos e inteligencia artificial.Documentar procesos, modelos y soluciones implementadas.Conocimientos Deseables
(No excluyentes, ya que contamos con apoyo interno para esta parte)Experiencia en Microsoft Fabric.Create a free Caio profile to unlock more results and save your role and location preferences.
Unlock free search