Back to search
Bc Tecnologia Getonbrd · Posted 2d ago

Senior Data Scientist – GenAI & RAG (LATAM)

Remote Remote

Machine Learning & AI fully_remote lang_not_specified remote_full
Continue to application Add your email once, then Caio opens the original posting.

Indexed description

Competencias Críticas (Excluyentes)

Curado y limpieza de texto no estructurado proveniente de múltiples fuentes (chats, llamadas transcritas, registros CRM).Diseño de curado y limpieza de texto no estructurado para preparación de contenido destinado a modelos de lenguaje.Generación, gestión y versionado de embeddings.Implementación y administración de bases de datos vectoriales (ej. pgvector, Qdrant, Chroma, Weaviate, Pinecone, Milvus) y búsqueda híbrida.Construcción de pipelines RAG (Retrieval-Augmented Generation) completos, incluyendo evaluación y trazabilidad de respuestas.Integración con APIs de modelos de lenguaje (LLM), tanto en servidores propios/internos como proveedores externos (Anthropic, OpenAI, Azure OpenAI, Google Gemini), con diseño agnóstico al proveedor.Requisitos TécnicosProgramación y DatosPython. SQL. PySpark. Apache Spark. Big Data. Desarrollo de procesos ETL/ELT. Manipulación y análisis de grandes volúmenes de datos.Ciencia de Datos e IAAnálisis exploratorio de datos. Feature Engineering. Evaluación y optimización de modelos.Herramientas y FrameworkBases de datos vectoriales (Pinecone, Weaviate, Chroma, Qdrant, Milvus o similares). Git.CloudAzure. Servicios de almacenamiento y procesamiento de datos.

Projects

Buscamos incorporar un profesional para participar en una iniciativa estratégica de Inteligencia Artificial Generativa enfocada en el desarrollo de capacidades de análisis semántico y agentes conversacionales.

El proyecto tiene como objetivo transformar grandes volúmenes de información no estructurada proveniente de diversas fuentes, como chats, transcripciones de llamadas y registros CRM, en conocimiento accionable mediante el uso de tecnologías de IA Generativa, Large Language Models (LLMs), embeddings y arquitecturas RAG (Retrieval-Augmented Generation).

La persona seleccionada participará en el diseño e implementación de soluciones que permitan mejorar la recuperación inteligente de información, la trazabilidad de respuestas y la experiencia de interacción conversacional.

Principales Responsabilidades

Diseñar e implementar soluciones de Ciencia de Datos e Inteligencia Artificial.Procesar, limpiar y transformar grandes volúmenes de datos provenientes de distintas fuentes.Desarrollar pipelines de datos para la automatización de procesos analíticos.Construir modelos predictivos, analíticos y de IA Generativa según las necesidades del negocio.Implementar soluciones basadas en Large Language Models (LLMs).Generar embeddings y trabajar con bases de datos vectoriales.Participar en la definición de arquitecturas de datos y analítica avanzada.Integrar distintas fuentes de información para generar modelos y automatizaciones.Colaborar con equipos de negocio para identificar oportunidades de uso de datos e inteligencia artificial.Documentar procesos, modelos y soluciones implementadas.

Conocimientos Deseables

(No excluyentes, ya que contamos con apoyo interno para esta parte)Experiencia en Microsoft Fabric.
Free. 20 seconds. No password. See every match in this search.

Create a free Caio profile to unlock more results and save your role and location preferences.

Unlock free search
Want help applying to roles like this? Search Caio for free. If the repetitive CV tweaking gets heavy, Daniel can help set up Caio Agent.
Ask about Agent