2brains
Getonbrd · Posted yesterday
Data Scientist
Continue to application
Add your email once, then Caio opens the original posting.
Indexed description
Requisitos técnicos
Lenguaje y librerías- Python 3.10+ con manejo fluido (tipos, dataclasses, manejo de excepciones).
- pandas y numpy para procesamiento de datasets de gran volumen (1M–10M filas).
- scipy (optimize) para calibración de parámetros.
- scikit-learn, lightgbm/xgboost y shap.
- H3 (indexación hexagonal), geopandas y shapely.
- Conocimiento de distancias geodésicas y su aplicación práctica.
- BigQuery: nivel avanzado (CTEs, window functions, joins espaciales, optimización de costo/tiempo).
- Vertex AI: nivel intermedio (pipelines KFP básicos, despliegue de endpoints).
- Git/GitHub: nivel avanzado (branches, PRs, resolución de conflictos).
- Conocimientos en modelos gravitacionales (Huff/Reilly) — deseable, o capacidad de aprenderlos rápidamente.
- Experiencia en backtesting con validación temporal (walk-forward).
- FastAPI para endpoints de predicción.
- Nociones básicas de Docker.
- Power BI/Tableau y herramientas de visualización (matplotlib/plotly).
- Comunicación clara y proactiva.
- Autonomía con dirección: capacidad de ejecutar tareas con criterios de aceptación claros, sin necesidad de supervisión constante.
- Pragmatismo orientado a resultados, priorizando entregar valor a tiempo.
- Capacidad de identificar y comunicar bloqueos de forma temprana.
Projects
En Acid Labs nos sumamos a los equipos tech de las empresas que están liderando el futuro digital en las industrias más desafiantes en Latinoamérica, con talento especializado que entiende la complejidad, respira colaboración y encuentra claridad donde otros ven ruido.Y lo hacemos #RadicalmenteMejorNo trabajamos para nuestros clientes.Trabajamos con ellos. Desde adentro. Como parte de su ritmo. Como una extensión natural de su capacidad tecnológica.Sobre el proyectoNuestro cliente está desarrollando un modelo de forecast de ventas para la apertura de nuevos proyectos inmobiliarios, basado en un modelo gravitacional tipo Huff sobre grilla geoespacial H3. Los resultados se publican en una plataforma de autogestión donde el equipo de Real Estate ingresa parámetros de un proyecto y obtiene en tiempo real estimaciones de venta, canibalización y mapas de captura, visualizados sobre un mapa interactivo.Responsabilidades principales
Modelado- Implementar, calibrar y documentar el modelo gravitacional Huff (versión baseline).
- Entrenar modelos de Gradient Boosting (LightGBM/XGBoost) a nivel tienda como benchmark de magnitud y explicabilidad (SHAP).
- Elaborar reportes comparativos que documenten la elección del modelo final frente a los baselines.
- Construir el pipeline de backtesting del modelo contra tiendas referenciales (predicción vs. real, métricas por formato y región).
- Implementar el cálculo de canibalización generada por la apertura de nuevas tiendas.
- Apoyar el desarrollo del endpoint de predicción (FastAPI) para integrarlo a la plataforma.
- Validar calidad de datos sobre fuentes en BigQuery (ventas, maestros de tiendas, datos demográficos, entre otros).
- Realizar análisis exploratorios puntuales solicitados por el equipo.
- Documentar técnicamente los módulos desarrollados.
- Participar en code reviews del equipo.
Deseable (no excluyente)
- Experiencia previa con modelos de localización retail (Huff, MNL, Spatial Interaction Models).
- Familiaridad con datos de movilidad (tipo Azira, Cuebiq, Veraset, SafeGraph).
- Experiencia en proyectos de Real Estate o Site Selection en retail.
- Conocimientos de causal inference.
- Experiencia trabajando con stakeholders no técnicos.
- Proyecto de duración estimada de 4 meses.
Create a free Caio profile to unlock more results and save your role and location preferences.
Unlock free search
Want help applying to roles like this?
Search Caio for free. If CV tailoring and application tracking get heavy, Full Caio Agent adds a human specialist.
View Full Agent