Back to search
Coyanservices Getonbrd · Posted 3d ago

Data Scientist Senior – AWS / Sagemaker / Python / Neptune

Remote Remote

Data Science / Analytics fully_remote es remote_full
Continue to application Add your email once, then Caio opens the original posting.

Indexed description

Requisitos Técnicos:

· Formación en Ingeniería, Estadística, Matemáticas, Ciencias de la Computación o afines.

· Python avanzado (pandas, numpy, scikit-learn, PyTorch/TensorFlow deseable).

· Experiencia comprobable con AWS: S3, Athena, Data Lake, Lambda, SageMaker Studio.

· Sólida base en estadística aplicada e inferencia. • Experiencia completa en ciclos de vida ML/AI.

· SQL avanzado (Athena, Presto, Redshift).

· Control de versiones, documentación y testing de modelos/datos.

· Experiencia práctica en bases de datos de grafos.

· Deseables: Conocimientos en PySpark o SparkSQL. • Visualización con herramientas como Power BI.

Habilidades blandas:

Pensamiento crítico y enfoque científico.
Autonomía, comunicación efectiva y colaboración.
Curiosidad y aprendizaje continuo.

Projects

Data Scientist Senior – AWS / Sagemaker / Python / NeptuneModalidad: Contratista Independiente
Ubicación: Sur América
Proyecto para cliente regional a través de empresa tecnológica privadaTecnologías Python | AWS | SageMaker | ML/AI | Estadística | SQL | NeptuneUna empresa tecnológica privada busca incorporar un/a Data Scientist para trabajar en un proyecto estratégico con uno de sus clientes en la región. La posición es 100% remota, en modalidad contratista independiente, y está abierta a profesionales de cualquier país de Latinoamérica.

Objetivos del rol:

· Estandarizar procesos de ingesta, limpieza y gobierno de datos en el Data Lake.

· Diseñar, entrenar y desplegar modelos de ML/AI end-to-end sobre infraestructura AWS.

· Construir y optimizar procesos de feature engineering para preparar datasets de entrenamiento.

· Desarrollar y entrenar modelos de machine learning utilizando AWS, principalmente SageMaker.

· Diseñar e implementar grafos de conocimiento / ontología del dominio (entidades, atributos y relaciones).

· Evaluar el desempeño de modelos mediante métricas y técnicas de validación adecuadas.

· Implementar pipelines de machine learning reproducibles para entrenamiento y despliegue.

· Desplegar modelos en producción mediante endpoints de inferencia en tiempo real o batch.

· Monitorear el desempeño de los modelos en producción y gestionar reentrenamientos.

· Traducir insights técnicos en productos de analítica avanzada para la toma de decisiones.

· Colaborar con equipos técnicos y de negocio para definir soluciones analíticas escalables.

Responsabilidades:

· Ingeniería de datos: Pipelines en S3, Glue, Lambda, Athena. Feature engineering, validación y monitoreo de calidad.

· Modelado estadístico y ML: Regresión, clasificación, series de tiempo, NLP. Evaluación rigurosa y documentación técnica.

· Deployment y MLOps: Productización en SageMaker/Lambda. CI/CD, versionamiento y monitoreo de modelos.

· Análisis y comunicación: Dashboards, storytelling y soporte a decisiones estratégicas.

· Gobierno y ética de datos: Mejores prácticas, documentación, reproducibilidad y cumplimiento normativo.

Deseables:

Conocimientos en PySpark o SparkSQL. PyTorch/TensorFlow deseable.
Free. 20 seconds. No password. See every match in this search.

Create a free Caio profile to unlock more results and save your role and location preferences.

Unlock free search
Want help applying to roles like this? Search Caio for free. If the repetitive CV tweaking gets heavy, Daniel can help set up Caio Agent.
Ask about Agent