Ingénieur en science des données Intelligence Artificielle expérimenté H/F - IBM Client Innovation Center - Paris ou Strasbourg
Indexed description
Your Role And Responsibilities
Dans un contexte d’accélération des usages de l’intelligence artificielle, nous recherchons un(e) Ingénieur en science des données Intelligence Artificielle expérimenté capable d’intervenir sur l’ensemble du cycle de vie d’un produit IA, depuis l’identification des opportunités métier jusqu’à l’industrialisation et au suivi en production. Ce rôle couvre aussi bien le machine learning classique que le deep learning, l’IA générative, l’IA agentique, les modèles multimodaux, l’évaluation de modèles, l’ingénierie de données pour l’IA et la mise en production de solutions robustes, scalables et mesurables.
Le poste est fortement transverse et s’inscrit au croisement de la R&D, du delivery, de la data, du produit et des métiers. La personne attendue doit être capable à la fois de prototyper rapidement, de structurer des démarches expérimentales rigoureuses, d’industrialiser des pipelines fiables, et d’orienter les choix technologiques de l’équipe grâce à une veille active et une forte capacité d’analyse.
- Identifier, cadrer et prioriser des cas d’usage IA à fort impact, en lien avec les enjeux métiers, les contraintes techniques et la faisabilité opérationnelle.
- Concevoir et développer des solutions de machine learning, deep learning et IA générative sur des données structurées, textuelles, visuelles, documentaires ou multimodales.
- Préparer, enrichir et qualifier les données nécessaires aux modèles : collecte, nettoyage, labellisation, augmentation, synthèse, anonymisation, contrôle qualité et versioning.
- Concevoir des protocoles d’expérimentation robustes, définir les métriques pertinentes, réaliser des benchmarks, analyser les résultats et formuler des recommandations argumentées.
- Fine-tuner, adapter ou orchestrer des modèles existants, y compris des LLM, VLM et modèles spécialisés, selon les cas d’usage et les contraintes de coût, latence, robustesse et explicabilité.
- Développer et industrialiser des pipelines de training, d’évaluation, d’inférence et de monitoring en collaboration avec les équipes data et engineering.
- Déployer des modèles et services IA en environnement de production, assurer leur observabilité, suivre leur dérive, mesurer leur performance métier et piloter leur amélioration continue.
- Mettre en place et diffuser des standards de reproductibilité, de qualité, de traçabilité, de documentation et de gouvernance des expérimentations.
- Réaliser une veille technologique active sur les modèles, frameworks, outils, benchmarks et pratiques émergentes, puis transformer cette veille en décisions concrètes, POC ou recommandations d’architecture.
- Accompagner les membres plus juniors de l’équipe, challenger les choix techniques, contribuer aux bonnes pratiques de développement et participer activement aux décisions structurantes sur les stacks IA.
- Excellente maîtrise de Python et des principaux frameworks de data science et deep learning, notamment scikit-learn, PyTorch, Hugging Face, pandas, NumPy, OpenCV, et TensorFlow.
- Solide expérience en machine learning supervisé et non supervisé sur données tabulaires, comportementales ou métiers : classification, régression, clustering, scoring, ranking, détection d’anomalies, feature engineering et interprétabilité.
- Expérience concrète sur les LLM/VLM : prompting, évaluation, RAG, fine-tuning léger ou complet, adaptation de modèles, garde-fous, mesure de qualité et optimisation des coûts.
- Maîtrise des frameworks d’IA agentique : LangGraph, LangChain, LlamaIndex, AutoGen, Semantic Kernel ou frameworks équivalents, avec capacité à concevoir des workflows robustes, traçables et maintenables.
- Capacité à concevoir des agents fiables en contexte entreprise : gestion des permissions, sécurisation des appels outils, validation des sorties, human-in-the-loop, gestion des échecs, monitoring, auditabilité et contrôle des coûts.
- Maîtrise des problématiques document AI : OCR, parsing, extraction d’information, classification documentaire, layout analysis, table extraction, structuration de contenus complexes.
- Très bonne maîtrise du deep learning appliqué au NLP, à la vision par ordinateur, aux documents et aux approches multimodales.
- Bonne maîtrise des pipelines d’expérimentation et de reproductibilité : MLflow, Weights & Biases, DVC, Git, notebooks industrialisés, tests, packaging et CI/CD pour l’IA.
- Bonne compréhension de l’infrastructure IA : entraînement et inférence sur GPU, conteneurisation, APIs de serving, optimisation d’inférence, quantization, monitoring et gestion des ressources.
- Capacité à travailler avec des environnements cloud ou on-prem, des pipelines de données et des architectures de production intégrées au SI.
- Excellente communication en Français et en Anglais, à l'écrit et à l'oral.
- Capacité à partir d’un besoin flou pour le transformer en problème data science cadré, avec hypothèses, critères de succès, plan d’expérimentation et trajectoire de mise en production.
- Capacité d’arbitrage entre performance modèle, coût d’exploitation, maintenabilité, time-to-market, dette technique et risques opérationnels.
- Excellente communication technique, aussi bien vers des profils experts que vers des interlocuteurs produit, métier ou management.
- Leadership technique, autonomie forte, capacité à encadrer ou faire monter en compétence d’autres profils data/IA.
- Esprit critique sur les benchmarks, la qualité des données, les biais, la robustesse, la sécurité, l’éthique et la valeur réelle des solutions proposées.
Create a free Caio profile to unlock more results and save your role and location preferences.
Unlock free search