Headquarters: Remote - France
URL: http://mirakl.fr
Mirakl est le leader des solutions logicielles pour le e-commerce. Nous proposons aux entreprises une suite unique de solutions leur permettant de transformer significativement leur activité digitale afin d'accélérer de façon durable et rentable leur croissance.
Depuis 2012, Mirakl accompagne les entreprises B2C et B2B avec la technologie la plus avancée, sécurisée et évolutive leur permettant de digitaliser leur activité et d'élargir leur offre via la marketplace ou le dropship, de faciliter la gestion des catalogues et des paiements de leurs fournisseurs, d'offrir une expérience d'achat personnalisée à leurs clients et d'augmenter leurs profits grâce au retail media.
Mirakl est le partenaire de choix de plus de 450 entreprises leaders dans le monde, dont Airbus, Maisons du Monde, Decathlon, H&M, Sonepar et Toyota Material Handling. Pour plus d'informations, consultez www.mirakl.fr.
A propos de Mirakl Labs
Nos équipes techniques et produits, nommées Mirakl Labs, sont principalement réparties entre nos deux hubs situés à Paris et à Bordeaux. Elles collaborent au quotidien afin d'adresser les problématiques de nos clients et utilisateurs en répondant à différents challenges liés aux nouvelles fonctionnalités, à la scalabilité, à la sécurité et à l’ergonomie. Elles opèrent en mode agile et s'organisent en Squads composées d'un Squad Lead, de cinq développeurs, d'un Product Manager et d'un QA. Chaque Squad est spécialisée sur un périmètre fonctionnel afin de concevoir et réaliser de nouvelles features, leurs évolutions et des APIs via un découpage en micro-services. Nos équipes Infrastructure, Architecture, Sécurité, Documentation, Product Design, Data et Support opèrent en transverse en apportant leur expertise et de la cohérence sur l’ensemble des produits.
Toutes les équipes sont responsables de leur périmètre et chaque collaborateur apporte son expérience et ses idées. L'innovation, le feedback et l'implication dans les prises de décision sont au cœur de notre philosophie.
Pour favoriser ce partage avec d’autres passionnés, nous sommes sponsors, speakers et hôtes de différents événements, meetups et associations de la scène Tech en France. Ces dernières années, nous avons participé à des événements tels que Devoxx, ReactEurope, ProductConf et Flupa UX Days.
A propos du job
Intégré.e dans notre équipe Data Science, votre mission principale sera de prototyper, itérer et mettre en production des algorithmes en collaboration avec les équipes Produit, les Data Engineers et les équipes de développement. Vos projets porteront sur les enjeux du catalogue Marketplace, incluant le NLP, la Computer Vision et l'utilisation de Generative AI (LLMs customs) à grande échelle. Les sujets que vous traiterez auront un impact significatif sur nos clients, en exploitant au mieux nos données riches et variées pour augmenter leur chiffre d'affaires, optimiser la gestion de leur marketplace et garantir la sécurité des utilisateurs et des transactions.
Nous cherchons des personnes en CDI, sur Paris, Bordeaux ou en full remote
Sujets catalogue :
- Réécriture automatique du contenu marketing en fonction des attentes métier
- Extraction d’attributs produit à partir d’images et de texte libre
- Détection de produits variants
- Catégorisation de produits
- Onboarding automatique des produits vendeurs
- Fusion de fiches produits provenant de sources multiples
- Prédiction de produits tendance
Ce qu’il y a pour vous dans ce job :
- Implémenter des algorithmes ayant un impact visible sur plus de 500 sites e-commerce/marketplaces dans 40 pays
- Utiliser des techniques de pointe variées, telles que les modèles multimodaux et le fine-tuning de LLMs
- Bénéficier d'une autonomie et d'une responsabilité importantes dans vos projets
Notre stack et nos outils
Python, Tensorflow, PyTorch, Hugging Face, Databricks, Spark, AWS (Amazon Redshift, s3, etc.), SQL, Airflow et Delta Lake. Pour les LLM, nous utilisons Autotrain, Unsloth, Galileo, LangChain et Anyscale.
Au quotidien, vous allez :
- Analyser, préparer les données et prototyper des algorithmes
- Mettre en production ces algorithmes en collaboration avec les Data Engineers et les équipes de développement
- Créer des dashboards pour illustrer la pertinence des algorithmes et monitorer leur production
- Présenter les résultats lors du weekly data science et participer aux sessions de brainstorming
- Collaborer avec les autres équipes pour affiner les cas d'utilisation, l'expérience utilisateur et les modes d'intégration
Vous aimerez ce job si :
- Vous avez au moins 4 ans d'expérience en tant que Data Scientist, avec une expertise en NLP et ML appliqué
- Vous avez mis en production des algorithmes de Machine Learning
- Vous maîtrisez les algorithmes de NLP, de Computer Vision et les architectures state-of-the-art, tels que les Transformers
- Vous maîtrisez Python, Tensorflow et/ou PyTorch
- Vous avez une expérience en développement Spark
- Vous êtes pragmatique, data-driven et orienté métier
- Vous aimez prendre en charge vos projets et travailler de manière autonome
- Vous faites preuve de respect, de bienveillance et d'un esprit positif
- Vous aimez partager votre travail lors de présentations internes, de conférences ou en rédigeant des articles
Envie de nous rejoindre? ⭐
- Un échange téléphonique de 30 minutes avec un recruteur tech pour discuter de votre parcours et de vos attentes
- Un premier échange technique par Zoom de 30 minutes avec un membre de l’équipe Data Science
- Un cas pratique à réaliser à la maison
- Une restitution et un échange technique de 75 minutes avec un manager de l’équipe Data Science
- Un dernier échange d'une heure par Zoom avec des futurs collègues autour de nos valeurs et de notre culture
Mirakl s'engage pour la diversité, l'égalité des chances et l'inclusion. Nous étudions toutes les candidatures sans distinction de genre, d'ethnicité, de religion, d'orientation sexuelle, de handicap, d'âge ou toute autre caractéristique protégée par la loi.
To apply: https://weworkremotely.com/remote-jobs/labs-senior-data-scientist-nlp-genai-catalog