Air France-KLM met à disposition des agences de voyage une solution innovante pour l’interrogation de ses offres de vols via une API conforme à la norme IATA, appelée NDC. Cette technologie permet aux agences de voyage d’accéder en temps réel à la disponibilité et aux tarifs des vols, afin de répondre efficacement aux demandes de leurs clients.
L’utilisation de l’API NDC présente un défi majeur : de nombreuses agences exploitent des bots automatisés qui génèrent un grand nombre de requêtes, principalement pour comparer les offres du marché. Ces pratiques, qui ne reflètent pas la demande réelle, impactent la performance de l’API et soulèvent des questions d’optimisation.
Rattaché(e) à la Direction Informatique d’Air France-KLM, votre mission consistera à analyser les données issues de l’API NDC afin d’identifier les requêtes générées par des bots automatisés. Vous développerez des méthodes pour détecter et filtrer ces requêtes, dans le but d’améliorer la qualité des données et d’optimiser les coûts de stockage.
Vous serez amené(e) à mettre en place des solutions permettant de supprimer les requêtes non pertinentes des bases de données et de filtrer ces requêtes en temps réel, afin d’améliorer la performance et la réactivité du système pour les utilisateurs légitimes.
Vous travaillerez au sein d’une équipe technique, en étroite collaboration avec les experts métier et les équipes en charge de la distribution digitale.
Nous cherchons un.e élève en formation d’ingénieur en stage de fin d’études.
Vous êtes intéressé.e par les problématiques du Machine Learning, la détection d’anomalie et leurs applications dans le domaine du transport aérien.
Rigoureux.se, autonome, vous avez de bonnes aptitudes relationnelles, et êtes force de proposition. Vous avez de bonnes capacités d’analyse et de synthèse et êtes à l’aise pour présenter vos résultats. Vous êtes intéressé.e par l’étude de modèles à l’état de l’art, et dont l’application nécessite un effort d’étude.
Vous maîtrisez le langage Python ainsi que les librairies usuelles en data science & machine learning (pandas, scikit-learn). Une expérience avec les modèles non supervisés de détection d’anomalies sera un avantage.
Vous êtes par ailleurs curieux.se du fonctionnement intrinsèque des modèles de Machine Learning y compris sur le plan mathématique.