Le projet « Fastest Random Forest » remporte le prix annuel de CS Numérique
24/04/2023
Photo : Les lauréats du prix CS Numérique (de g. à d.) : Antoine Marras (22), Thomas Kebaili (22) et Romain Bellon (22).
Le groupe CentraleSupélec Numérique récompense chaque année un projet de fin d’études de la dominante InfoNum1 et des mastères spécialisés MSI et SIO2, selon des critères de challenge technique, de potentiel business et de qualité de la présentation.
Le 11 avril 2023, ce prix annuel doté de 2 000 euros a été remis à trois élèves de la promotion 2022 en InfoNum, Romain Bellon, Thomas Kebaïli et Antoine Marras, pour leur projet « Fastest Random Forest » dont le but est d’optimiser sur carte graphique le célèbre algorithme random forest. En exploitant au maximum les nouveautés des cartes graphiques, cette solution permet d’accélérer le processus d’apprentissage de cet algorithme tout en conservant des niveaux de précision élevés.
Parmi les outils de la data science, le random forest se distingue comme un algorithme d’apprentissage automatique qui construit un ensemble de décisions arborescentes à partir de données d’entraînement. Ces arbres sont ensuite utilisés pour prédire des valeurs cibles à partir de nouvelles données. Ils ont aussi l’avantage d’être plus facilement explicables que d’autres algorithmes classiques comme les réseaux de neurones, répondant ainsi à un enjeu sociétal primordial de transparence. Les nombreuses applications de cet algorithme généraliste vont de l’analyse de données médicales complexes à de l’entraînement sur des jeux massifs de données financières en passant par la possibilité de classifier de grands volumes de données spatiales, ce qui nécessite de fortes puissances de calcul.
Malheureusement, l’algorithme est pensé pour CPU et profite peu des dernières avancées sur les cartes graphiques. L’essentiel du travail a donc reposé sur une meilleure gestion des accès mémoire et un choix de structures de données adaptées à cet algorithme.
Les premiers résultats obtenus sur le data center d’enseignement de Metz, financé en partie par la Fondation CentraleSupélec, indiquent des gains de performances jusqu’à un facteur 100 par rapport au standard industriel, et jusqu’à un facteur 14 par rapport à l’optimisation de la société Nvidia sur ses cartes graphiques. La prochaine étape consistera à déployer cette solution chez de nombreux industriels afin de leur permettre de gérer des données plus complexes et en plus grand nombre.
1. Informatique et numérique.
2. Management des systèmes d’information et ingénierie des systèmes informatiques ouverts.
Commentaires0
Veuillez vous connecter pour lire ou ajouter un commentaire
Articles suggérés