Retour sur les 54èmes journées de la statistique
Le 5 octobre 2023Événement incontournable de la communauté francophone de Statistique, Les Journées de la Statistique (JdS) sont revenues pour une 54ème édition sur le Campus du Solbosch de l’Université libre de Bruxelles. Organisées chaque année par la Société Française de Statistique (SFdS), ces journées de conférences sont l’occasion de rencontrer des experts et de découvrir les dernières avancées dans tous les domaines de la Statistique, aussi bien théoriques qu’appliquées, et d’échanger avec des chercheurs passionnés.
Nos data-scientists se sont rendus sur place. Zoom sur les dernières avancées du secteur.
Statistique, data science, IA… kézako ?
Reprenons les bases. La statistique est un domaine mathématique qui vise à analyser les données et en extraire des caractéristiques pour étudier des phénomènes. Pilier de la Science des Données (ou Data Science), la statistique joue un rôle primordial en Intelligence Artificielle (IA).
Et l’IA dans tout ça ? Une partie de cette technologie, notamment le Machine Learning (ML), se base sur l’apprentissage d’informations à partir de données pour construire et entraîner des modèles prédictifs.
Généralement les méthodes d’apprentissage issues de la Statistique ont l’avantage d’être interprétables et explicables. Un point crucial dans les activités de DiagRAMS Technologies.
La statistique au service des défis industriels
Comment surmonter les limites des méthodes statistiques classiques face à la complexité des problèmes rencontrés ou des données industrielles (données hétérogènes, corrélation, grande dimension…)? Comment éviter les biais inhérents aux prétraitements manuels ? Comment privilégier des méthodes explicables et interprétables (IA de confiance) et éviter l’effet boîte noire (utilisations de méthodes plus complexes comme celles basées sur le Deep Learning).
Quelques méthodes intéressantes partagées à l’occasion des JdS 2023 :
- L’intégration de contraintes de lois physiques dans l’apprentissage de modèles de régression. Une méthode permettant d’assurer un certain niveau de réalisme lors des prédictions du modèle, un point fondamental dans nos applications industrielles.
- Le concept de signatures pour obtenir automatiquement une représentation de séries temporelles simple et exploitable par des méthodes de Machine Learning.
- La fission de données, une alternative au data splitting ou encore le kernel thinning qui est une méthode de compression de données plus efficace que des méthodes classiques de sous-échantillonnage.
Rendez-vous aux Jds 2024
Pour continuer à rester en veille sur les dernières tendances de la recherche appliquée à l’industrie, l’équipe data science de DiagRAMS aura le plaisir de participer à la 55ème édition des Journées de la Statistique du 27 au 31 mai 2024.