Dossier : Fast Data

La SNCF espère prédire une panne une demi heure à l’avance

La compagnie ferroviaire a lancé un projet de maintenance prédictive afin de fiabiliser les rames et d’éviter la désorganisation du trafic. Pour l’heure, ce projet concerne les rames communicantes qui circulent en Île-de-France. Mises en service en 2009, celles-ci envoient chaque mois 72.000 enregistrements de données techniques.

La SNCF compte sur la maintenance prédictive pour éviter les défaillances des rames.

© SNCF / Yann Audic

Avec ses quelques 6 200 trains, le réseau Transilien transporte chaque jour en Île-de-France plus de 3 millions de voyageurs. Or la moindre défaillances des rames peut désorganiser le trafic et engendrer des retards. D’où l’intérêt d’anticiper les pannes avant qu’elles ne se produisent. La SNCF y travaille avec un projet de maintenance prédictive des matériels roulants qui va améliorer la fiabilité et la disponibilité des trains, tout en renforçant la sécurité des passagers et des agents. Et ce, à coût de maintenance équivalent, voire même inférieur. Ce projet avancé s’appuie sur un système de télédiagnostic existant qui traite déjà les données télétransmises par les 182 nouvelles rames fournies par Bombardier et mises en service dès 2009 sur le territoire francilien.

A bord de ces trains, des dizaines de capteurs supervisent en temps réel l’ensemble des organes. A savoir, les moteurs, freins, portes, climatisateurs, etc. « Par exemple, le moindre échauffement est détecté et envoyé toutes les 30 minutes via l’ordinateur de bord au système central de gestion de la SNCF », explique Philippe de Laharpe, chef de projet télédiagnostic au sein de la direction du matériel roulant. Alors que les TGV envoient par mois quelques 2 000 lignes de logs (enregistrements de données techniques), ces nouvelles rames franciliennes en transmettent 72 000 relatives à 40 000 variables. Ces données sont déjà traitées automatiquement afin d’engager des opérations de maintenance corrective. Mais les règles métier sont élaborées manuellement par des experts. Un processus lent, coûteux et limité.

Grâce au Big Data, les données sont croisées avec d’autres sources d’information comme les comptes rendus d’intervention de maintenance, les horaires de circulation des rames, la météo et les ordres de maintenance planifiée sans oublier les rapports d’incidents rédigés par les experts. Soit une centaines de gigaoctets. « Les données sont traitées en quasi temps réel dans un Data Lake, un « lac » de données, par un moteur d’analyse prédictif et des algorithmes de Machine Learning développés en interne à partir de logiciels Open Source », explique Héloise Nonne, responsable du pôle Data Science de la Big Data Fab de la SNCF où une dizaine de Data Scientits travaillent. L’équipe a construit une dizaine de modèles prédictifs spécialisés pour les portes, la climatisation, les équipements de sécurité, etc. « A terme, nous pourrons prédire une panne une demi heure à l’avance », souligne Héloise Nonne.

Ce projet a démarré l’an dernier en collaboration avec Quantmetry, un cabinet de conseil et d’ingénierie en méga données. Une phase pilote a débuté depuis peu pour une durée de six mois avant la mise en production. Durant cette phase de tests, les experts observent les performances en comparant les prédictions du moteur à ce qui se passe réellement afin de rectifier les erreurs d’apprentissages et détecter les corrélations erronées. « Après avoir ajusté les modèles de Machine Learning, il faudra ensuite mettre en place des processus de remontée d’alerte provenant de la plate-forme jusqu’au système de supervision de la flotte afin qu’il y ait des actions en temps réel », indique Philippe de Laharpe. Si le système démontre sa pertinence il sera étendu aux nouvelles générations de trains régionaux comme le Regiolis d’Alstom et les futurs Regio-2N de Bombardier qui desserviront notamment l’Île-de-France ainsi qu’au futur RER NG prévu pour 2019.

© Eliane Kan/TCA-innov24