Sofie Van Hoecke: "L'IA n'est pas encore une calculatrice"

«Tout le monde connaît ChatGPT. Mais il faut savoir quoi faire. Ce n'est pas encore une calculatrice. On ne peut pas lui faire aveuglément confiance», déclare Sofie Van Hoecke, professeur d'IA hybride pour la maintenance prédictive et les soins de santé.

Mots clés: #ChatGPT, #IA, #intelligence artificielle, #maintenance, #santé

Lire plus

Ingénieurs de haut niveau

( Photo: LDS )

ENGINEERINGNET.BE - Son équipe PreDiCT (PREdictive analytics for machine DIagnostics and healthCare applicaTions) compte une trentaine de collaborateurs et fait partie de l'IDLab de 300 personnes de l'UGent et de l'imec.

À l'automne, en tant que l'une des cinquante modèles féminins belges de la tech, elle posait sur la photo de groupe au milieu de l'Inspiring50. Dans ses temps libres, elle enseigne aux enfants au cours d'ateliers STEM.

«Nous n'en sommes encore qu'aux préliminaires », déclare Van Hoecke. Bien des entreprises ne font que débuter à lâcher le Machine Learning (ML) sur leurs données. « Outre l'approche purement basée sur les données, nous examinons actuellement l'IA hybride. De cette manière, nous allons encore un pas plus loin avec le machine learning en incluant explicitement la connaissance du domaine.

Pour ce faire, nous captons les connaissances des modèles physiques et mathématiques ou les connaissances des domaines issus d'années d'expérience d'experts ; nous les intégrons alors dans les modèles de ML. De cette manière, le modèle n'a plus besoin d'apprendre ce qui est déjà connu, et nous utilisons les connaissances déjà acquises sur une machine pour y ajouter un delta. »

Approche IA hybride 
De nombreux modèles physiques existent. Seulement, ils sont dédiés à chaque système et chaque mode de défaillance doit être modélisé séparément. Certaines défaillances sont modélisables. Cependant, d'autres (telles que la poussière, le désalignement ou la contamination de la lubrification) sont plus difficiles à modéliser physiquement. Le ML est capable d'apprendre ces phénomènes si les données pertinentes sont disponibles.

« Cependant, l'inconvénient est que le ML est souvent une ‘boîte noire’ ou une ‘boîte grise’ ; l'on ne sait pas vraiment comment la machine obtient ses résultats. Cela ne sera jamais aussi limpide qu'un modèle physique, mais bien sûr, c'est beaucoup plus rapide et facile à configurer. Les deux ont donc leurs avantages et leurs inconvénients. Avec une approche d'IA hybride, l'on combine les deux atouts puis, l'on peut combler les lacunes et mieux appréhender le ML. L'IA hybride mène à des modèles plus puissants et plus fiables et conduira également à expliciter le modèle », déclare Van Hoecke. « Nous pensons que l'IA hybride pour la maintenance est l'avenir. »

Il ne s'agit pas seulement de décharger les gens des tâches répétitives. « Le technicien doit aussi pouvoir se fier aux prédictions. Beaucoup est déjà réalisable, mais ... le ML purement axé données ne peut faire que ce qu'il peut. Il nécessite encore toujours des connaissances expertes et n'atteint toujours pas le ‘niveau de la calculatrice’. L'étape suivante est de rendre ce qui se passe explicable et fiable. Il s'agit plus grand défi à implémenter sur le terrain. Il ne s'agit donc pas de développer l'IA la plus branchée et la plus folle, il s'agit de savoir comment réellement mettre l'IA en pratique. »

Absence remarquée 
« J'ai toujours adoré les maths et j'ai longtemps douté. L'avantage des études d'ingénieur, c'est que je n'avais pas à choisir mon orientation future dès le départ. » Lors de ses candidatures à l'UGent, elle faisait de la recherche à l'OCAS au cours de jobs de vacances ; à la fois en science des matériaux et en informatique « mais j'aimais davantage apprendre à programmer et le monde des TIC. »

Elle a donc au bout de deux ans choisi l'informatique. « Je n'ai acheté mon premier ordinateur que lors de ma première candidature. Cela m'intriguait tout simplement. » À l'époque, l'informatique était encore une orientation assez masculine. Actuellement toujours en fait. « J'ai été la seule fille dans l'aula pendant trois ans. J'allais aussi quotidiennement au cours, ce qui était nécessaire car mon absence était toujours remarquée. »

Les entreprises ne sont pas laissées en reste 
Les entreprises qui veulent extraire leurs données pour y appliquer l'intelligence artificielle ne sont pas forcément laissées pour compte. Elles peuvent tester des idées de recherche au sein des projets R&D de Vlaio. Les projets imec.icon proposent une formule différente où trois entreprises d'un consortium travaillent conjointement sur un projet. « Notre contribution concerne la Flandre entière. Nous sommes dans le cockpit pour piloter la recherche avec et pour chaque entreprise spécifique. Dans ce contexte, nous allons jusque et y compris une démo en vie réelle. » Ce ne sont pas des dossiers insignifiants ; ils sont également chronophages. « Cependant, certaines entreprises préfèrent travailler avec nous de manière bilatérale. Lorsque leur portefeuille de subventions est consistant, par exemple, ou si elles ne veulent pas dévoiler leur jeu. » L'université peut aussi laisser un étudiant en mémoire de maîtrise ressasser une problématique par une recherche exploratoire.

Travailler sur la technologie du futur 
Elle faisait sa thèse à l'IDLab. C'est l'Internet Technology and Data Science Lab de l'UGent, le groupe dans lequel elle est encore (ou à nouveau) active aujourd'hui. Puis, en juillet 2003, elle hésitait à se lancer dans l'industrie. « J'ai aussi été invitée à commencer ; finalement, je suivais un doctorat pour pouvoir travailler à la technologie du futur plutôt qu'à celle du passé. » Elle se concentrait sur les processus aboutissant à la ‘preuve de concept’, alors que dans l'industrie, il faut développer jusqu'au produit stable. Six ans plus tard, elle doctorait sur le QoS brokering pour les services de soins de santé.

« J'ai développé une sorte d'agence de voyage pour des applications concrètes dans le domaine des soins de santé. Mon ‘courtier’ réglait tout en la matière. De manière très transparente et sans frais généraux. » Après une courte période en tant que postdoc, elle devenait coordinatrice de recherche et chargée de cours en TIC pour les ingénieurs industriels à l'Howest.

« À cette époque, les Hautes écoles commençaient à s'académiser et j’entamais la quête de ma propre ligne de recherche. » Vu l'intégration de la formation d'ingénieurs industriels, elle retournait à l'Université de Gand, son alma mater. En octobre 2013, elle devenait professeure assistante et quatre ans plus tard professeure associée au groupe de recherche IDLab de l'Université de Gand et de l'imec. « Je renforçait la collaboration avec les collègues déjà en place et mon équipe PreDiCT, ce qui conduisait à une forte croissance. »

L'IA est en vogue 
« Je présentais de nombreuses propositions de recherche et heureusement, j'en remportais un grand nombre. La croissance était rapide et nous avons actuellement une équipe d'environ 30 personnes. L'intelligence artificielle est en vogue. » L'intérêt pour l'IA était propulsé par une poussée technologique : la vague IdO. D'abord dans la domotique, puis dans l'industrie qui commençait également à installer toutes sortes de capteurs.

De nombreuses entreprises collectaient des données mais « souvent ne savaient pas vraiment ce qu'elles devaient en faire pour améliorer leur maintenance. Les grandes entreprises nous ont d'abord contactés. Plus tard aussi des entreprises de taille moyenne. Actuellement, même les petites entreprises franchissent le pas. Le monde académique tente de les aider à faire quelque chose de pertinent avec les données. » Ces entreprises disposent souvent de leurs propres ingénieurs et ‘data scientists’ en interne.

« L'on ne parle pas ici de problèmes triviaux. Des études sont requises. Nous coachons et essayons de résoudre les problèmes les plus contraig-nants. Cela requiert fréquemment des solutions innovantes. » Beaucoup de temps est consacré à l'exploration des données, à la visualisation de ces dernières, à la découverte d'informations et à l’entraînement de modèles ML. « Nous assistons sur le plan méthodologique. » 

Tâches plus défiantes 
En IA, il existe des tâches plus simples et d'autres plus défiantes. Par exemple, si l'on veut savoir si un objet est une orange ou une pomme en se basant, par exemple, sur des données d'imageries, il suffit de collecter de nombreuses images et de les étiqueter soi-même ou demander à plusieurs personnes d'aider à ce travail.

« De cette manière, aucun expert de domaine coûteux et peu disponible est requis pour obtenir des données étiquetées afin d’entraîner le modèle du ML. Cependant, nous nous concentrons sur les cas où ces étiquettes, requises pour construire des modèles, sont rares ou même totalement absentes. » S'il y a peu ou aucune étiquette, il est possible de rechercher des anomalies dans les données ; « nous demandons alors l'avis d'un expert et sur base de son feedback, nous affinons le modèle ».

De cette manière, l'expert n'a pas à étiqueter les erreurs issues de toutes ces données. « En raison du fait que les sociétés disposent surtout de données non étiquetées, nous tablons sur la détection d'anomalies qui nécessitent peu ou aucune étiquette. Ces dernières sont promptement transmises à l'expert via des tableaux de bord dynamiques qui visualisent les anomalies et leur contexte.

L'expert peut ainsi facilement étiqueter les événements et sur la base de quelques étiquettes, il nous est également possible d'automatiser nous-mêmes l'étiquetage à l'aide du ML. Simultanément, l'expert peut passer à une détermination d'erreur plus claire. Par exemple, de quel type de défaillance de roulement s'agit-il. Ou est-ce un balourd ? Au plus l'expert fournit de feedback, au plus l'IA peut devenir spécifique. »

Cocréation avec l'industrie 
Dans le passé, une machine fonctionnait jusqu'à la panne, puis elle était réparée. Par la suite, des remplacements préventifs de pièces s'opéraient pour éviter les pannes machines. Inconvénient : de nombreux composants sont alors remplacés prématurément. L'on souhaite donc intervenir au plus près de la fin de vie de ces composants. 

« Mais si l'on remplace les composants prématurément, aucune donnée de fin de vie n'est disponible pour entraîner les modèles sur le terrain afin de prédire cette fin de vie ... » Si l'on entraîne un modèle dans un certain environnement et si les conditions changent, le modèle ne fournira plus aucune prédiction fiable. Un modèle de détection de défauts pour un compresseur entraîné sur des données d'exemple provenant d'un environnement chaud ne détectera pas correctement les défauts lorsque le modèle doit soudainement fonctionner pour un compresseur à des températures glaciales.

« Nous requérons dans ce cas-ci d'un apprentissage sensible au contexte. La méthodologie développée à cet effet est très correcte pour les conditions changeantes. La gageure est de transposer les résultats des configurations au labo sur le terrain », explique Van Hoecke. Dans un hall d'usine, avec toutes les dures réalités ‘nitty gritty’, le contexte est souvent beaucoup plus complexe qu'en laboratoire. C'est pourquoi il est plus intéressant de se fonder directement sur les données industrielles.

« Nous recherchons les données et les événements pertinents dans leur vaste jeu de données. Pour se faire une idée, nous conversons fréquemment avec un expert en mécanique de l'entreprise. Si nous apprenons des faits intéressants lors de l'exploration des données, nous entraînons les modèles de détection d'anomalies en conséquence. De là, nous retournons chez l'expert. C'est une forme de cocréation. »

Études de cas 
Elle donne des exemples de projets. « En collaboration avec Renson Ventilation, nous mettons en place une détection d'anomalies avec rétroaction intégrée dans le cadre du projet imec.icon DyVerSiFy. Le système est devenu ‘plus intelligent’ avec le feedback reçu. » Ainsi, certains problèmes nécessitant auparavant la visite d'un technicien, pouvaient être résolus à distance.

« Avec Televic Rail, nous avons engrangé les connaissances à l'aide d'un capteur (un accéléromètre) placé sur le châssis du train pour différencier un problème sur la voie ou sur le train, ou lorsqu'il passait sur un aiguillage. » Dans le cadre du projet imec.icon Radiance, l'IDLab et Skyline Communications réalisaient que les modèles entraînés dans un contexte ne peuvent pas tout simplement être transférés dans un autre contexte. Un réseau en zone rurale est différent d'un réseau en zone urbaine.

Les modèles ‘context aware’ nécessitent la collecte de données supplémentaires pour le réglage fin. « En concevant des méthodes intelligentes, nous avons réduit au minimum ces données supplémentaires en créant un nouveau modèle pour chaque contexte basé sur le voisin le plus identique au lieu de modeler systématiquement à partir du modèle de base. »

En Mer du Nord, un projet s'est concentré sur la prévision du rendement énergétique des éoliennes offshore. Il existe également une coopération avec Volvo pour leur paintshop, avec Arcelor Mittal … « Au sein de l'équipe, nous nous concentrons principalement sur les données de séries temporelles et parfois aussi sur les données d'imageries. » Actuellement, elle fait également des recherches pour un projet de maintenance dans l'industrie agroalimentaire.

L'industrie est fort exigeante 
« L'afflux d'étudiants est assez stable », explique Sofie Van Hoecke. « Cependant, la demande de l'industrie s'accroît annuellement. » Les personnes à la formation en IA n'ont vraiment pas de souci pour trouver un emploi à court terme. Ils sont littéralement arrachés des bancs scolaires. « Cela rend également la tâche défiante pour nous. Heureusement, les doctorants motivés sont toujours faciles à trouver. Mais l'industrie est fort exigeante. Nous investissons donc beaucoup dans le transfert de connaissances des anciens vers les jeunes. » Elle reste réaliste à ce sujet. « C'est notre mission de former les gens. 90% doit simplement être orienté industrie. Mais 10% pourrait être laissé en reste. Les premiers postdocs restent actuellement dans mon équipe. Les postdocs sont fort prisés par l'industrie … » La majorité de ceux qui rejoignent l'industrie restent en Flandre, observe-t-elle. « La principale motivation pour partir à l'étranger est de gagner de l'argent ou de travailler pour les grands noms de l'IA. Nombreux sont ceux qui reviennent après quelques années en raison de la culture ou du stress. »

Résolution de problèmes à partir de la recherche 
« Notre croissance était organique dans l'industrie manufacturière et nous nous orientons actuellement vers d'autres marchés », déclare Van Hoecke. Dans cet esprit, elle s'appuie sur les projets dits COOCK (R&D collective et diffusion/transfert collectif des connaissances) du Vlaio. Elle souligne que le labo résout des problèmes qui nécessitent encore des études et n'a aucune ambition à concurrencer les entreprises.

« En tant que prof. débutant, trouver son chemin n’était pas aisé », explique Van Hoecke. Son équipe est composée d'une trentaine de collaborateurs avec un suivi de deux soutenances annuelles de doctorat. « Il est plaisant que tant de problèmes nécessitent une solution. Voir une jeune équipe grandir, c'est tout aussi formidable. » Un cinquième de l'équipe est financé par une bourse personnelle.

« Mais la majeure partie de l'équipe est rémunérée en travaillant pour l'industrie. Cela se décline donc par la rédaction de nombreuses propositions de projets. La collecte de fonds exige beaucoup de travail. Le tempo dans le monde de la recherche est vif. Mais une fois que la balle commence à rouler, il faut la laisser rouler et lui donner une petite poussée ici et là. »