ENGINEERINGNET.BE - Haar PreDiCT (PREdictive analytics for machine DIagnositcs and healthCare applicaTions) team telt een dertigtal medewerkers en is deel van het 300 researchers sterke IDLab aan de UGent en imec.
In het najaar stond ze, als één van de vijftig Belgische vrouwelijke rolmodellen in tech, op de groepsfoto te midden de Inspiring50. In haar vrije tijd geeft ze STEM workshops aan kinderen.
“We staan nog maar aan het begin”, zegt Van Hoecke. Veel bedrijven starten nu pas met machine learning (ML) op hun data. “Naast de puur datagedreven aanpak, kijken wij nu naar hybride AI. Daarbij gaan we een stap verder met machine learning door ook domeinkennis expliciet mee te nemen.
Dat doen we door kennis uit fysieke of wiskundige modellen of domeinkennis door jarenlange ervaring van de expert te capteren en mee te embedden in de ML modellen. Op die manier hoeft het model niet meer te leren wat al gekend is, en gebruiken we de reeds beschikbare kennis over een machine om er een delta op te zetten.”
Hybride AI aanpak
Er bestaan veel fysische modellen, maar die zijn systeemspecifiek en elke storingsmodus moet afzonderlijk gemodelleerd worden. Bepaalde falingen zijn te modelleren. Maar andere storingen (zoals stof, verkeerde uitlijning of vervuiling van de smering) zijn dan weer moeilijker fysisch te modelleren. ML kan dit wél leren als je over de juiste data beschikt.
“Het is echter een nadeel dat ML vaak een ‘black box’ of ‘gray box’ is, dat je niet goed weet hoe de machine aan haar resultaten komt. Dat zal nooit zo duidelijk zijn als een fysisch model, maar natuurlijk wel een stuk sneller en eenvoudiger op te stellen. Beiden hebben dus hun voor- en nadelen. Met een hybride AI aanpak combineer je beide sterktes en kan je tegemoetkomen aan hun tekortkomingen en inzicht krijgen in je ML. Hybride AI leidt tot krachtiger en meer betrouwbare modellen, en zal ook het toelichten van het model vereenvoudigen”, zegt Van Hoecke.
“Wij geloven dat hybride AI voor maintenance de toekomst is.” Het gaat er niet alleen om mensen van repetitieve taken te ontlasten. “De technicus moet ook kunnen vertrouwen op de predicties. Er kan al heel veel maar … pure datagedreven ML kan maar wat het kan. Het vergt nog steeds expertkennis en het haalt alsnog geen ‘rekenmachineniveau’. De ‘next step’ is om wat gebeurt verklaarbaar en betrouwbaar te maken. Dat wordt de grootste uitdaging om het in het veld te implementeren. Het gaat dus niet om het ontwikkelen van de hipste en zotste AI, maar om hoe je AI echt in de praktijk brengt.”
Opvallen
“Ik deed altijd graag wiskunde en heb lang getwijfeld. Het voordeel van ingenieursstudies was dat ik niet van bij de start moest kiezen welke specifieke richting ik uit zou gaan.” In de kandidaturen aan UGent deed ze als vakantiejob nog onderzoek bij OCAS, zowel in materiaalkunde als informatica “maar leren programmeren en de wereld van de ICT vond ik leuker.”
Dus koos ze na twee jaar voor computerwetenschappen. “Mijn eerste computer kocht ik pas tijdens mijn eerste kandidatuur. Het intrigeerde me gewoon.” Computerwetenschappen was toen nog een vrij mannelijke richting. Nog eigenlijk. “Ik was drie jaar lang de enige vrouw. Ik ging ook altijd naar de les, wat goed was want het viel nogal op als ik er niet was.”
Bezig zijn met technologie van morgen
Haar thesis deed ze bij IDLab, het Internet Technology and Data Science Lab aan de UGent, de groep waarbinnen ze vandaag nog steeds (of weer) actief is. Daarna, in juli 2003, twijfelde ze even om naar de industrie te trekken. “Ik mocht ook starten maar ik ging uiteindelijk toch doctoreren om met de technologie van morgen bezig te zijn in de plaats van met die van gisteren.”
Ze focuste op het traject tot aan de ‘proof of concept’, terwijl je in de industrie naar een stabiel product moet schuiven. Zes jaar later doctoreerde ze op de ‘QoS brokering voor gezondheidsdiensten’. “Ik ontwikkelde een soort reisbureau voor concrete applicaties in de gezondheidszorg. Mijn ‘makelaar’ zocht het allemaal voor je uit. Heel transparant en zonder overhead.” Na een korte periode als postdoc, werd ze aan Howest research coördinator en docent ICT voor industrieel ingenieurs.
“In die tijd gingen de hogescholen academiseren en ging ik op zoek naar mijn eigen onderzoekslijn.” Door de integratie van de opleiding van industrieel ingenieurs, kwam ze terug aan de UGent, haar alma mater. In oktober 2013 werd ze Assistant Professor en vier jaar later Associate Professor aan de IDLab onderzoeksgroep van de Gentse universiteit en imec. “Ik heb de samenwerking met de collega’s die hier al waren en mijn PreDiCT team versterkt wat leidde tot een sterke groei.”
AI is hot
“Ik schreef tal van onderzoeksvoorstellen en haalde er, gelukkig, bijzonder veel binnen. We groeiden snel en hebben nu een team van ongeveer 30 man. Artificiële intelligentie is hot.” De belangstelling voor AI werd gevoed door een technologiepush, de IoT-golf, aanvankelijk in de domotica en dan ging ook de industrie allerlei sensoren plaatsen. Veel bedrijven verzamelden data maar “wisten vaak niet goed wat ze ermee konden om hun maintenance te verbeteren. Eerst namen grotere bedrijven contact met ons op.
Later ook middelgrote bedrijven. Nu zetten kleinere bedrijven eveneens de stap. Vanuit de academische wereld proberen we hen te helpen iets nuttigs met de data te doen.” Veelal hebben deze bedrijven zelf ingenieurs en data scientists in huis. “Het gaat dan ook niet om triviale problemen. Ze vereisen onderzoek. Wij coachen en proberen de meer uitdagende problemen op te lossen. Vaak vergt dat innovatieve oplossingen.” Er gaat veel tijd naar dataexploratie, het visualiseren van data, het blootleggen van inzichten en het trainen van ML modellen. “Wij helpen op methodologisch vlak.”
Uitdagendere taken
In AI zijn er eenvoudigere en meer uitdagende taken. Als je bijvoorbeeld wilt leren of iets een appelsien is of een appel op basis van, bijvoorbeeld, beelddata, kan je gewoon veel van die beelden verzamelen, en zelf labelen of meerdere mensen vragen je te helpen bij het labelen. “Je hebt dus geen dure en drukbezette domeinexpert nodig om gelabelde data te verkrijgen om je ML model te trainen.
Wij focussen echter op cases waar die labels, die je nodig hebt om modellen te bouwen, schaars zijn of zelfs helemaal ontbreken.” Als er weinig tot geen labels zijn, kan je in de data zoeken naar anomalieën. “Wij koppelen dit dan terug naar een expert om, op basis van zijn feedback, de modellen te verfijnen.” Zo hoeft die expert niet uit al die data de fouten te gaan labellen.
“Doordat veel bedrijven vooral ongelabelde data hebben, zetten wij in op anomaliedetectie die weinig tot geen labels vergt. Die anomalieën brengen we snel bij de expert via dynamische dashboards die de anomalieën en hun context visualiseren. Zo kan de expert eenvoudig events labellen, én op basis van enkele labels kunnen we het labellen zelf ook automatiseren met ML. Tegelijk kan de expert naar een duidelijker foutbepaling schuiven. Over welk type lagerfout gaat het, bijvoorbeeld. Of is het een onbalans? Hoe meer feedback de expert ingeeft, des te specifieker kan de AI worden.”
Co-creatie met de industrie
Vroeger liet men een machine lopen tot ze kapot ging om ze dan te herstellen. Later ging men ‘preventief’ onderdelen vervangen om te voorkomen dat de machine plat ging. Nadeel: veel componenten worden dan te vroeg vervangen. Je wilt dus zo dicht mogelijk bij het eindeleven van die componenten pas tussenkomen. “Maar als je je componenten veel te vroeg vervangt, heb je geen end-of-life data om je modellen in de field te trainen om die end-of-life te voorspellen …”
Train je een model in een bepaalde omgeving en de omstandigheden veranderen, zal je model ook geen betrouwbare voorspellingen meer geven. Een foutdetectiemodel voor een compressor, die getraind is op voorbeelddata uit een warme omgeving, zal geen correcte foutdetectie doen wanneer het model plots voor een compressor in vriestemperaturen moet draaien. “We hebben hier nood aan ‘context-aware learning’.
De hiervoor ontwikkelde methodologie werkt zeer goed voor veranderende omstandigheden, maar de meest uitdagende is om de resultaten van set-ups in het lab te transponeren naar de field”, geeft Van Hoecke aan. In een fabriekshal, met alle nitty gritty, zijn de omstandigheden vaak veel complexer dan in het lab. Daarom is het interessanter direct van industriële data te vertrekken.
“Wij zoeken de relevante data en events in hun grote datasets. Om buikgevoel te krijgen, zitten we vaak samen met een mechanisch expert van het bedrijf. Vinden we tijdens de data-exploratie interessante features dan trainen we daarop die anomaliedetectiemodellen. Vandaar koppelen we terug naar de expert. Het is een vorm van co-creatie.”
Uit de praktijk
Ze geeft projectvoorbeelden. “Samen met Renson Ventilation zetten we met het imec.icon project DyVerSiFy een anomaliedetectie op met geïntegreerde feedback. Het systeem werd ‘slimmer‘ met de feedback die het kreeg.” Hierdoor konden bepaalde problemen, waarvoor vroeger een technieker langs moest gaan, remote opgelost worden.
“Met Televic Rail leerden we op basis van een sensor, een accelerometer, op het onderstel van de trein het verschil te zien tussen een probleem aan het spoor en aan de trein, of wanneer er een overloopwissel was.” Binnen het imec.icon project Radiance, leerde het IDLab samen met Skyline Communications dat modellen die getraind zijn in één context niet zomaar naar een andere context overdraagbaar zijn. Een netwerk in landelijk gebied is anders dan in stedelijk gebied. Modellen ‘context aware’ trainen vergt het vergaren van extra data om te tunen.
“Door slimme methodes te ontwerpen beperkten we die extra data tot een minimum door per context een nieuw model te maken vanuit de meest gelijke buur in de plaats van telkens vanuit het basismodel te vertrekken.” In de Noordzee focuste een project op het voorspellen van de energieopbrengst van offshore windturbines. Er wordt ook samengewerkt met Volvo’s paintshop, met Arcelor Mittal …
“Wij focussen binnen het team vooral op tijdseriesdata en soms ook wel op beelddata.” Momenteel vertaalt het zijn onderzoek ook naar een maintenanceproject voor de voedingsindustrie.
Problemen oplossen vanuit onderzoek
“Wij groeiden organisch in de maakindustrie en breiden nu uit naar andere markten”, zegt Van Hoecke. Daarbij maakt ze gebruik van de zogenaamde COOCK projecten (Collectief Onderzoek & Ontwikkeling en Collectieve Kennisverspreiding/-transfer) van Vlaio. Ze benadrukt dat het lab problemen oplost die nog onderzoek vergen en nul ambitie heeft om met bedrijven te concurreren.
“Als startende prof was het best wel even zoeken”, zegt Van Hoecke. Haar team telt een dertigtal medewerkers, goed voor jaarlijks een tweetal doctoraatsverdedigingen. “Het is leuk dat er zoveel problemen een oplossing vragen. Een jong team zien groeien, is ook plezant.” Een vijfde van het team wordt door een persoonlijke beurs gefinancierd.
“Maar het grootste deel van het team wordt betaald door met de industrie samen te werken. Dus dat betekent heel wat project proposals te schrijven. Funding binnenhalen is veel werk. Het tempo in de onderzoekswereld is hard. Maar eenmaal de bal begint te rollen, moet je hem vooral laten rollen en op tijd en stond hier of daar een duwtje bijgeven.”