ARAM²: een adaptieve risico-assessment methode

In dit artikel geeft Peter Chemweno, doctoraatsstudent bij Prof. Liliane Pintelon (KU Leuven), een korte samenvatting van een door hem ontwikkelde methode voor risico-assessment.

Trefwoorden: #ARAM², #Centrum voor Industrieel Beleid, #KU Leuven, #Liliane Pintelon, #onderhoud, #Peter Chemweno, #risico-assessment, #storingsanalyse

Lees verder

maint_art

Download het artikel in

ENGINEERINGNET.BE - Doel is een oplossing te vinden voor de huidige, vaak beperkte methodes voor storingsanalyse die in de praktijk gebruikt worden.

Hiertoe wordt een geïntegreerde, holistische risico-management methode, ARAM² - Adaptive Risk Assessment Methodology for Maintenance Decision Support - voorgesteld. Het stap-voor-stap toepassen van deze methode ondersteunt het beslissingsproces voor een meer efficiënte en vooral meer effectieve onderhoudsstrategie.

Risico-management speelt een onbetwistbare rol bij het maken van onderhoudsbeslissingen. IEC/ISO 31010 [1] is hierbij een belangrijke referentie. In deze ISO-norm wordt een framework aangeleverd, dat via technieken en procedures de organisatie helpt op een doordachte manier met risico’s om te gaan. Het framework is niet specifiek op onderhoud gericht, maar is desalniettemin ook erg interessant voor asset management door de systematische benadering.

Risk assessment vormt de kern van dit framework en bestaat uit maatregelen die het mogelijk maken voor de organisatie om risico’s te identificeren, te analyseren, te evalueren en om zo deze risico’s en/of hun schadelijke impact zoveel mogelijk te beperken of te elimineren. Risk assessment helpt op die manier efficiënte en effectieve onderhoudsstrategieën te formuleren.

Nood aan geïntegreerde aanpak
Het definiëren van alle relevante risico’s in toestellen, equipment, installaties,… in een real-life setting is een grote uitdaging. Traditioneel wordt sterk vertrouwd op 'magic bullets' als Reliability Centered Maintenance of Life Cycle Costing om de optimale onderhoudstrategieën leveren voor onze organisaties [2]. Deze concepten mogen zeker niet onderschat worden, maar ze hebben ook hun beperkingen, dus magic bullets zijn het zeker niet.


Figuur 1: voornaamste stappen van de ARAM² methode.

Recente evoluties als prognostic maintenance leveren ook een belangrijke bijdrage [3]. Deze laatste 'data-driven' methodologieën zijn bijzonder interessant en winnen nog meer aan belang dankzij de evolutie in sensortechnologieën en intelligente algoritmes die toelaten de status van equipment te beoordelen.

Desalniettemin zijn er nog steeds heel wat bedrijven die hiervan nog geen gebruik maken en meer vertrouwen op de ervaring van de expert, al dan niet aangevuld met informatie uit het EAM (enterprise asset management system) of CMMS (computerized maintenance management systems) [4].

Algemeen is er de vaststelling dat er een nood is aan een geïntegreerde aanpak die alles haalt uit de aanwezige informatie en waar mogelijk beslissingsondersteunende tools inzet om het onderhoud te optimaliseren. Zo’n aanpak werd ontwikkeld aan het CIB: de ARAM2 of ‘Adaptive Risk Assessment Methodology for Maintenance Decision Support’.

De ARAM2-methode
De ARAM2-methode volgt de ISO 31000 stappen voor risico assessment en in elke stap zijn enkele technieken en tools nodig voor het kwantificeren en inperken van onderhoudsrisico’s vervat. Figuur 1 vat de methode samen.


Figuur 2: verwachte kosten distributie voor een specifieke failure mode.

(1) Risk assessment process. In deze stap wordt een gestructureerde aanpak voorgesteld voor het identificeren, analyseren en inschatten van onderhoudsrisico’s. Het gaat hier om technische storingsrisico’s, niet zozeer om veiligheidsrisico’s. Belangrijk hierbij is onder meer een identificatie van alle risico’s en een objectieve kwantificatie van deze risico’s, zodat er een prioritisering voor aanpak kan opgesteld worden.

Er wordt hierbij gedacht aan methodes als FMEA (failure mode effect analysis, [4]) of een geavanceerde versie ervan, bv. cost-based FMEA die ook kosten (downtime, wisselstukken, werkuren, …) linkt aan de respectievelijk failure modes/storingstypes. De verzamelde historische kunnen verder verrijkt worden door Monte Carlo simulatie.

(2) Root cause analysis. Uit de vorige stap kennen we de belangrijkste risico’s, namelijk de failure modes met de grootste ongewenste impact. Het is nu belangrijk niet enkel op de symptomen te gaan reageren, maar naar de root cause te gaan zoeken. Dit kan op twee (of een combinatie van de twee) manieren.

Enerzijds is er de traditionele, vrij kwalitatieve, methode gebaseerd op de ervaring van betrokken techniekers en ingenieurs. Typisch worden hierbij tools ingezet als 5-whys of Ishikawa-diagramma’s.

Anderzijds zijn er de data mining benaderingen die toelaten patronen in grote datasets te gaan opsporen met technieken als bv. cluster analyse of association rule mining. Deze data mining vraagt meestal een aanzienlijke inspanning qua datasetvoorbereiding alsook een doorgedreven kennis van de algoritmes terzake [5].

(3) Maintenance decision support. Eens de storingsoorzaken (root causes) en hun verbanden gevonden, moet een onderhoudsstrategie gekozen worden. Traditionale beslissingsbomen (cfr RCM) vormen een basis.

ARAM2 gaat een stap verder door simulatiemodellen voor te stellen voor het vergelijken van alternatieve onderhoudsstrategieën aan de hand van verschillende criteria. Dit laat toe op een gefundeerde manier de beste strategie te kiezen.

Case study Risk Assessment: thermische centrale
Als case study beschrijven we een implementatie van ARAM2 in een thermische centrale in Kenya. Dergelijke centrales voorzien cruciale noodstroom en bestaan typisch uit onderling gekoppelde prime movers, gevoed door verschillende energiebronnen.

Deze energiebronnen kunnen industriële dieselolie (IDO), steenkool of natuurlijke gassen zijn. Voor de centrale in de case werden, over een periode van drie jaar, 1.003 individuele failure modes verzameld en gestructureerd, waarbij er speciale aandacht werd besteed aan het toewijzen van kostimplicaties aan elke failure mode. Op die manier konden de risico’s gekwantificeerd worden via een functie die de verwachte waarde van de kost geeft [6]:

waarbij Pi de waarschijnlijkheid van optreden van storingen ten gevolge van failure mode i, Ci de kosten veroorzaakt door failure mode i, en n het totaal aantal storingen geregistreerd over de periode van drie jaar.

Via Monte Carlo simulatie werd voor elke failure mode een kostendistributiefunctie opgesteld, gebruik makend van historische data inzake het optreden van failure modes en de gerelateerde kosten. Figuur 2 illustreert zo’n kostendistributiefunctie voor een failure mode, de verwachte kost. De verwachte (gesimuleerde) kost van de failure mode bedroeg ongeveer 89.000 euro (95th percentiel).

Vervolgens werden alle failure modes gerangschikt op basis van de te verwachten kosten. Tabel 1 toont de resultaten van - op kostenbasis - de tien meest kritieke storingen. De eerste twee gerangschikte failure modes veroorzaken grote kosten en dienen dan ook de hoogste prioriteit te krijgen in de verdere analyse.

Root cause analysis
Na het bepalen van deze prioriteiten is de root cause analysis de volgende cruciale stap. Deze stap is vaak moeilijk. Het storingsgedrag van een asset wordt bepaald door het onderliggende storingsgedrag van de vele onderdelen.

Deze onderdelen beïnvloeden elkaar. Bovendien kan een storing in één onderdeel schade veroorzaken aan andere onderdelen (secundaire schade). Dit maakt een statistische analyse van het globale storingsgedrag een (vaak te) grote uitdaging. In de praktijk gaat men dan ook vaak over tot het gebruik van cognitieve mapping tools zoals bv. Ishikawa (cause-and-effect) diagramma’s.

Extra informatie kan bekomen worden uit de rapportering van de techniekers. Voor de thermische centrale is er geen EAM (enterprise asset management) beschikbaar, maar wordt de storingsinformatie als vrije tekst ingevoerd in een Excel-sheet. Het standaardiseren van deze vrije tekst naar een meer standaard woordenschat vraagt veel werk, maar is absoluut noodzakelijk voor een degelijke verwerking van deze informatie. Standaarden zoals de  ISO 14224 [7] en de ASD-STE100 [8] zijn hiervoor interessante bronnen.

In de ARAM2-methode werd de  ISO 14224 standaard woordenschat gebruikt voor de registratie van failure modes en storingscomponenten. Uit de resulterende gestandaariseerde gegevens kunnen de oorzakelijke verbanden tussen storingen verder onderzocht worden gebruik makend van methodes zoals de principal component analysis (PCA) en cluster analyse. Figuur 3 illustreert de resultaten van zo’n analyse [9].

Hieruit kunnen dan op een intuïtieve manier de potentiële storingsoorzaken voor de verschillende storingen afgeleid worden. Vanuit de oorzakelijke kaart kunnen we op een vrij intuïtieve manier de mogelijke oorzaken van de thermische motorstoring identificeren.

Maintenance decision support
Het komt er nu op aan de geïdentificeerde storingsoorzaken aan te pakken met de juiste onderhoudsstrategie. In de literatuur worden verschillende beslissingsondersteunende methodes voor het bepalen van onderhoudsstrategieën beschreven, gaande van eenvoudige beslissingsschema’s, zoals voorgesteld in RCM, tot meer geavanceerde simulatiemodellen.

De ARAM2-methode gebruikt beide. Onderhoudsstrategieën worden geselecteerd met behulp van beslissingsbomen. Beslissingsbomen zijn geschikt als een ‘quick and dirty’ methode en kunnen beslissingscriteria als detecteerbaarheid van de failure mode (denk aan potentiële condition monitoring) of mogelijkheid tot herontwerp (denk aan design-out maintenance-mogelijkheden) incorporeren [10].


Figuur 3: storingsoorzaken in beeld gebracht.

Om een beter zicht te krijgen op de effectiviteit van de geselecteerde strategieën worden simulatiemodellen gebouwd. Simulatie, meer bepaald DES (discrete event simulation), is tegenwoordig een erg populaire methode in onderhoudsbeslissingsondersteuning.

Simulaties laten immers toe om alternatieve strategieën met elkaar te vergelijken, dit op verschillende vlakken, bv. kosten, aantal storingen, downtime, etc. Er zijn tegenwoordig heel wat goede commerciële simulatiepakketten op de markt.

Niettegenstaande ze het simuleren vergemakkelijken door bijvoorbeeld het gebruik van intuïtieve grafische interfaces, blijft inzicht en ervaring met modellering van stochastische processen een noodzaak.


Besluit
De beschreven ARAM2-methode probeert een zo goed mogelijke beslissingsondersteuning voor het bepalen van de onderhoudsstrategie te bieden. Centraal in de methode staat het risk assessment. De RCA gebeurt zowel op basis van historische, kwantitatieve gegevens als op basis van extra informatie aangeleverd door techniekers. Het nut van beslissingsbomen wordt niet in vraag gesteld, maar er wordt een stap verder gegaan door ook een beroep te doen op simulatie. ARAM2 laat echter ruimte voor het kiezen van de aan de situatie aangepaste tools.
De kracht van ARAM2 zit in de grondige analyse van de mogelijke storingen en hun gevolgen, waarbij een goed geselecteerde mix van beslissingsondersteunende technieken worden ingezet. Het stappenplan gaat verder dan een geïsoleerde optimalisatie, het verzekert een meer holistische aanpak en optimalisatie.


door Peter Chemweno, Centrum voor industrieel beleid KU Leuven

REFERENCES
[1] ISO 31010, «Risk management - Risk assessment techniques».
[2] Moubray J. «Reliability centered maintenance» Industrial Press Inc. New York; 1997.
[3] Van Horenbeek A, Pintelon L. «A dynamic predictive maintenance policy for complex multi-component systems». Reliability Engineering & System Safety. Vol. 120, pp. 39-50, 2013.
[4] Chemweno P, Pintelon L, Van Horenbeek A, Muchiri P. «Development of a risk assessment selection methodology for asset maintenance decision making: An analytic network process (ANP) approach». International Journal of Production Economics. Vol. 170, Part B, pp. 663-676, 2015.
[5] Galar D, Gustafson A, Tormos B, Berges L. «Maintenance decision making based on different types of data fusion». Eksploatacja i Niezawodnosc, Maintenance and Reliability. Vol. 14, pp. 135-144, 2012.
[6] Rhee SJ, Ishii K. «Using cost based FMEA to enhance reliability and serviceability». Advanced Engineering Informatics. Vol. 17, pp. 179-188, 2003.
[7] ISO 14224-2006, «Petroleum, petrochemical and natural gas industries - collection and exchange of reliability and maintenance data for equipment».
[8] Aerospace and Defence Industries Associations of Europe (2013), ASD Simplified Technical English, Specification ASD-STE100.
[9] Chemweno P, Morag I, Sheikhalishahi M, Pintelon L, Muchiri P. «Development of a novel methodology for root cause analysis and selection of maintenance strategy for a thermal power plant: A data exploration approach». Engineering Failure Analysis, Vol. 66, pp 19-34, 2016.
[10] Pintelon L, Van Puyvelde F. «Asset management:
the maintenance perspective». Acco Leuven, 2013.