Root Cause Analyse – vermeiden Sie das wiederholte Auftreten gleicher Fehler!
Und täglich grüßt das Murmeltier! Dieser Vergleich pointiert die Situation in vielen Organisationen. Jeden Tag erleben die Mitarbeiter die selben oder ähnliche Fehler aufs Neue. Und warum? Die Fehler werden nicht konsequent abgestellt. Fehler entstehen z.B., weil die Dokumentation fehlt oder lückenhaft ist, die Spezifikation nicht gründlich durchdacht wurde oder die Freigabetests nur an der Oberfläche gekratzt haben. Dies sind für viele Organisationen keine unbekannten Situationen. Was jedoch häufig verborgen und damit unbekannt bleibt, sind die Grundursachen bzw. Root Causes. Wie Sie diesen auf die Spur kommen können und welche Methoden Sie nutzen sollten, lesen Sie im Folgenden.
FEHLER WERDEN „OBEN“ GEMACHT – UND DORT MÜSSEN SIE SIE AUCH VERHÜTEN!
Fehler übergeordneter Funktions-Ebenen einer Organisation (= Entscheidungsträger) lösen über „kurz oder lang“ Störungen auf der Ausführungsebene aus, denn
– die Entscheidungen und Maßnahmen des Top Management definieren den gestalterischen Rahmen.
– das operative Management gestaltet danach die Arbeitsbedingungen, plant, steuert und kontrolliert.
– die Menschen und Systeme funktionieren unter diesen Arbeitsbedingungen. Fehler werden also kausal direkt oder indirekt von diesen Arbeitsbedingungen (-> vom Operativen Management -> vom Top Management) provoziert. Provokant ausgedrückt, unterlaufen dem Arbeiter also Fehler meist deshalb, weil die von den höheren Ebenen geschaffenen Vorbedingungen dies provozieren.
DREI EBENEN DER URSACHENANALYSE (ROOT CAUSE-ANALYSE)
Aufbauend auf dieser Erkenntnis, sollten Sie bei Ihrer Reaktion auf unerwünschte Ereignisse (Unfälle, fehlerhafte Leistungen, …) die folgenden drei Ebenen der Ursachenanalyse unterscheiden:
1. Analyse der direkten Ursachen = Logik dieser Ursachen
Ermittlung des Hergangs durch Darstellung
der Ereignisketten, mit dem Ziel der
Abstellung der direkten Ursache.
2. Aufdeckung von Fehlern auf Basis normativer Modelle
Welche Abweichung von der Normalität war ursächlich für den/die Fehler:
– organisatorische Faktoren.
– Unwissenheit der Akteure.
– Unvollständigkeit des Modells.
3. Ermittlung der Root Cause(es) durch Generalisierung
Analyse und Identifikation von permanent wirkenden Gemeinsamkeiten:
– Ineffektive Organisationsstruktur.
– Mängel in der Qualitätskultur.
– Demotivierendes Arbeitsklima
Von Ebene eins zu Ebene drei wird die Wirkung der Maßnahmen, die Sie treffen, umfassender und nachhaltiger sein. Zur Realisierung eines Null-Fehler-Managements ist somit die Ebene drei die dominierende. Die Fähigkeit, zwischen chronischen (systemimmanenten), z.B. menschlichen Ursachen und sporadischen (direkt zuschreibbaren), z.B. technischen Ursachen zu unterscheiden, ist die Voraussetzung für die Wahl geeigneter Korrekturmaßnahmen. Ohne diese Fähigkeit wird die Unterscheidung zwischen wirklichen Prozessverbesserungen und willkürlichen Prozessanpassungen kaum gelingen.
DIE LERNENDE ORGANISATION LERNT AUS VERGANGENEN FEHLERN
Organisationen sind, bedingt durch deren Mitarbeiter, „komplexe und dynamische Systeme“. Sie funktionieren unter dem Einfluss unüberschaubar vieler unterschiedlicher, variabler und deshalb häufig unerkannter Faktoren. So kann sich z.B. die momentane Stimmung der Belegschaft schnell ändern und Bereiche können sich gegenseitig beeinflussen. Wie erkennen Sie, wo Sie eingreifen müssen? Die ISO 9001 gibt uns Ideen, für zwei mögliche Vorgehensmodelle:
1. Den Re-aktiven Ansatz und den
2. Pro-aktiven Ansatz. Wir finden diese im Kapitel 8.5 Verbesserung:
1. Re-aktives Vorgehen = 8.5.2 Korrekturmaßnahmen
Die Organisation muss Korrekturmaßnahmen zur Beseitigung der
Ursachen von Fehlern ergreifen, um deren erneutes Auftreten zu verhindern. Korrekturmaßnahmen müssen den Auswirkungen der aufgetretenen Fehler angemessen sein. Ein dokumentiertes Verfahren muss eingeführt werden, um Anforderungen festzulegen zur
a) Fehlerbewertung (einschließlich Kundenbeschwerden),
b) Ermittlung der Ursachen von Fehlern,
c) Beurteilung des Handlungsbedarfs, um
das erneute Auftreten von Fehlern zu verhindern,
d) Ermittlung und Verwirklichung der erforderlichen Maßnahmen,
e) Aufzeichnung der Ergebnisse der ergriffenen Maßnahmen (siehe 4.2.4) und
f) Bewertung der Wirksamkeit der ergriffenen Korrekturmaßnahmen.
2. Pro-aktives Vorgehen = 8.5.3 Vorbeugungsmaßnahmen
Die Organisation muss Maßnahmen zur Beseitigung der Ursachen von möglichen Fehlern festlegen, um deren Auftreten zu verhindern. Vorbeugungsmaßnahmen müssen den Auswirkungen der möglichen Probleme angemessen sein. Ein dokumentiertes Verfahren muss eingeführt werden, um Anforderungen festzulegen zur
a) Ermittlung potenzieller Fehler und ihrer Ursachen,
b) Beurteilung des Handlungsbedarfs, um das Auftreten von Fehlern zu verhindern,
c) Ermittlung und Verwirklichung der erforderlichen Maßnahmen,
d) Aufzeichnung der Ergebnisse der ergriffenen Maßnahmen (siehe 4.2.4) und
e) Bewertung der Wirksamkeit der ergriffenen Vorbeugungsmaßnahmen. Diesen beiden Ansätzen liegt eine vollkommen andere Vorgehensweise bei der Findung der Root Cause zu Grunde:
Die Vorwärts- oder die Rückwärtssuche. WELCHES IST DER BESSERE WEG ZUR ROOT CAUSE – VORWÄRTS ODER RÜCKWÄRTS?
Unter dem Begriff Root Cause-Ermittlung werden verschiedene Techniken zusammengefasst, die dazu dienen, ein System auf Probleme oder Gefahren hin zu analysieren. Dabei kann eine grundsätzliche Einteilung in Vorwärts- und Rückwärtssuche (Top-Downund Bottom-Up-Suche) vorgenommen werden.
Bei der Rückwärtssuche geht man von gefährlichen Zuständen aus und versucht herauszufinden, wodurch es dazu kommen konnte:
Man blickt bei dieser Methode also zeitlich gesehen nach hinten. Hier würde die Frage in etwa lauten, „Was ist die mögliche Ursache für Zustand A?“.
Vorwärtssuche bedeutet, dass man von & einem initialen Ereignis ausgeht und versucht, die Folgen herauszufinden:
Diese zeitlich nach vorn gerichtete Tätigkeit wird auch als induktive Suche bezeichnet. Der durch das initiale Ereignis erreichte Zustand kann wiederum eine Wirkung hervorrufen, d.h. ein Ereignis auslösen und möglicherweise indirekt zu einem gefährlichen Zustand führen. Die Frage, die man sich bei diesem Vorgang stellt lautet, „Was passiert, wenn das Ereignis A eintritt?“. Welches Konzept nun den besseren Weg zur Root Cause leitet, hängt vom Anwendungsfall ab:
– Lautet die Aufgabe Korrekturmaßnahmen zu finden, um das erneute Auftreten von Fehlern zu verhindern (8.5.2 Korrekturmaßnahmen), dann ist die Rückwärtssuche der Ansatz der Wahl.
– Soll dagegen herausgefunden werden, was im Falle von bestimmten Ereignissen präventiv getan werden könnte, um da das erstmalige Auftreten von Fehlern zu verhindern (8.5.3 Vorbeugungsmaßnahmen), dann ist die Vorwärtssuche der Erfolg versprechende Ansatz.
DIE FTA (FAULT TREE ANALYSIS) FEHLERBAUMANALYSE ZUR RÜCKWÄRTSSUCHE
Die Fehlerbaumanalyse geht von einem bestimmten situativ besonders unangenehmen Zustand aus („top event“). Der nächste Schritt ist die systematische Identifizierung aller möglichen Ausfallkombinationen (Ursachen) und die dahinterliegenden Basisereignisse, die zu diesem vorgegebenen „top event“ führen können. Die Beziehungen zwischen den denkbaren Ereignissen werden durch logische AND/OR Symbole dargestellt. So kann man beispielsweise durch ein AND-Symbol darstellen, dass ein Ereignis dann eintritt, wenn zwei oder mehrere andere Ursachen gleichzeitig stattfinden (Analog für OR). Außerdem unterscheidet man durch verschiedene Symbole zwischen elementaren Ereignissen (Kreis) und Fehlerereignissen, die durch andere Ereignisse hervorgerufen werden (Rechteck) sowie Ereignissen, deren Ursachen bislang noch ungeklärt sind (Raute). Der Vorgang der Ursachenfindung und Dokumentation mittels Boolescher Algebra wird solange fortgesetzt, bis man bei grundlegenden Ereignissen angekommen ist, deren Ursachen man nicht weiter betrachten möchte.
DIE ETA (EVENT TREE ANALYSIS) EREIGNISABLAUFANALYSE ZUR VORWÄRTSSUCHE
Man geht von einem Ereignis aus, welches das System beeinflussen kann und untersucht die möglichen Folgen. Typischerweise werden die Alternativen für das erfolgreiche Verhalten der Schutzkomponente (erster Zweig) und die Bedingungen für dessen Scheitern betrachtet (weiterer Zweig). Dadurch wird es möglich, verschiedene Pfade zu durchlaufen und eine Problemsequenz zu identifizieren. Jeder Abzweig ist mit einer gewissen Wahrscheinlichkeit verbunden, die eingeschätzt werden kann. Ist die Ausfall- bzw. Fehlerwahrscheinlichkeit einer Komponente sehr gering (< 0,1), dann ist die Wahrscheinlichkeit für eine Fehlerfreiheit annähernd „1″. Durch die Multiplikation der jeweiligen Wahrscheinlichkeiten der Zweige kann man die Wahrscheinlichkeit für einen bestimmten Pfad berechnen. Die Fehlerwahrscheinlichkeit erhält man dann durch Kombination aller Pfadwahrscheinlichkeiten der Pfade, die zu einem Fehler führen.
ERSTELLEN SIE VOR FTA/ETA EIN ZUVERLÄSSIGKEITSBLOCKDIAGRAMM UND VERSCHAFFEN SICH DEN ÜBERBLICK
Mit dem unten dargestellt Zuverlässigkeitsblockdiagramm können Sie Licht ins Dunkel der Situation bringen, bevor Sie mit der ETA bzw. FTA starten. Das Zuverlässigkeitsblockdiagramme gibt uns z.B. folgende, für die weiteren Analysen notwendigen Informationen:
– Drei Geräte, d.h. der Arbeitsplatzrechner, der Router und der Server werden durch die USV gespeist.
– Benutzer des Arbeitsplatzrechners können den Server unter fogenden Bedingungen erreichen. Das 230 V-Netz oder die USV, der Server und der Router R2 sind in Betrieb. Um Sie bei der Erstellung von FTA’s noch weiter zu unterstützen, nutzen Sie die 5 – Why Methode.
Ihr Reinhold Kaim
1 Comment
Hallo Herr Kaim,
meinen Sie tatsächlich „Pro-aktiven Ansatz. Wir finden diese im Kapitel 8.5 Verbesserung:“ oder meinen Sie „Aktiven Ansatz“?
Gruß
Heiko Dreyer