Fallorientierter Neurologie-Trainer[*]

in KI 1/1995 (Künstliche Intelligenz) 52-54

Frank Puppe1, Bettina Reinhardt1, Klaus Poeck2
1
Universität Würzburg , Lehrstuhl für Informatik VI, Am Hubland, D-97074 Würburg
2 RWTH Aachen, Neurologische Klinik, Pauwelsstraße 30, D-52057 Aachen

1. Einleitung

Medizinische Ausbildung mit rechnersimulierten Patienten ist in Ergänzung zu traditionellen Ausbildungsformen eine mächtige Lerntechnik, zumal der Kontakt von Medizinstudenten zu echten Patienten äußerst begrenzt ist. Medizinische Simulationsprogramme unterscheiden sich vor allem durch mehr Aktionsmöglichkeiten des Studenten von anderen medizinischen Lernprogrammen; eine Übersicht enthält z.B. (vgl. [Eysenbach 94, Kap. 9]):

* Textausgabeprogramme (electronic textbooks), mit denen man im Vergleich zum herkömmlichen Buch auf Stichwörter sehr schnell zugreifen kann.

* Hypertextprogramme, die ein assoziatives, exploratives Lesen ermöglichen.

* Drill-Programme, die in Frage- und Antwort-Spielen vor allem auf Multiple-Choice-Prüfungen vorbereiten.

* Tutorial-Programme, die zunächst ausführliche Lerntexte anbieten, dazu gelegentlich Testfragen stellen und je nach Antwort die Informationen anbieten, die geeignet erscheinen, um die Lücken des Benutzers zu schließen.

* Simulationsprogramme, bei denen der Computer einen Sachverhalt simuliert, den der Benutzer beherrschen (lernen) soll. Dabei kann man Prozeß-, Diagnose- und Therapie-bezogene Simulationsprogramme unterscheiden. Bei ersteren simuliert der Computer einen Prozeß wie z.B. Blutgerinnung, bei dem der Benutzer Parameter variieren kann, um ein Gefühl für die kausalen Abläufe zu bekommen. Bei den anderen beiden Typen simuliert der Computer einen Patienten, den der Benutzer interaktiv diagnostizieren bzw. therapieren soll.

Die überwiegende Anzahl von kommerziellen medizinischen Lernprogrammen befassen sich mit der multimedialen Darstellung von Wissen, das assoziativ gelesen werden kann. Eine Marktübersicht findet sich in [Eysenbach 94, S. 266-271]. Auch patientenbezogene Simulationsprogramme lassen sich mit Hypertext- und Hypermediasystemen realisieren, indem an bestimmten Stellen der Patientenpräsentation Kontrollfragen nach Tests, Verdachtsdiagnosen oder Therapien eingefügt werden. Da die Verzweigungslogik in den diesen Programmen explizit vordefiniert ist, sind sie jedoch inflexibel zu benutzen und aufwendig zu entwickeln.

In diesem Projekt geht es dagegen um ein aus einer Wissensbasis und aus Fallbeschreibungen generiertes simulationsbasiertes Trainingsprogramm für Mediziner. Das erste solche Simulationsprogramm war GUIDON [Clancey 87], das auf dem Expertensystem MYCIN zur Diagnostik and Therapie von Meningitis und von bakteriellen Infektionskrankheiten des Blutes basiert. Jedoch stellte sich heraus, daß die Wissensrepräsentation und Problemlösungsmethode in MYCIN nicht besonders gut für tutorielle Zwecke geeignet sind. Wichtige Ergebnisse der Arbeiten von Clancey sind: (1) eine sehr allgemeine Problemlösungsmethode wie die Rückwärtsverkettung von Regeln in MYCIN beeinträchtigt die Erklärungsfähigkeit für tutorielle Zwecke erheblich. (2) An die Wissensrepräsentation, insbesondere die Regelstruktur, werden für tutorielle Zwecke der besseren Verständlichkeit und Memorierbarkeit weit höhere Anforderungen gestellt als aus diagnostischer Sicht.

Zu einfachen kommerziell verfügbaren Systemen dieser Art gehören die Tutorversionen der Entscheidungsunterstützungssysteme QMR [Miller 89] und ILIAD [Lincoln et al. 91]. Deren Einsatzgebiet umfaßt die gesamte Innere Medizin. Ihre diagnostische Leistungsfähigkeit ist in [Berner 94] beschrieben; sie umfaßt die Fähigkeit, eine Liste von plausiblen Verdachtsdiagnosen zu generieren, die die korrekte Diagnose meist enthält, aber in der Regel nicht besonders spezifisch ist. Ein wesentlicher Grund ist die eingeschränkte Wissensrepräsentation. In QMR sind z.B. nur direkte ein-Symptom-eine-Diagnose-Beziehungen darstellbar, die mit zwei Parametern, "evoking strength" und "frequency", bewertet werden.

Der hier vorgestellte Neurologie-Trainer baut auf diesen Erfahrungen auf. Die Wissensbasis wurde mit dem Diagnostik-Expertensystem-Shell-Baukasten D3 [Puppe et al 94] von Prof. Poeck zur 9. Auflage seines Neurologie-Lehrbuch [Poeck 94] entwickelt und mit zahlreichen Musterfällen getestet. Die Shell D3 bietet im Vergleich zu QMR und ILIAD eine mächtigere Wissensrepräsentation und im Vergleich zu GUIDON vor allem eine klare Trennung zwischen strukturellem Wissen über die Beziehungen zwischen Diagnosen und Symptomen und strategischem Wissen über die Dialogführung, wann welcher Test indiziert ist und welche Frage gestellt werden soll.

Das Tutorsystem präsentiert detaillierte Fallgeschichten, die der Benutzer selbständig lösen muß, wobei er gegebenfalls vom System kritisiert wird. Das System kann in zwei Varianten benutzt werden: Im Schnelltestverfahren bekommt der Benutzer nacheinander alle relevanten Falldaten erst zur Anamnese, dann zur körperlichen Untersuchung, aus dem Labor und schließlich zu technischen Untersuchungen und muß nach jeder Phase angeben, welche Diagnosen er für verdächtigt oder schon bestätigt hält. Im zweiten, ausführlicheren Test bekommt der Benutzer nur die Anfangsbeschwerden des Patienten präsentiert und muß selbst bestimmen, welche weiteren Tests er für die Diagnostik durchführen will. Da das Tutorsystem die Aktionen des Benutzers und deren Begründungen mit seinen eigenen auf der Basis der bisher präsentierten Falldaten vergleicht, kann es dem Benutzer folgen, selbst wenn er suboptimale Handlungen vorschlägt. Insgesamt enthält das Tutorsystem derzeit ca. 200 Fallgeschichten zum Training (jeweils ein bis zwei Musterfälle pro Diagnose).

2. Wissensrepräsentation

Dem Tutorsystem liegt eine Wissensbasis mit derzeit (Jan. 1995) ca. 250 Fragen mit durchschnittlich jeweils ca. 6 Antwortalternativen, ca. 300 daraus hergeleiteten Fachbegriffen (Symptomabstraktionen), ca. 120 neurologische Diagnosen und über 2500 Regeln der Art "Wenn eine bestimmte Konstellation von Symptomen vorliegt, dann spricht das mit einer gewissen Wahrscheinlichkeit für oder gegen eine bestimmte Diagnose bzw. Symptomabstraktion" zugrunde. Im Durchschnitt beziehen sich die Regeln auf zwei Einzelkonditionen in der Vorbedingung. Dieses Wissen ist in einer Broschüre zusammengefaßt, die für jede Diagnose zunächst eine Übersicht über alle diagnostisch relevanten Symptome enthält, dann in einer Tabelle die Bewertungen darstellt und schließlich in einem Glossar für alle verwendeten Fachbegriffe (Symptomabstraktionen) eine genaue Definition angibt. Die Broschüre ist mit einem ausführlichen Inhaltsverzeichnis und Index so angelegt, daß man sie auch ohne das Expertensystem benutzen kann, um in einem konkreten Fall den Verdacht auf eine Diagnose rasch abzuklären. Natürlich können sich trotz sorgfältiger Prüfung bei den vielen Einzelbewertungen auch Fehler eingeschlichen haben, die Broschüre kann den Benutzer in keinem Fall die Verantwortung für die bestmögliche Diagnostik abnehmen. Ein Beispiel aus der Broschüre auf dem gegenwärtigen, noch nicht ganz fertigen Stand zeigt Abb. 1; eine ausführliche Beschreibung der Wissensrepräsentation und des Wissenserwerb des hier benutzen heuristischen Problemlösers von D3 enthält [Gappa et al. 93].

Chronische alkoholbedingte Polyneuropathie

auffällige Lebensgewohnheiten =               +  +  +     
regelmäßiger, reichlicher Alkoholkonsum                   
Auftreten der geklagten Schwäche/Lähmung =          +     
langsam zunehmend                                         
Lokalisation der geklagten Schwäche/Lähmung         +     
= rechtes und/oder linkes Bein distal/Fuß                 
Typ der unwillkürlichen Bewegungen =             +  +     
Zittern (Tremor) in Ruhe oder  bei                        
Bewegungen                                                
wo unwillkürliche Bewegungen lokalisiert =          +     
beide Arme und Hände                                      
-> Beschwerden bei distaler Polyneuropathie      +        
-> Befund bei axonaler distaler               +        -  
Polyneuropathie der Beine                                 
Tremor = Ruhe- oder Haltetremor               +           
rechtsseitig oder linksseitig                             
Potenz = erloschen ODER vermindert                  +     
Art der Verknüpfung der Spalte                &  &  &  &  
Bewertung für chronische alkoholbedingte      P  P  P  N  
Polyneuropathie                               6  3  3  4  

Beschwerden bei distaler Polyneuropathie wenn mindestens 4 Punkte:

1 wo Schmerzen lokalisiert = rechter Fuß und rechtes Bein, peripher UND linker Fuß und linkes Bein, peripher

1 wann Schmerzen vorhanden = ständig

1 wo Mißempfindungen empfunden = beide Füsse

1 wann Mißempfindungen empfunden = ständig

1 Art der Mißempfindungen = Taubheitsgefühl ODER Kribbeln

_______________________

Abb. 1: Beispiel eine Diagnosebeschreibung. Die Tabelle enthält die heuristische Bewertung der Diagnose "chronische alkoholbedingte Polyneuropathie". Jede Spalte repräsentiert eine Regel, in der die letzte Zeile die Schlußfolgerung und die übrigen Zeilen die Vorbedingung darstellt. Die vorletzte Spalte gibt an, wie die Vorbedingungen verknüpt werden sollen (& = "und"; v = "oder"; (<Zahl1> <Zahl2>) = mindestens <Zahl1> und höchstens <Zahl2> der markierten Vorbedingungen. Die dritte Spalte bedeutet z.B., daß wenn alle mit "+" markierten Einzelbedingungen erfüllt sind, die Diagnose "oft" (p3) zutrifft. Die Evidenzbewertungen haben eine ähnliche Bedeutung wie die "evoking strength" (p1-p6) und die "frequency" (n1 bis n6); modifiziert für negative Bewertungen) in INTERNIST/QMR. Der zweite Teil zeigt ein Beispiel aus dem Glossar für die Definition von Fachbegriffen (Symptomabstraktionen), die mit "->" vor dem Namen markiert sind.

3. Beispiel

Im folgenden wird ein Beispiel für die Funktionsweise des Neurologie-Trainers erläutert. Es enthält einen Zyklus von Symptompräsentation (Abb. 2), Auswahl von Verdachtshypothesen durch den Bentuzer (Abb. 3) und deren Kritik (Abb. 4), der sich im hier gezeigten Schnelltest insgesamt vier Mal wiederholt (Präsentation der Anamnse, des Untersuchungsbefundes, der Labordaten und der Daten von technischen Untersuchungen (angedeutet durch Abb. 5). Ein Beispiel für die Systemkritik der Begründung einer Diagnose zeigt Abb. 6. Im Volltestmodus muß der Benutzer zusätzlich noch die Tests zur Klärung seiner Verdachtshypothesen anfordern und wird auch dabei kritisiert.

Abb. 2: Präsentation der Anamnesedaten. Damit der Benutzer den Überblick behalten kann, kann er Teile der Anamnese aus- und einblenden, indem er auf die Dreiecke links neben den Begriffen "klickt", woraufhin die jeweils nächste Hierarchie-Ebene ein- bzw. ausgeblendet wird. Nach Studium der Daten und Klicken des Buttons "Weiter" muß der Student in Abb. 3 seine aktuellen Verdachtsdiagnosen angegeben.

Abb. 3: Auswahl von Verdachtsdiagnosen (zu den Anamnesedaten aus Abb. 2). Damit der Benutzer den Überblick über die ca. 120 Diagnosen behalten kann, wählt er aus einer aufklappbaren Hierarchie von Grob- und Feindiagnosen; hier die Diagnose "chronische alkoholbedingte Polyneuropathie".

Abb. 4 und 5: Feedback und Präsentation weiterer Daten. Die in Abb. 3 verdächtigte Diagnose "chronische alkoholbedingte Polyneuropathie" ist aufgrund der bisherigen Informationen plausibel; als nächstes werden dem Benutzer neue Patientendaten zum Untersuchungsbefund präsentiert., die im Gegensatz zu Abb. 2 noch nicht aufgeklappt sind. Aufgrund der neuen Daten kann der Benutzer seine Verdachtshypothesen modifizieren, und dieses Wechselspiel setzt sich dann mit Labor und technischen Untersuchungen fort.

Abb. 6: Systemkritik der Begründung einer Hypothese. Vorher hat der Benutzer in einer aufklappbaren Hierarchie wie in Abb. 2 alle Symptome markiert, die seiner Meinung nach für die Diagnose "chronische alkoholbedingte Polyneuropathie" sprechen. Das Tutorsystem vergleicht diese Begründung mit der aus seiner Wissensbasis hergeleiteten Begründung, die jedoch zum Zwecke der Vergleichbarkeit transformiert werden mußte, um den diagnostischen Mittelbau zu eliminieren. Die Abbildung zeigt, daß Benutzer viele relevante Symptome angegeben, aber auch viele vergessen und manche unwichtigen Symptome hinzugefügt hat.

4. Diskussion und Ausblick

1992 prophezeite ein Artikel im Deutschen Ärzteblatt, daß "in den nächsten fünf bis zehn Jahren das Wissen eines Standardlehrbuches der Medizin in ein Expertensystemen überführt ist, als Handbuch mit Tabellensammlungen das Lehrbuch ergänzt und vor allem den Studenten auf Personal Computern zur Verfügung steht." [Puppe et al. 1992, p.1253]. Diese Prognose hat sich mit dem fallorienten Neurologie-Trainer zum Neurologie-Lehrbuch [Poeck 94] bereits vorzeitig erfüllt (zumindest für den diagnostischen Teil des Lehrbuches) und läßt noch etwas Spielraum für kontinuierliche Verbesserungen. Als wichtigste grundsätzliche Erweiterung ist die Generierung einer multimedialen Präsentation der Fälle geplant, bei der zu den bisher nur verbal dargestellten Symptombeschreibungen jeweils Bilder, kleine Videos, Zeichnungen oder Tonaufnahmen gezeigt werden sollen. Dann kann nicht nur die korrekte Interpretation sondern auch das Erkennen der Symptome kritisiert werden.

Literatur:

Berner, E. et al.: Performance of four Computer Based Diagnostic Systems, New England Journal of Medicine 333, 1792-1796, 1994

Clancey, W.: Knowledge-Based Tutoring: The GUIDON-Program, MIT Press, 1987.

Eysenbach, G.: Computer-Manual, Urban&Schwarzenberg, 1994.

Gappa, U., Puppe, F., and Schewe, S.: Graphical Knowledge Acquisition for Medical Diagnostic Expert Systems, Artificial Intelligence in Medicine 5, 185-211, 1993.

Lincoln, M. et al.: ILIAD Training enhances Students Diagnostic Skills. J. med. Systems 15, 93-110, 1991.

Miller, R. and Masarie, F.: Use of the Quick Medical Reference (QMR) program as a tool for medical education, Meth. Inform. Med. 28, 340-345, 1989.

Poeck, K.: Neurologie, 9.Auflage, Springer 1994.

Puppe, F., Poeck, K., Gappa, U., Bamberger, S. Goos, K.: Wiederverwendbare Bausteine für eine konfigurierbare Diagnostik-Shell, Künstliche Intelligenz 2/94, 1994.

Puppe, F., Puppe, B. und Gross, R.: Lehrbuch/Expertensystem-Kombination für die medizinische Ausbildung, Deutsches Ärzteblatt 89, Heft 14, 1247-1253, 1992.