In unserem letzten Beitrag zeigten wir, wie die Architektur der CNN-Modelle genauer aussieht und welche Vor- bzw. Nachteile die jeweiligen Architekturansätze erbringen. Darüber hinaus haben wir das generelle Vorgehen bei der Bildklassifikation mit diesen Modellen aufgezeigt. In unserem heutigen Beitrag erläutern wir, wie die Bildklassifikation durch Hinzunahme weiterer diagnostischer Merkmale gesteigert werden kann.

Kombination von Metadaten

Im Rahmen der Ophthalmologischen Untersuchung wurden weitere maßgebliche Diagnosemerkmale aufgezeichnet. Dazu gehört zum Beispiel der Augeninnendruck, das sphärische Äquivalent, Cup -Disk Ratio Horizontal/Vertikal oder der MD GF Wert der für „mean defect“ im Gesichtsfeld steht. Also vorhandene schon diagnostizierte Gesichtsfeldausfälle. Darüber hinaus aber auch Diagnoseirrelevante Daten wie welches Auge betroffen ist, eine Einschätzung des Sehnervs, das Alter des Patienten, das Datum der Erstdiagnose oder die Familienanamnese. Insgesamt standen 28 unterschiedliche Werte zu Verfügung, die in die Vorhersage mit einbezogen wurden.

Generelles Vorgehen

Bei der Kombination von Metadaten wurden drei vielversprechende Algorithmische Verfahren gewählt, die im Bereich des maschinellen Lernens zu den etabliertesten Verfahren gehören.
Zum einen sind das „binary boosting trees“, „support vector mashines (SVM)“ und die Logistische Regression.
Diese Verfahren wurden zum einen nur mit den Metadaten durchgeführt und zum anderen mit den Vorhersagen der jeweiligen CNN-Modellen.

Referenzdatensätze

Insgesamt wurden für die Klassifikation durch die CNNs 3 verschiedene Referenzdatensätze verwendet. Kennzeichnend ist hierbei das die Datensätze in der Anzahl der beinhalteten Bilddaten sukzessive erhöht wurde, um eine bessere Vorhersage zu ermöglichen.

Abbildung 1: Referenzdatensatz 1
Abbildung 2: Referenzdatensatz 2
Abbildung 3: Referenzdatensatz 3

Trainingsdaten

Anhand der jeweiligen Referenzdatensätze ist es wichtig, eine gleichmäßige Verteilung der Trainingsdatensätze zu erreichen, um ein Übertraining der Modelle entgegenzuwirken. Da in allen Datensätzen die Anzahl der Glaukom Erkrankungen überwiegen, wurden dies durch ein Up bzw. Downsampling angeglichen. Dabei werden vorhandene Aufnahmen dupliziert und z.B. um 90 Grad gedreht. Daraus ergibt sich ein neues Bild, was für das Training genutzt werden kann.

Beim Training eines künstlichen neuronalen Netzes ist es essenziell, die vorhandenen Daten in sinnvolle Trainingsdaten, Validierung und Testdaten einzuteilen. In dem von uns getesteten Modellen wurden rund 60% der Bilddaten als Trainingsdaten verwendet. 20% für die Validierung und 20% für den Test.

Bei den Metadaten wurden zu Beginn fehlende Datenwerte durch geeignetes Sampling oder stochastische Methoden aufgefüllt. Beispielsweise wurden fehlende numerische Werte durch einen gleitenden Mittelwert ergänzt. String Werte wurden nicht ersetzt und vielen teilweise aus der Betrachtung. Über eine Analyse der Prädiktoren durch eine Hauptkomponentenanalyse (PCA) wurde zusätzlich explorativ der Datensatz untersucht, um herauszufinden welche Prädiktoren den größten Einfluss auf eine Vorhersage hat.
Abbildung 4 zeigt dies am Beispiel des Referenzdatensatzes 3.

Abbildung 4: PCA-Analyse des Referenzdatensatzes 3

Den höchsten Einfluss hat hier der Prädiktor „TI“, welcher einen Wert aus einer OCT-Untersuchung darstellt. Dies ist ein weiteres Bildgebendes Verfahren. Die Abkürzung TI bei einer OCT (Optische Kohärenztomographie) Untersuchung steht für “Tiefe” oder “Time Interval”. In der Augenheilkunde wird die OCT verwendet, um detaillierte Bilder der verschiedenen Schichten des Auges zu erstellen, und die Tiefe (TI) bezieht sich auf die Messung der Entfernung der Gewebeschichten vom Auge.
Auf diesen folgt das vertikale Cup-Disc Verhältnis, was ein typischer Wert für eine Glaukom Diagnose darstellt. Die beiden folgenden Werte sind ebenfalls Werte, die aus einer OCT folgen. Das Alter war darüber hinaus in allen Referenzdatensätzen ein einflussreicher Prädiktor wurde allerdings als Wert ausgeschlossen, um ein Verfälschen des Trainings bzw. übertrainieren des Modells zu vermeiden.
Das ergibt aus Sicht einiger Arten von Glaukomen wie Engwinkelglaukom oder Primäres Offenwinkel Glaukom sogar Sinn, betreffen diese Arten des Glaukoms doch hauptsächlich ältere Menschen.
Trotzdem wurde das Alter aus der Betrachtung ausgeschlossen, um ein mögliches Bias auf die Klasse Glaukom zu vermeiden. Als Beispiel sei das juvenile Glaukom genannt, was hauptsächlich junge Menschen betrifft. Hier könnte das Alter insbesondere bei einem hohen Einfluss die Vorhersage verfälschen.

Schlussbemerkungen

Wir haben gesehen, dass die entwickelten Modelle in Ihrer Komplexität nicht zu unterschätzen sind. Wir wissen nun, wie sich die jeweiligen Modellarchitekturen in das Gesamte Modell einbetten und haben auch verstanden, wie das generelle Vorgehen der Glaukomklassifikation in unserm Fall mit einem CNN abläuft. Gleichzeitig haben wir herausgestellt das weitere Diagnose relevante Merkmale von hohem Interesse sind in die Klassifikation mit einzubinden da heutige Diagnosewege selten nur auf ein Instrument setzen.
In unserem letzten beiden Blockbeiträgen wenden wir uns zum Abschluss der Evaluierung und Ergebnissen dieser Modelle zu.

Alexander Renz

Alexander Renz ist seit 7 Jahren Consultant in der Proventa AG. In dieser Zeit sammelte er in den unterschiedlichsten Bereichen und Branchen Erfahrung. Dieser Erfahrungsschatz und seine Leidenschaft bilden die Basis dafür, Projektziele kundenorientiert umzusetzen. Sein derzeitiger Schwerpunkt liegt in Deep Learning, Software-Entwicklung und Low-Code.

Als Consultant (M.Sc Informatik) widmet sich Alexander mit Hingabe und Faszination dem technischen Umfeld, um passende Lösungen für unsere Kunden zu entwerfen.