Georg Mackenbrock, einer der drei Geschäftsführer des Deutschen Medizinrechenzentrums (DMRZ.de), beschäftigt sich seit Jahren erfolgreich mit Künstlicher Intelligenz (KI). Im November hat er als Leiter des Wiener DMRZ-Forschungsteams den internationalen Wettbewerb zur Künstlichen Intelligenz "ICDAR2017 Competition on Baseline Detection (cBAD)" im japanischen Kyoto gewonnen. Mit Methoden für das automatisierte Erkennen von Textgrundlinien in handschriftlichen Dokumenten erreichte das DMRZ.de-Team die beste Leistung beim Wettbewerb.

Im Interview erklärt Georg Mackenbrock, wie Computersysteme trainiert werden, um Handschriften zu erkennen und wie das Gesundheitswesen davon profitiert.

Herr Mackenbrock, wie kann ein Computer Handschriften erkennen, die sogar Menschen nur schwer entziffern können?

Es werden zurzeit jede Menge Trainingsdaten benötigt, also Daten bei denen ein Image des handgeschriebenen Textes und die "Ground Truth", also vom Computer lesbare Zeichen, vorliegen. Damit wird dann ein spezielles, rekursives neuronales Netz trainiert.

Das heißt, der Computer wird gar nicht programmiert, sondern trainiert?

Das ist richtig. Es wird ein Algorithmus programmiert, der dann verschiedenste Problemlösungen lernen kann. Dazu gehört nicht nur die Schrifterkennung, sondern auch zum Beispiel Spracherkennung wie auf dem Telefon.

Geben Sie uns ein Beispiel, wie solche Computer-Algorithmen funktionieren.

Im Prinzip gibt es eine mathematische Funktion und gesucht wird das Minimum. Stellen Sie sich vor, Sie stünden in einem unbekannten Gebirge auf einem Berg und möchten ins Tal. Dann gehen Sie am besten immer bergab. So macht das auch der Algorithmus. Er berechnet die Richtung des steilsten Abstiegs an einer Position und bewegt sich dann in diese Richtung.

Sie sagen, niemand weiß, wie der Algorithmus lernt? Wie können wir uns denn so etwas vorstellen?

Das wird untersucht. Für bestimmte Netze kann das schon sehr gut dargestellt werden. Insbesondere für sogenannte "Convolution-Netze", die analog zum visuellen Cortex funktionieren. Hier liegen Schichten hintereinander, die erste erkennt Linien, die zweite Kombinationen von Linien also Kreuze, Rechtecke, Ecken, usw. So bildet dann jede Schicht neue Features ab durch Kombination von Features der vorherigen Schicht. Am Ende gibt es dann Features für Hunde, Katzen, usw. Dazu gibt es hervorragende Videos auf YouTube.

Wie viele solcher Schriftproben braucht ein neuronales Netz, um ein gutes Ergebnis zu liefern?

Sehr viele. Hier liegt auch die zentrale Herausforderung, da bei Handschriften nur schwierig künstliche Beispiele generiert werden können. Das ist auch der Nachteil der aktuellen Verfahren. Das Lernen funktioniert (noch) nicht wie beim Menschen, also vom Einfachen zum Komplexen hin. Stattdessen müssen sehr viele Beispiele statistisch analysiert werden.

Spielt es dabei eine Rolle, wessen Handschrift angelernt wird oder kommt es stärker auf die Schriftart an?

Ja sehr. Es kommt darauf an, eine möglichst große Breite abzudecken. Dann kann das Netz allerdings auch neue Handschriften erkennen, mit denen es nicht trainiert wurde. Ein Beispiel: Die Eins ist im amerikanischen ein vertikaler Strich. Im deutschen hat die einen Haken oben. Ein Netz, das nur auf amerikanische Handschrift trainiert wurde, wird die deutsche Eins nicht erkennen. Es kommt nicht direkt darauf an, von wem die Handschrift ist, sondern dass alle Typen im Trainingssatz vorkommen.

Welche Einsatzmöglichkeiten sehen Sie für Ihre Forschung?

Intelligentes Papier! Auch wenn das Smartphone im Vormarsch ist und viele Prozesse komplett digitalisiert ablaufen, gibt es im Gesundheitswesen viele Formulare, die von Hand ausgefüllt werden. Denken Sie zum Beispiel an Teilnahmelisten für den Reha-Sport, da ist es sicher einfacher, für jeden Teilnehmer eine Liste auszulegen und unterschreiben zu lassen, als ein Terminal in der Turnhalle aufzubauen.

Ähnliches gilt für die Empfangsbestätigungen bei Krankenfahrten und auch im Heilmittelbereich sowie bei Gutscheinen für Taxifahrten. Die Leistungserbringer haben dann Arbeit bei der Rückerfassung. Wenn diese Arbeit einspart werden kann, sehe ich sogar für einige Prozesse einen Vorteil gegenüber einer volldigitalen Lösung.

In Verbindung mit der Digitalisierung der rechnungsbegleitenden Unterlagen führt das zu einem vollautomatischen Abrechnungsprozess. Ein Foto und alles ist erledigt, jedenfalls könnte das für einen signifikanten Anteil an Abrechnungsfällen erreicht werden.

Funktioniert die Handschrift auch in anderer Richtung? Also Handschriftenausgabe in einer beliebigen Schrift durch den Computer?

Es gibt vielversprechende Ansätze. Dabei ist es schwierig, den Stil zu kontrollieren und auch zu bestimmen, was genau geschrieben wird. Wenn das gelöst ist, wird das die Handschrifterkennung deutlich verbessern, da dann künstliche Trainingsdaten erstellt werden können.

Handschriften zu erkennen, gilt in der Wissenschaft als Königsdisziplin, weil sie unstrukturiert und einzigartig sind. Warum interessiert Sie das so?

Solche Algorithmen können viele Lösungen erlernen, für Probleme die noch vor ein paar Jahren als unlösbar angesehen worden waren. Trotzdem stehen wir hier noch am Anfang. Als Mathematiker finde ich das extrem spannend. Anhand des Handschriftenproblems kann die generelle Leistungsfähigkeit solcher Algorithmen gut getestet und mit anderen verglichen werden.

Solche Lösungen in das DMRZ.de Online-System zu integrieren, die nicht so einfach zu kopieren sind, ist die zukünftige Herausforderung, der wir uns schon jetzt erfolgreich stellen. Solche Algorithmen laufen auch nicht auf jedem lokalen Computer. Es wird spezielle Hardware benötigt. Aufgrund unserer Cloud-Infrastruktur haben wir eine genau auf unsere Anforderungen zugeschnittene Ausgangsposition, um solche Dienstleistungen kostengünstig anzubieten.

Über die Deutsches Medizinrechenzentrum GmbH

Das Deutsche Medizinrechenzentrum (DMRZ.de) stellt Sonstigen Leistungserbringern des Gesundheitswesens eine Internet-Plattform zur elektronischen Abrechnung (DTA) mit den Krankenkassen zur Verfügung. Wer damit abrechnet, braucht keine Software und geht keine langfristigen Verpflichtungen ein: So gibt es weder Mindestvolumen noch eine Mindestvertragslaufzeit bei DMRZ.de. Der Clou ist die Kostenersparnis. Wer seine Rechnungen beispielsweise nur auf dem Postweg an einen Kostenträger schickt, dem können wegen fehlendem DTA bis zu 5 % seiner Umsätze abgezogen werden. Bei der Abrechnung über DMRZ.de werden nur 0,5 % der Bruttorechnungssumme zzgl. MwSt. erhoben. Zusätzlich bietet DMRZ.de für Krankentransport, Pflege und Therapeuten kostenlose Branchensoftware. DMRZ.de ist das derzeit innovative Abrechnungszentrum.

Firmenkontakt und Herausgeber der Meldung:

Deutsches Medizinrechenzentrum GmbH
Wiesenstr. 21
40549 Düsseldorf
Telefon: +49 (211) 6355-9087
Telefax: +49 (211) 6355-9080
http://www.dmrz.de

Ansprechpartner:
Martin Münter
Redaktion
Telefon: +49 (211) 9367 3727
Fax: +49 (211) 6355 9080
E-Mail: muenter@dmrz.de
Für die oben stehende Pressemitteilung ist allein der jeweils angegebene Herausgeber (siehe Firmenkontakt oben) verantwortlich. Dieser ist in der Regel auch Urheber des Pressetextes, sowie der angehängten Bild-, Ton-, Video-, Medien- und Informationsmaterialien. Die United News Network GmbH übernimmt keine Haftung für die Korrektheit oder Vollständigkeit der dargestellten Meldung. Auch bei Übertragungsfehlern oder anderen Störungen haftet sie nur im Fall von Vorsatz oder grober Fahrlässigkeit. Die Nutzung von hier archivierten Informationen zur Eigeninformation und redaktionellen Weiterverarbeitung ist in der Regel kostenfrei. Bitte klären Sie vor einer Weiterverwendung urheberrechtliche Fragen mit dem angegebenen Herausgeber. Eine systematische Speicherung dieser Daten sowie die Verwendung auch von Teilen dieses Datenbankwerks sind nur mit schriftlicher Genehmigung durch die United News Network GmbH gestattet.