Prof. Dr. Peter Fettke, DFKI GmbH, Saarbrücken
Welche menschlichen Verhaltensweisen und Fähigkeiten angeboren oder erst erlernt werden müssen, ist heftig umstritten. Unstrittig ist allerdings, dass das Potential zu lernen eine zentrale Fähigkeit eines jeden Menschen ist. Neugeborene müssen eine Fülle geistiger, körperlicher, charakterlicher und sozialer Fähigkeiten erlernen, um sich im Leben zu orientieren. Ohne Lernen kann der Mensch nicht sein gewohntes Leben bewältigen.
Das Leistungsvermögen einer Maschine steht und fällt mit den Anweisungen und Befehlen, also dem Algorithmus, den die Maschine auszuführen hat. Ein solcher Algorithmus stellt eine explizite, endliche Folge von Anweisungen dar, für deren Formulierung eine Programmiersprache erforderlich ist. Erste Programmiersprachen waren maschinenorientiert und erlauben aus der Perspektive des Anwenders nur eine geringe Abstraktion technischer Details. Moderne Hochsprachen verfügen inzwischen über ein erhebliches Abstraktionsvermögen. Gleichwohl bleibt es dabei: Maschinen führen nur die Anweisungen und Befehle aus, die explizit programmiert worden sind.
Maschinelles Lernen als Schlüsseltechnologie der Künstlichen Intelligenz
Maschinelles Lernen ist ein Teilgebiet der Künstlichen Intelligenz. Es zielt darauf ab, Maschinen nicht über explizite Befehle zu programmieren, sondern ist inspiriert vom biologischen Vorbild des Lernens. Hierzu wird die Maschine in einer sogenannten Trainingsphase mithilfe von Beispieldaten angelernt, um daraus für die Problemlösung relevante Zusammenhänge, Muster oder Regeln zu erkennen. Maschinelles Lernen gilt als eine Schlüsseltechnologie für vielfältige Anwendungen der Künstlichen Intelligenz.
Zur Illustration ein Beispiel: Es gibt verschiedene Varianten von Gesellschaftsspielen wie Die Montagsmaler oder Pictionary, deren Spielziel unter anderem darin besteht, handschriftlich skizzierte Gegenstände in möglichst kurzer Zeit korrekt zu erraten. Um einem Computer diese Ratefähigkeit zu eröffnen, können unterschiedliche Lösungswege eingeschlagen werden.
Der Weg der klassischen Programmierung sieht vor, explizite Regeln und Charakteristika festzulegen, anhand derer die gemalten Objekte erkannt werden. Hierfür ist beispielsweise festzulegen, dass ein Stuhl unter anderem über eine Sitzfläche, eine Lehne und in der Regel über vier Beine verfügt. Im Unterschied dazu ist beispielsweise ein Flugzeug über einen Rumpf, Tragflächen, Propeller oder Turbinen zu charakterisieren. Der Erfolg der klassischen Programmierung beruht unter anderem darauf, wie gut der Programmierer notwendige und hinreichende Merkmale für einen Gegenstand mithilfe expliziter Regeln festlegt.
Im Unterschied zur klassischen Programmierung kann die Aufgabe auch auf Grundlage von Techniken des maschinellen Lernens gelöst werden. Hierbei werden der Maschine keine Regeln a priori einprogrammiert. Vielmehr werden der Maschine konkrete Beispiele für entsprechende Gegenstände einer zu lernenden Gegenstandsklasse gezeigt. Im Rahmen dieser Trainingsphase versucht die Maschine aus den Beispieldaten selbständig charakteristische Merkmale für diesen Gegenstand zu extrahieren. Auf der öffentlich zugänglichen Webseite „Quick, Draw!“ (siehe Link) kann man einen Eindruck zur Leistungsfähigkeit und zum Lösungsweg des maschinellen Lernens gewinnen. Hierzu soll der menschliche Spieler vorgegebene Gegenstände skizzieren, die innerhalb von 20 Sekunden von der Maschine erraten werden müssen. In der aktuellen Implementierung (September 2017) können bereits mehrere hundert Gegenstände korrekt erkannt werden.
Maschinelles Lernen benötigt zwingend entsprechende Beispieldatenzur Analyse
Es ist offensichtlich, dass maschinelles Lernen nur dann funktioniert, wenn entsprechende Beispieldaten zur Verfügung stehen, die maschinell analysiert werden können. Grundlage von „Quick, Draw!“ ist ein Datensatz von über 50 Millionen Bildern. Abbildung 1 zeigt einen kleinen Ausschnitt von Stühlen und Flugzeugen, der aus diesem Datensatz stammt. Die Durchsicht des Datensatzes zeigt, wie unterschiedlich Stühle und Flugzeuge tatsächlich aussehen können.
Abbildung 1: Beispieldaten für maschinelles Lernen (Quelle: https://quickdraw.withgoogle.com/data von Google, Inc., lizensiert unter Creative Commons Attribution 4.0 International license: https://creativecommons.org/licenses/by/4.0/)
An diesem Beispiel können weitere interessante Prinzipien verdeutlicht werden, die beim maschinellen Lernen von Relevanz sind:
- Datenquantität: Beim Ausführen der Anwendung werden vom Benutzer neue Beispieldaten generiert. Diese Daten können regelmäßig verwendet werden, um den Umfang der Beispieldaten während der Benutzung der Anwendung weiter auszubauen.
- Datenqualität: Gleichzeitig hat der Benutzer bei der Durchsicht der Daten die Möglichkeit Bilder zu annotieren, deren Qualität er als zweifelhaft einstuft. Auf diese Weise kann die Qualität der Daten erhöht werden.
Bei der zuvor genannten Anwendung kommen sogenannte tiefe neuronale Netze (deep neural networks) zum Einsatz, die eine spezielle Technik des maschinellen Lernens bilden. Grundlagen künstlicher neuronaler Netze wurden bereits in den 1950’er Jahren beschrieben und haben in jüngster Zeit einen erheblichen Aufschwung erfahren. Wesentliche Faktoren dafür sind sowohl die Verfügbarkeit großer Datenmengen als auch die Rechenleistung spezialisierter Prozessoren.
Andere Techniken des maschinellen Lernens umgehen den Aufwand für die Beschaffung von Beispieldaten, indem sogenannte bestärkende Lernverfahren (reinforcement learning) eingesetzt werden. Grundidee hierbei ist, dass die Maschine versuchsweise verschiedene Aktionen in einer realen oder fiktiven Umgebung ausführt und über Sensoren eine Rückmeldung hinsichtlich der Qualität der erreichten Lösung erhält. Die Maschine wird für das Ausführen bestimmter Aktionen in bestimmten Situationen quasi belohnt oder auch bestraft. Durch das Ausprobieren einer Fülle von Aktionen findet die Maschine nach einer gewissen Lernphase Folgen von Aktionen, die zum Problemlösen geeignet sind.
Techniken des maschinellen Lernens bieten vielfältige Potentiale, auch im Bereich Steuer
In sämtlichen Bereichen, wo Aufgaben nicht über theoretisch-fundierte Regeln exakt gelöst werden können, bieten Techniken des maschinellen Lernens vielfältige Potentiale. So verwundert es nicht, dass diese Techniken in vielen Anwendungsbereichen eingesetzt werden. Typische Beispiele liegen bei der Verarbeitung von Sprache, Bildern, Videos, Texten oder betrieblichen Prozessdaten.
Auch wenn heute die Anwendungen des maschinellen Lernens im Bereich Steuer erst in ihren Grundzügen zu erkennen sind, ist davon auszugehen, dass auch hier enorme Potentiale liegen. Zu nennen ist beispielsweise die Analyse strukturierter Massendaten wie sie insbesondere im Bereich der Umsatzsteuer oder des Zolls vorliegen. Darüber hinaus bestehen aber auch Anwendungspotentiale bei der Verarbeitung qualitativer Daten wie beispielsweise Steuergesetze, Verträge oder sonstige Steuerdokumente.