Was zum Geier…ist eigentlich Supervised und Unsupervised Learning?

Es gibt da so eine Reihe von Sprichwörtern: „Übung macht den Meister“, „Kein Meister ist je vom Himmel gefallen“, „Aus Fehlern wird man klug“. Der Mensch weiß, bevor er etwas wissen kann, muss er es erst lernen (außer Sokrates, der wusste, dass er nichts wusste). Was für den Mensch gilt, gilt genauso auch für die Maschinen. Diese merkwürdige, künstliche neue Spezies, deren Intelligenz folgerichtig Künstliche Intelligenz genannt wird. Eine KI ist keine unglaublich schlau und aufwendig programmierte Software, sondern im Wesentlichen ein komplexer mathematischer Algorithmus, KI-Modell genannt, welcher sich über viele Lerneinheiten aus großen Datenmengen Wissen angeeignet hat. Gut, die aktuelle KI gleicht eher einem Streber, der alles auswendig lernt und je nach Kontext das Gelernte kombiniert um ein statistisch sinnvolles Ergebnis zu bekommen. Dass eine KI ein allgemeines Bewusstsein durch das Gelernte entwickelt, soweit sind wir noch nicht. Wäre dies der Fall, dann sprächen wir von einer AGI, einer Artificial General Intelligence bzw. Künstlichen allgemeinen Intelligenz. So etwas wie HAL9000 aus dem Film 2001 Odyssee im Weltraum, oder K.I.T.T aus der Serie Knight Rider.

Trans AM K.I.T.T. aus der Serie Knight Rider — *^Der*^{Trans AM mit der Künstlichen Intelligenz K.I.T.T. aus der US Serie Knight Rider (1982 – 1986)}

Aber wie lernen nun Maschinen? Nun, erstmal wird eine große Datenbasis benötigt, anhand derer gelernt wird. Diese Datenbasis wird i. d. R. zuerst von Data Engineers aufbereitet. Man nennt diese Vorarbeit data preparation bzw. data wrangling. Diese vorbereiteten Daten sind dann qualitativ sauber genug, dass sie an KI-Algorithmen zum Training verfüttert werden können. Im Machine Learning gibt es grunsätzlich drei Typen von Lernalgorithmen:

Supervised Learning (überwachtes Lernen)
Unsupervised Learning (unüberwachtes Lernen)
Reinforcement Learning (Verstärkendes Lernen)

Letzteres wird z. B. für das autonome Fahren in PKWs eingesetzt. Fährt das Auto gegen eine Laterne, gibt es was auf die virtuellen Finger. Und wie wir alle Wissen, „Ein gebranntes Kind scheut das Feuer.“ So, genug der Sprichwörter. Wir wollen uns im Folgenden aber mal die ersten beiden Typen ansehen: Das überwachte und das unüberwachte Lernen. Wollen wir dazu mal ein einfaches Beispiel betrachten.

Stellen wir uns mal eine Schulklasse vor. Im Geographie-Unterricht der Klassen 8a und 8b plant die Lehrerin Frau Schmidt eine Gruppenarbeit. Die Schüler sollen anhand von Fotos lernen, eine berühmte Stadt zu erkennen. Frau Schmidt hat 500 Fotos, 100 davon möchte sie für das Training der Kinder verwenden. Frau Schmidt fragt sich jedoch, wie sie die Schüler lernen lassen soll, damit die Erkennungsquote möglichst hoch ist. Für die Klasse 8a überlegt sie sich folgende Vorgehensweise. Sie teilt die 100 „Lern-Fotos“ in ein 70er (Trainingsdaten) und ein 30er (Testdaten) Päckchen auf. Dann beschriftet sie die 70 Fotos mit dem tatsächlichen Stadtnamen (Label) und gibt sie den Schülern. Die Schüler betrachten sich Merkmale (Features) wie Skyline, Architektur, Wahrzeichen oder markante Szenerien und lernen, diese Merkmale mit den Städten zu verbinden. Anschließend gibt Frau Schmidt den Schülern die anderen 30 Fotos, diesmal aber ohne Beschreibung der Stadtnamen (Evaluation). Die Schüler wenden nun das zuvor Gelernte an und versuchen, jedes Bild der richtigen Stadt zuzuordnen. Zum Schluss prüft Frau Schmidt, wie viele Städte richtig erkannt wurden.

Bei Klasse 8b geht Frau Schmidt anders vor. Diesmal teilt sie die ganzen 100 Fotos ohne Beschreibung des Stadtnamens aus. Die Schüler wissen dieses mal nicht, um welche Stadt es sich handelt. Die Aufgabe der Schüler besteht nun darin, Muster und Ähnlichkeiten selbst herauszufinden. So gruppieren sie die Fotos nach ähnlichen Merkmalen wie Höhe der Gebäude, Architektur, Straßenzüge, umgebende Landschaft. Da die Schüler keine Vorgaben haben, ordnen sie die Fotos auf Basis der wahrgenommenen Gemeinsamkeiten und erstellen Gruppen, sogenannte Cluster. Vielleicht erkennen sie, dass einige Städte hohe Wolkenkratzer haben, während andere eher niedrigere Gebäude oder große Flüsse aufweisen. Ob diese Gruppen tatsächlich „New York“ oder „Paris“ darstellen, bleibt offen. Sie haben lediglich anhand der visuellen Merkmale Gruppen gebildet, ohne die richtigen Stadtnamen zu kennen. Mit dieser Methode lässt sich offensichtlich der Name der Stadt weniger gut erraten, aber möglicherweise entdecken die Schüler andere interessante Dinge. Städte mit vielen Hochhäusern haben möglicherweise häufiger auch U-Bahn-Stationen.

Das erste Beispiel der Klasse 8a war ein Beispiel für überwachtes Lernen (Supervised Learning), Klasse 8b dagegen durfte das unüberwachte Lernen (Unsupervised Learning) anwenden. Wann wird nun welcher Algorithmus eingesetzt?

Supervised Learning:
Wenn man bereits weiß, welche Art von Ergebnis man erwartet und genügend gelabelte Daten für das Training vorhanden sind, kann man diese Methode einsetzen. Ein Beispiel wäre ein E-Mail-Spamfilter. Sind eine größere Anzahl von Mails für das Training vorhanden, die bereits als Spam oder nicht Spam gekennzeichnet wurden, kann man ein Modell trainieren, dass dann anhand von Merkmalen wie Absender, Betreff oder Inhalt zukünftige Mails als Spam oder nicht Spam unterscheiden kann. Ein weiteres Beispiel wären Immobilienpreisprognosen. Hat man genügend Datensätze mit Merkmalen wie Größe, Lage, Anzahl Zimmer und dazu deren Verkaufspreise, dann kann ein Modell lernen, den Verkaufspreis einer Immobilie anhand dieser Merkmale vorherzusagen.

Unsupervised Learning:
Diese Methode bietet sich an, wenn man einfach nur Muster oder Strukturen in ungelabelten Daten entdecken möchte. Eine Anwendung wäre hier die Kundensegmentierung. Man möchte z. B. anhand der Kundendaten (Kaufverhalten, demografische Daten) die Kunden in Gruppen einteilen, um gezieltere Marketingkampagnen erstellen zu können. Ein weiteres Anwendungsgebiet wäre die Anomaly Detection. Anhand ungewöhnlicher Ereignisse oder Ausreißer die man in den Daten identifiziert, könnte man z. B. Betrugsfälle bei Finanztransaktionen identifizieren.

Allgemein zusammengefasst könnte man also sagen, Supervised Learning wird für die Klassifizierung von Daten oder für Vorhersagen einer Zielvariablen eingesetzt und verwendet gelabelte, also gekennzeichnete Daten. Unsupervised Learning dagegen wird genutzt, um Muster in Daten zu erkennen, die Daten sind hier nicht gekennzeichnet.