Unsupervised Learning
Was ist Unsupervised Learning und wie wird es umgesetzt? Mehr dazu erfahren Sie hier.
Definition
Unüberwachtes Lernen ist eine ML-Methode, bei der der Algorithmus auf ungelabelten Daten trainiert wird – es werden also keine vorgegebenen richtigen Antworten geliefert. Das System muss selbst Strukturen, Muster oder Zusammenhänge in den Eingabedaten entdecken. Im Gegensatz zum überwachten Lernen gibt es hier kein direktes richtig oder falsch vom Trainer. Unüberwachtes Lernen zielt oft darauf ab, verborgene Cluster, Gruppierungen oder Datenverteilungen zu finden oder die Dimensionalität der Daten zu reduzieren (für Visualisierung oder Vorverarbeitung).
Methoden und Beispiele
Typische Aufgabentypen unüberwachten Lernens sind:
Vorteile und Herausforderungen
Unüberwachtes Lernen ist besonders nützlich, wenn keine oder nur wenig gelabelte Daten vorliegen – was in vielen realen Fällen so ist, da Labelerstellung teuer sein kann. Es kann verborgene Strukturen enthüllen, an die man vorher nicht gedacht hat. Allerdings ist die Auswertung oft schwieriger: Da kein klares Ziel vorgegeben ist, muss der Mensch die entdeckten Strukturen interpretieren und bewerten, ob sie sinnvoll sind. Zwei Menschen könnten unterschiedliche Clusterlösungen verschieden deuten. Zudem kann es passieren, dass ein Algorithmus triviale oder für die Fragestellung irrelevante Muster findet – menschliches Fachwissen ist wichtig, um Ergebnisse zu validieren.