Maschinelles Lernen (ML)

Was ist maschinelles Lernen (ML)?

Maschinelles Lernen (ML) ist ein revolution?res Feld innerhalb der künstlichen Intelligenz (KI), das darauf abzielt, Computern das Erkennen von Mustern und Beziehungen in Daten zu erm?glichen. Hierbei handelt es sich um einen Prozess, bei dem Algorithmen aus Daten lernen und sich selbstst?ndig verbessern, wenn sie mit neuen Informationen gefüttert werden. Dieses “Lernen” erlaubt es Programmen, ihre Leistung im Laufe der Zeit zu optimieren, ohne dass sie explizit programmiert werden müssen, wie sie auf jede neue Situation reagieren sollen.

Das Konzept des maschinellen Lernens ist nicht neu, aber seine praktische Anwendung in der Wirtschaft war bis zum Aufkommen des Internets und den jüngsten Fortschritten in Cloud-Technologie und der Big Data Analyse finanziell nicht machbar. Das liegt daran, dass das Trainieren eines ML-Algorithmus zum Auffinden von Mustern in Daten viele Rechenressourcen und Zugang zu gro?en Datenmengen erfordert.

Die Begriffe künstliche Intelligenz und maschinelles Lernen werden manchmal als Synonyme verwendet, weil bis vor kurzem die meisten KI-Initiativen eng gefasst waren und die meisten ML-Modelle für eine einzige Aufgabe entwickelt wurden, überwachtes Lernen verwendeten und gro?e, markierte Datens?tze für das Training ben?tigten.

Die Anwendungsbereiche von ML sind vielf?ltig und reichen von der Automatisierung repetitiver Aufgaben durch robotergestützte Prozessautomatisierung (RPA) bis hin zur Verbesserung von Entscheidungsfindungsprozessen in Unternehmen. Ein maschinelles Lernmodell kann dabei helfen, alles von Kundenpr?ferenzen bis hin zu Betriebsanomalien zu identifizieren und vorherzusagen. ?hnlich wie bei den besten KI Voice Generatoren, k?nnen solche Modelle durch kontinuierliches Lernen ihre Leistung optimieren

Techopedia erkl?rt maschinelles Lernen (ML)

Qualitativ hochwertige Modelle für maschinelles Lernen erfordern qualitativ hochwertige Trainingsdaten und Zugang zu gro?en Datens?tzen, um die für bestimmte Gesch?ftsziele relevantesten Merkmale zu extrahieren und sinnvolle Assoziationen aufzudecken.

Modelle für maschinelles Lernen

Ein Modell für maschinelles Lernen ist einfach die Ausgabe eines ML-Algorithmus, der auf Daten angewendet wurde. Der Aufbau eines Modells für maschinelles Lernen umfasst die folgenden Schritte:

Sammeln von Trainingsdaten.
Daten für das Training vorbereiten.
Entscheiden, welcher Lernalgorithmus verwendet werden soll.
Trainieren des Lernalgorithmus.
Bewerten Sie die Ergebnisse des Lernalgorithmus.
Falls erforderlich, passen Sie die Variablen (Hyperparameter) an, die den Trainingsprozess steuern, um die Ergebnisse zu verbessern.

In einer typischen ML-Umgebung ben?tigen überwachte Algorithmen für maschinelles Lernen einen Datensatz mit Beispielen, wobei jedes Beispiel aus einer Eingabe und einer Ausgabe besteht.

In einer solchen Umgebung besteht ein typisches Ziel des Trainings eines ML-Algorithmus darin, die Parameter eines Vorhersagemodells zu aktualisieren, um sicherzustellen, dass die Entscheidungsb?ume des Modells konsistent die gewünschten Ergebnisse liefern. An dieser Stelle kommt die Entropie ins Spiel.

Entropie ist eine mathematische Formel zur Quantifizierung der Unordnung und Zuf?lligkeit in einem geschlossenen System. Bei Projekten des maschinellen Lernens ist es ein wichtiges Ziel, die Entropie so gering wie m?glich zu halten, da dieses Ma? bestimmt, wie die Entscheidungsb?ume des Modells die Daten aufteilen werden.

Trainingsmethoden im maschinellen Lernen

Es gibt drei Haupttypen von Algorithmen, die zum Trainieren von Modellen des maschinellen Lernens verwendet werden: überwachtes Lernen, unüberwachtes Lernen und verst?rkendes Lernen.

überwachtes Lernen – der Algorithmus wird mit markierten Daten (Input) trainiert, um spezifische Ergebnisse (Output) vorherzusagen. Diese Art von Lernalgorithmus verwendet Ergebnisse aus historischen Datens?tzen, um Ausgabewerte für neue, eingehende Daten vorherzusagen.
Unüberwachtes Lernen – der Algorithmus analysiert unmarkierte Daten, um Muster und Strukturen eigenst?ndig zu erkennen, die dann auf andere Datengruppen angewendet werden k?nnen, die ein ?hnliches Verhalten aufweisen. In manchen Situationen kann es notwendig sein, w?hrend des Trainings eine kleine Menge an gekennzeichneten Daten mit einer gr??eren Menge an nicht gekennzeichneten Daten zu verwenden. Diese Art des Trainings wird oft als halbüberwachtes maschinelles Lernen bezeichnet.
Verst?rkendes Lernen – anstatt Trainingsdaten zu erhalten, verbessert der Algorithmus seine Strategien durch Belohnungen aus seinen Interaktionen mit der Umwelt. Der Input für diese Art von Lernalgorithmus wird h?ufig aus der Interaktion des Lernalgorithmus mit einer physischen oder digitalen Umgebung abgeleitet.

Wie kommt es zu Verzerrungen beim maschinellen Lernen?

Die ?ffentlichkeit wünscht sich zunehmend, dass künstliche Intelligenz – und insbesondere Algorithmen des maschinellen Lernens – transparent und erkl?rbar sind. Die Transparenz von Algorithmen des maschinellen Lernens kann jedoch komplizierter sein, als nur mitzuteilen, welcher Algorithmus zur Erstellung einer bestimmten Vorhersage verwendet wurde.

Viele Menschen, die sich zum ersten Mal mit maschinellem Lernen befassen, sind überrascht, dass nicht die mathematischen Algorithmen geheim sind; tats?chlich sind die meisten der heute gebr?uchlichen maschinellen Algorithmen frei verfügbar.

Es sind die Trainingsdaten, die einen geschützten Wert haben, nicht der verwendete Algorithmus.

Da die Daten, die zum Trainieren eines Lernalgorithmus verwendet werden, von einem Menschen ausgew?hlt werden, k?nnen sie leider unbeabsichtigt zu einer Verzerrung des ML-Modells führen, das gerade erstellt wird. Die iterative Natur von Lernalgorithmen kann es ML-Ingenieuren auch erschweren, die Logik hinter einer bestimmten Vorhersage zurückzuverfolgen.

Wenn es einem Datenwissenschaftler oder ML-Ingenieur m?glich ist, zu erkl?ren, wie eine bestimmte Vorhersage zustande gekommen ist, kann ein ML-Modell als erkl?rbare KI bezeichnet werden. Wenn es nicht m?glich ist, offenzulegen, wie eine bestimmte Vorhersage zustande gekommen ist – entweder weil die Mathematik zu kompliziert ist oder die Trainingsdaten geschützt sind – kann das ML-Modell als Blackbox-KI bezeichnet werden.

MLops

Der erfolgreiche Einsatz von ML in der Praxis erfordert eine enge Zusammenarbeit zwischen Datenwissenschaftlern und Ingenieuren für maschinelles Lernen, um Modelle zu entwickeln, zu überwachen und zu optimieren. Diese Zusammenarbeit ist Teil eines Prozesses, der als MLOps (Machine Learning Operations) bekannt ist, und zielt darauf ab, den Lebenszyklus von ML-Modellen effektiv zu verwalten.

Der Betrieb des maschinellen Lernens ist ein Ansatz zur Verwaltung des gesamten Lebenszyklus eines maschinellen Lernmodells – einschlie?lich seines Trainings, seiner Abstimmung, seiner t?glichen Verwendung in einer Produktionsumgebung und seiner letztendlichen Stilllegung. Aus diesem Grund müssen ML-Ingenieure über fundierte Kenntnisse in den Bereichen Datenmodellierung, Feature-Engineering und Programmierung verfügen – zus?tzlich zu einem soliden Hintergrund in Mathematik und Statistik.

In einigen Branchen beschr?nkt sich die Aufgabe des ML-Ingenieurs jedoch darauf, zu entscheiden, welche Daten für das Training verwendet werden sollen und wie die Ergebnisse des maschinellen Lernmodells validiert werden.