Kurz gefasst: Deep Learning in 3 Minuten
„Hey Siri“, „Okay Google“, „Hallo Alexa“ — diese Anreden hört man im Alltag immer öfter. Laut der Postbank Digitalstudie 2019 nutzt inzwischen nahezu jeder Dritte in Deutschland digitale Sprachassistenten. Sie beantworten unsere Fragen, informieren uns über die Uhrzeit oder das Wetter, helfen uns bei der Navigation im Straßenverkehr und steuern unsere Musik oder das Licht. Wer ein richtiges Gespräch mit den digitalen Assistenten beginnen möchte, wird allerdings schnell an die Grenzen des Möglichen stoßen. Doch schon bald könnte auch das möglich sein. Die Fortschritte im Deep Learning machen Sprachassistenzsysteme immer effektiver.
Was ist Deep Learning?
Die menschliche Sprache richtig zu verstehen und zu interpretieren, stellt immer noch eine der größten Herausforderungen für Anwendungen von künstlicher Intelligenz dar. Gleichzeitig konnten in den letzten Jahren enorme Fortschritte in diesem Bereich erzielt werden.
Dabei spielt Deep Learning eine zentrale Rolle. Neben der Sprachverarbeitung wird Deep Learning vor allem auch in der Bilderkennung eingesetzt und könnte der Schlüssel sein, um in Zukunft mit digitalen Assistenten in natürlicher Weise zu sprechen und zu interagieren.
Die folgende Darstellung verdeutlicht den Zusammenhang zwischen künstlicher Intelligenz (KI), maschinellem Lernen (ML) und Deep Learning (DL).
Deep Learning ist eine Teildisziplin des Machine Learning und trifft Entscheidungen mithilfe künstlicher neuronaler Netze.
Während die Ideen für die Entscheidungsmodelle des „klassischen“ Machine Learning aus einer mathematischen Logik heraus entwickelt wurden, existiert für künstliche neuronale Netze ein Vorbild aus der Natur: das menschliche Gehirn mit seinem Netz aus miteinander verbundenen Nervenzellen (Neuronen).
In künstlichen neuronalen Netzen sind die Neuronen in mehreren Schichten angeordnet. Je mehr Neuronen und Schichten existieren, desto komplexere Sachverhalte lassen sich abbilden. Der Begriff “Deep Learning” leitet sich aus dem Einsatz „tiefer“ neuronaler Netze ab, die über eine große Anzahl von Schichten (Layer) verfügen.
Deep Learning kommt immer dann zum Einsatz, wenn andere maschinelle Lernverfahren an ihre Grenzen stoßen. Neuronale Netze können deutlich komplexere Muster erlernen, als es mit klassischen maschinellen Lernverfahren möglich ist, wie beispielsweise die Klassifizierung unstrukturierter Daten aus Bild- und Spracherkennung. Hier spielen künstliche neuronale Netze ihre Stärke aus.
Dabei spielt die Verfügbarkeit von Daten für den Erfolg von Deep Learning eine entscheidende Rolle. Als Faustformel gilt: Je größer die Datenmenge, desto besser funktioniert Deep Learning. Ohne ausreichende Trainingsdaten liefern neuronale Netze oft schlechtere Ergebnisse als klassische maschinelle Lernverfahren, wie folgende Grafik von Andrew Ng veranschaulicht.
Anwendungsgebiete von Deep Learning
Bekannte Beispiele für Deep Learning sind unter anderem:
- Methoden zur maschinellen Sprachverarbeitung (Natural Language Processing), die bei digitalen Sprachassistenten wie Alexa, Google Assistant oder Siri zum Einsatz kommen: Das Ziel ist es, eine direkte Kommunikation zwischen Mensch und Maschine per Sprache zu ermöglichen. Davon sind Siri & Co heute noch weit entfernt. Allerdings werden die Sprachassistenten immer besser, je mehr Feedback sie von Nutzern erhalten.
- Methoden zur Gesichtserkennung, wie zum Beispiel bei Facebook: Diese zerlegen Bilder in kleinste bedeutungsrelevante Bestandteile und lernen so, die dargestellten Gesichter genau zu erkennen. Inzwischen hat Facebook die weltweit größte Datenbank mit Gesichtern aufgebaut, indem es die Bilder einzelner Mitglieder gesammelt und diese Bilder mit Namen markiert hat. Diese Daten kann Facebook nun nutzen, um Anwendungen gezielt auf visuelle Gesichtserkennung zu schulen.
- Bilderkennung in der Medizin, wie zum Beispiel Röntgenbilder oder CT-Aufnahmen auf Anomalien wie Krebstumore hin zu untersuchen: Dabei übertreffen die Ergebnisse der automatischen Diagnose selbst die besten menschlichen Spezialisten. Wie ist das möglich? Selbst wenn die Spezialisten viele Jahre Erfahrung gesammelt haben, können sie niemals die Millionen an Bilddaten sichten, die beim Training von Anwendungen mit künstlichen neuronalen Netzen zum Einsatz kommen.
Ausblick
Die Eigenschaft, sehr komplexe Zusammenhänge zwischen der Eingabe und der Ausgabe von großen Datenmengen (auch in Echtzeit) verarbeiten zu können, ist der Hauptvorteil von Deep Learning. Dadurch können Deep Learning Anwendungen Bereiche erschließen, die lange Zeit dem Menschen vorbehalten waren. Sie lernen aus ihren Fehlern beziehungsweise Erfolgen und werden im Laufe der Zeit immer besser.
Neben der direkten Kommunikation zwischen Mensch und Maschine sind Roboterautos eine Anwendung, die unser tägliches Leben in den nächsten Jahren deutlich verändern wird. Nichts fasziniert die Menschen so sehr wie die Vorstellung von selbstfahrenden Autos, die völlig autonom von einem Ziel zum anderen steuern und keinen menschlichen Fahrer mehr benötigen.
Betrachtet man die bislang erzielten Erfolge beim autonomen Fahren, ist es nur noch eine Frage der Zeit, bis wir uns beim Autofahren tatsächlich komplett entspannt zurücklehnen können. Die rasante Entwicklung bei der Sprachverarbeitung spricht ebenso dafür, dass wir uns in naher Zukunft ganz natürlich mit digitalen Assistenten unterhalten werden und diese vielleicht sogar Humor haben.
Apropos: Glauben Sie, dass Sprachassistenten auch heute schon Humor haben können? Überzeugen Sie sich einfach selbst. Fragen Sie Siri doch zum Beispiel einmal, woher eigentlich die Babys kommen…
Was Sie über Deep Learning wissen müssen:
- Ein Teilbereich von Machine Learning
- Arbeitet mit künstlichen neuronalen Netzen
- Wird für in der Bilderkennung und Sprachverarbeitung eingesetzt
- Ermöglicht Verarbeitung großer Datenmenge bei hoher Komplexität
Autor: Gregor Puchalla
Gregor Puchalla ist Gründer und Geschäftsführer von fintechcube. Zukunftstrends sind seine Leidenschaft. Gregor hat 15 Jahre Erfahrung auf operativer und strategischer Ebene im Bereich Digitalisierung.