DE / EN / IT / SL / EL 

AIAE » E-LEARNING » INTERVIEW 2

KI und maschinelles Lernen

Die folgenden Interviewausschnitte wurden von Dr. Sebastian Lapuschkin gegeben und behandeln das Thema KI und maschinelles Lernen, geben einen Ansatz zur Automatisierung und erwähnen weitere Beispiele für maschinelles Lernen.

Transkript

Mein Name ist Dr. Sabasana. Ich bin die Leiterin der experimentellen KI zu Hause in Berlin und meine Aufgabe ist es, Forschung zur Erweiterbarkeit von künstlicher Intelligenz zu betreiben.

Quiz question 1/8

Der Befragte, Dr. Sebastian Lapuschkin, ist der Leiter der Gruppe “Erklärbare künstliche Intelligenz” am Fraunhofer HHI in Berlin. Er ist verantwortlich für die Durchführung von Forschung zur Erklärbarkeit von künstlicher Intelligenz.


Quiz question 1/1

You have completed the Quiz!

Loading...

Transkript

Was ist maschinelles Lernen und wie funktioniert es? 

Maschinelles Lernen ist also im Wesentlichen ein Weg, Automatisierungslösungen zu finden, datengesteuerte Automatisierungslösungen, wenn dieses Automatisierungsziel nicht explizit erreicht werden kann, z. B. durch die Verwendung oder Programmierung von Algorithmen. Die Idee hinter dem maschinellen Lernen ist, Daten zu verwenden, die das Problem darstellen oder beschreiben, und dann Algorithmen des maschinellen Lernens zu verwenden, um eine Lösung für diese Probleme zu finden. Dieser Ansatz wird als datengesteuert bezeichnet. 

Und können Sie uns sagen, wie maschinelles Lernen mit künstlicher Intelligenz und Big Data zusammenhängt? 

Ja, natürlich. Künstliche Intelligenz ist zunächst einmal mehr oder weniger nur ein Marketingbegriff, der maschinelles Lernen beschreibt. Oder man könnte auch sagen, dass künstliche Intelligenz ein aktuelles Teilgebiet des maschinellen Lernens ist. Um das zu verstehen, muss man wissen, dass alles, was im Bereich der künstlichen Intelligenz passiert, mit maschinellem Lernen arbeitet. Und was die Sache mit dem Marketingbegriff angeht, so ist es so, dass der Begriff künstliche Intelligenz Anfang der 2000er Jahre mit dem Aufkommen des Deep-Learning-Hypes wieder aufgetaucht ist. Zu dieser Zeit war das Aufkommen von Deep-Learning bei einem Höhepunkt, zum ersten Mal geprägt wurde der Begriff tatsächlich in den 1960er oder 50er Jahren mit der Entstehung des ersten maschinellen Lernens. Big Data beschreibt den Ansatz, den eine große Menge von Daten zu sammeln und zu organisieren. Richtig? Und um maschinelles Lernen effizient durchführen zu können, brauchen Sie Daten, die Ihr Problem ausreichend und repräsentativ beschreiben. Wenn Sie jedoch viele Daten haben, bedeutet das nicht, dass Ihre Daten gut sind, also dass sie ein Problem beschreiben. Sie könnten auch einige verwirrende Merkmale einführen, d. h. Informationen, die mit den beabsichtigten Zielen übereinstimmen, aber dazu führen, dass Ihr Modell am Ende ein anderes Ziel hat, weil es nicht herausfinden kann, was Sie mit den Daten genau wollen. Richtig? Ich glaube, das ist ein bisschen kompliziert zu beschreiben. Das Problem ist, dass Sie maschinelles Lernen einsetzen, um ein Problem zu lösen, das Sie nur anhand von Daten beschreiben können, und wenn Ihre Daten nicht die gewünschte Lösung beschreiben, wird der Algorithmus für maschinelles Lernen wahrscheinlich nicht die gewünschte Lösung finden, sondern eine andere Lösung, die ebenfalls funktioniert. Aber das könnte hilfreich sein.

Quiz question 1/8

Maschinelles Lernen zielt darauf ab, datengesteuerte Automatisierungslösungen zu finden, wenn das Automatisierungsziel nicht explizit erreicht werden kann.




Quiz question 1/8

Maschinelles Lernen zielt darauf ab, manuelle Lösungen für menschliche Probleme auf der Grundlage von Daten zu finden.




Quiz question 1/8

Maschinelles Lernen ist ein datengesteuerter Ansatz, um menschliche Lösungen für Probleme zu finden, die von Maschinen verursacht werden.




Quiz question 1/8

Big Data beschreibt den Ansatz, größere und komplexe Daten aus verschiedenen Quellen zu sammeln und zu organisieren.




Quiz question 1/8

Um maschinelles Lernen effizient durchführen zu können, benötigen Sie repräsentative Daten, die Ihr Problem ausreichend beschreiben.




Quiz question 1/8

Viele Daten zu haben bedeutet, dass die Daten automatisch gut sind und ein Problem beschreiben können.




Quiz question 1/1

You have completed the Quiz!

Loading...

Transkript

Und könnten Sie uns vielleicht mehr über Deep Learning erzählen und was der Unterschied zwischen maschinellem Lernen und Deep Learning ist? 

Ja, Deep Learning ist wiederum ein Unterbegriff des maschinellen Lernens und beschreibt die Verwendung und das Training von maschinellen Lernalgorithmen, die eine detaillierte Darstellung von Informationen haben. Damit sind in der Regel tiefe neuronale Netze gemeint. Die Tiefe dieses tiefen Lernens besteht darin, dass man bei tiefen neuronalen Netzen in der Regel mehrere Schichten möglicher Repräsentationen von Daten übereinander legt. Man kann sich das wie Schichten von mathematischen Operationen vorstellen, die dann beim Training gelernt werden. Man gibt also die Form des Netzes vor und die Funktion des Netzes wird in einem schrittweisen Trainingsprozess erlernt, indem man Beispieldaten bereitstellt. Und den Begriff Deep Learning, der Ansatz kommt von der Tiefe des Netzes. 

Und was ist der Unterschied zwischen maschinellem Lernen, Deep Learning und herkömmlicher Programmierung? 

Okay, wie gesagt, Deep Learning ist ein Teil des maschinellen Lernens. Der Unterschied zwischen maschinellem Lernen und traditioneller Programmierung ist folgender: Nehmen wir an, Sie haben einige Daten und kennen die Regeln, wie diese Daten zu verarbeiten sind, richtig? Dann können Sie Ihre Lösungen implementieren. Und das ist ein typischer Programmieransatz. Sie haben Ihre Daten, Sie wissen, wie sie zu verarbeiten sind, Sie implementieren Ihre Programme und Ergebnisse und Antworten. Der Ansatz des maschinellen Lernens ist also, dass Sie eine Menge Daten haben und die Antworten auf diese Daten kennen, aber Sie haben keine Ahnung, wie Sie darauf kommen sollen. Im Grunde haben Sie keine Regeln, richtig? Die Aufgabe des maschinellen Lernens besteht darin, Ihre Maschine so zu trainieren, dass sie die Regeln lernt, die es Ihnen ermöglichen, die Daten zu verknüpfen und die erwarteten Antworten zu produzieren. Und wenn Sie das geschafft haben, haben Sie ein trainiertes maschinelles Lernmodell, das neue Daten empfangen kann, Daten, die es noch nie zuvor gesehen hat, weil es die Regeln gelernt hat und die Daten nicht auswendig gelernt haben muss, und es kann dann Antworten produzieren. In der Sprache des maschinellen Lernens sagen wir also, dass das Modell verallgemeinern sollte, was bedeutet, dass es allgemeine Regeln gelernt haben sollte, wie es mit den von uns eingegebenen Daten umzugehen hat, um die richtigen Antworten zu geben. Sobald Sie ein solches Modell haben, können Sie es als Regelwerk in Ihre Programmieraufgabe einfügen. Zum Beispiel, wenn das Regelwerk so komplex ist, dass Sie es niemals explizit durch manuelles Schreiben des Codes aufbauen können.

Transkript

Und können Sie ein oder mehrere Beispiele für häufige Verwendungen von maschinellem Lernen nennen? 

Ich denke, ein Beispiel, das recht häufig verwendet wird, ist die optische Zeichenerkennung, d. h. die Maschinen und das Postamt, die die Zieladresse des von Ihnen geschriebenen Briefes lesen, was normalerweise nicht von Menschen, sondern nur von sensorischen Maschinen gemacht wird. Die Maschine entziffert Ihre Handschrift, digitalisiert die Adresse und speist all diese Informationen in eine Datenbank ein, woraufhin der Brief an das Ziel geleitet wird. Ein anderer Ansatz wäre zum Beispiel die Gesichtserkennung. Zum Beispiel in digitalen Videokameras, Webcams oder auch in intelligenten Systemen. Das Spektrum der Anwendungen im Bereich des maschinellen Lernens ist also sehr nützlich. In unserem Labor setzen wir maschinelles Lernen zum Beispiel für die Prävention von Naturkatastrophen ein, indem wir beispielsweise Klimadaten oder Daten zur Luftverschmutzung der letzten Jahre, Monate usw. verfolgen. Und dann trainieren wir ein Modell, das in der Lage sein sollte, vorherzusagen, wie sich die Temperaturentwicklung und so weiter verhält.

In Anbetracht der vielen Faktoren, die in den letzten Tagen und Monaten aufkamen, könnten Sie ein oder mehrere Beispiele für häufige Einsatzmöglichkeiten von Deep Learning nennen? 

So ziemlich alles, was komplex ist und scheinbar unlösbar war, haben wir vor etwa zehn Jahren mit Deep Learning lizenziert. Und das ist zum Beispiel die Bilderkennung, die Deep Learning verwendet, weil diese tiefe Struktur es dem Modell erlaubt, wie eine Kaskade von verschiedenen Schritten der Merkmalsverarbeitung zu lernen. Richtig? Tatsächlich sind tiefe neuronale Netze in gewisser Weise durch den visuellen Bereich des menschlichen Gehirns motiviert, der Informationen in mehreren Schritten verarbeitet, beginnend mit dem Empfang von Farbinformationen bis hin zur Auslösung von Neuronen für einfache Formen wie Kanten und runde Formen, usw. Neuronale Netze machen eigentlich ziemlich ähnliche Dinge. Wenn man von den einfachsten zu sehr komplexen Merkmalen übergeht, z. B. von Farbverläufen an Kanten zu Neuronen, die gelernt haben, Eidechsenköpfe zu erkennen, können diese komplexen Bildinformationen effizient und recht schnell verarbeitet werden. Und das führt dazu, dass aktuelle maschinelle Lernmodelle in der Bilderkennung dem Menschen überlegen sind, vor allem wenn man die Zeit mit einbezieht.

Quiz question 1/8

Maschinelles Lernen wird in Gesichtserkennung eingesetzt, zum Beispiel in digitalen Videokameras, Webcams und Überwachungssystemen. Der Anwendungsbereich für maschinelles Lernen ist sehr groß. In den Labors der Befragten wird maschinelles Lernen für Vorbeugung von Naturkatastrophen eingesetzt, wobei sie Klimadaten und Daten zur Luftverschmutzung aus den vergangenen Jahren verfolgen und dann ein Modell trainieren, das in der Lage sein sollte, Wetter- und Klimafaktoren vorherzusagen. Deep Learning wird in vielen komplexen Prozessen wie Bilderkennung eingesetzt.


Quiz question 1/1

You have completed the Quiz!

Loading...

Transkript

Und was sind die Chancen und die positiven Aspekte des maschinellen Lernens für die Gesellschaft?

Zum einen ist es das Potenzial, einen Automatisierungsgrad zu erreichen, der uns Aufgaben abnimmt, die arbeitsintensiv, aber langweilig sind und die eigentlich niemand machen müsste, weil sie sich gut automatisieren lassen. Das erhöht natürlich die Effizienz. Es reduziert Fehler, weil die Maschine nicht müde wird. In der Medizin könnten Maschinen zum Beispiel die Entscheidungen von Auszubildenden unterstützen. In der Pathologie, zum Beispiel. Die Pathologie ist hier ein besonders interessanter Bereich, denn es ist bekannt, dass ein:e Histologe:in seinen:ihren höchsten Wert hat, wenn er:sie in den Ruhestand geht, weil er:sie eine lebenslange Grundlernzeit hinter sich hat. Und diese Fast-Ruheständler:innen sind sehr viel schneller als die Neuen, die das Handwerk lernen müssen, oder? Und mit schneller meine ich, dass sie intuitiv auf einen dieser histopathologischen Objektträger schauen und sofort sehen, was los ist, während der Neuling jedes Stückchen des Objektträgers akribisch scannen und sich Zeit nehmen muss und so weiter und so fort. Und es gibt auch eine Gruppe in dem Bereich, die von Andreas Holzinger geleitet wird. Er trainiert Methoden des maschinellen Lernens auf der Grundlage von Datenannotationen, die von einem:einer Experten:in, einem:einer Pathologen:in, gemacht wurden, mit dem Ziel, seine:ihre Lebenserfahrung in seinem:ihrem Bereich in ein maschinelles Lernmodell zu verpacken. Es kann also potenziell als Trainingsbegleiter für Einsteiger:innen in diesem Bereich verwendet werden.

Transkript

Und was sind Ihrer Meinung nach die wichtigsten Risiken, z. B. in Bezug auf die Ethik? 

Zum einen geht es natürlich um die beabsichtigte Anwendung des maschinellen Lernens. Wollen Sie es zum Beispiel für das Allgemeinwohl einsetzen? Wollen Sie die Gesellschaft verbessern? Wollen Sie die Umwelt verbessern? Oder wollen Sie es in einen Kampfjet einbauen? Das ist der Kernunterschied hier. Und der nächste Punkt ist, dass dies die extremen Enden des Spektrums sind. Und dazwischen gibt es eine Fülle gesellschaftlicher Fragen. Kann man zum Beispiel die Einschätzung der Kreditwürdigkeit einer Person automatisieren und dafür maschinelles Lernen einsetzen? Und dann stellt sich die Frage: Welche Daten haben Sie verwendet, um dieses Modell zu trainieren? Und haben Sie vielleicht unerwünschte Verbindungen zwischen einigen Merkmalen und Daten und dem Ergebnis modelliert oder trainiert? Wir haben zum Beispiel gelernt, dass einige Ethnien, aus welchen Gründen auch immer, zum Beispiel wegen Hautfarbe oder ethnischer Zugehörigkeit, keine finanzielle Unterstützung erhalten sollten, richtig? Die Frage ist immer, welche Daten man einspeist. Welche Daten sollen verwendet werden? Es gibt den Grundsatz der Datensparsamkeit, der besagt, dass man nur die Daten verwendet, die man für die Lösung der Aufgabe benötigt, denn zusätzliche Daten könnten zu einem problematischen Verhalten im Modell führen. Und das ist natürlich eines der großen aktuellen Probleme bei der fortschreitenden Automatisierung. Mit maschinellem Lernen. Andererseits stellt sich immer die Frage, ob man reale Daten zum Trainieren der maschinellen Lernmodelle verwendet und nicht zufrieden ist mit dem, was das Modell tut, denn das Modell selbst ist objektiv, es kann nur aus den von Ihnen bereitgestellten Daten lernen. Die Daten sind die einzige Realität des Modells. Bedeutet das, dass Ihnen nicht gefällt, was das Modell tut? Oder gefällt Ihnen die Realität nicht? Richtig. Und ich denke, dass es vielleicht nicht immer der richtige Weg ist, die Daten zu korrigieren und zu bearbeiten, um bestimmte Verhaltensweisen des Modells loszuwerden. Ich würde es als einen Indikator für den notwendigen Wandel in der Gesellschaft sehen, der dies hervorbringt.

Transkript

Eine Frage zur erklärbaren künstlichen Intelligenz, also X-AI: Können Sie erklären, was das ist? 

Ja. Das Ziel von erklärbaren KI ist es, einen Blick in die Black Box des maschinellen Lernens zu werfen. Das derzeitige maschinelle Lernen ist so, dass die leistungsstärksten maschinellen Lernmodelle in der Regel recht komplex sind, was bedeutet, dass der:die außenstehende Beobachter:in, ja sogar der:die Entwickler:in, nicht wirklich einen Einblick in das hat, was das Modell tatsächlich lernt. Und mit Explainable AI oder X-AI wollen wir eine gewisse Transparenz darüber herstellen, was das Modell tut. Ja, das kann auf verschiedene Weise geschehen. In unserem Labor haben wir eine modifizierte Backdrop-Methode entwickelt, d. h. wenn man einige Datenpunkte in das Modell einspeist, wird das Modell Schicht für Schicht in das Netzwerk oder das Modell transformiert. Im Grunde durchläuft es das Modell und das Ergebnis ist die Antwort des Modells. Das stimmt. Und wir können diesen Prozess in gewisser Weise umkehren, wenn das Modell zum Beispiel ein Bild erhält und mir sagt, dass es eine Katze ist, kann ich mit der Katzen-Output beginnen und sagen: Ja, aber warum? Und dann kann ich die Teilentscheidungen des Modells Schicht für Schicht auseinandernehmen, bis ich wieder beim Input ankomme, und dann erhalte ich, was wir eine Heatmap nennen. Das ist im Grunde genommen eine Maske im Input-Raum, wo die meisten Informationen sind, und man kann das für jedes mögliche Ergebnis machen. Wenn das Modell zum Beispiel einen Hund ausgibt, kann man den gleichen Prozess mit dem Hund-Output durchführen und erhält dann vielleicht die Antwort, warum das Modell denkt, dass es einen Hund im Bild gibt oder wo die Hunde-Information nicht stimmt. Auf diese Weise kann man die Verwendung der durch die Datenpunkte gegebenen Informationen des Modells mit dem Output des Modells verbinden. Ich würde sagen, dass die ersten ernsthaften Schritte und komplexeren Modelle im Jahr 2010 gemacht wurden, und seitdem hat es sich ziemlich schnell weiterentwickelt. Es gibt also eine Menge Arbeit. Wir arbeiten daran, Erklärungen zu liefern, die über einfache Heatmap-Visualisierungen hinausgehen, die manchmal sehr interpretationsbedürftig sind, vor allem, wenn die Daten schwer zu verstehen sind und erst bestätigt werden müssen. Aber unser Endziel ist es, unter der Vorraussetzung der verbesserten Verwertbarkeit, an der derzeit gearbeitet wird, ein Modell zu erstellen, das mehr oder weniger selbsterklärend sein sollte, indem es nicht sagt: Schaut euch diesen Teil des Bildes an, dort gibt es Informationen, die meiner Meinung nach als Modell für die Katze sprechen. Sondern das Modell sollte dann den:die Benutzer:in informieren. Zum Beispiel, dass es dente, dass es eine Katze ist, weil es dies und das und das und das sieht. Katzenähnliche Merkmale, die das Modell z.B. als Merkmale für die Vorhersage gelernt hat. 

Ich danke Ihnen vielmals. Und was macht erklärbare KI möglich? Was kann man damit erreichen? 

Zum einen können Sie verstehen, was das Modell tatsächlich tut, und Sie können ein Verständnis auf der Basis von Stichproben gewinnen, d. h. in diesem Fall erhalten Sie für jeden Datenpunkt, den Sie in das Modell eingeben, eine Rückmeldung über die Schlussfolgerungen des Modells auf der Grundlage dieser Daten. Dieses Feedback können Sie dann natürlich nutzen, um Ihr Modell zu überprüfen. In einigen Fällen kann es aber auch vorkommen, dass Sie die Information erhalten, dass das Modell aus den falschen Gründen die richtigen Ergebnisse liefert. Zum Beispiel. Und das könnte Sie auf Fehler in Ihren Trainingsdaten hinweisen, wo Sie einige verwirrende Informationen eingeführt haben, einige verwirrende Merkmale, die das Modell dann mit dem Output von Katzen in Verbindung bringt, die aber absolut nicht katzenähnlich sind, nur weil es für das Modell einfacher ist. Und dann haben wir wieder das Problem, dass die Trainingsdaten des Modells die einzige Realität des Modells sind. Man gibt ihm einfach ein paar tausend Bilder von Katzen und das Modell lernt, wie es von dieser Datenquelle zur Katze kommt. Und wenn diese Bilder zum Beispiel von Flicker stammen und alle mit einem Copyright-Wasserzeichen versehen sind, weil es sich um Archivbilder oder so etwas handelt, könnte das Modell denken, dass es sich bei Archivbildern um Katzen handelt. Richtig? Das ist das Problem, eines der Probleme, die wir mit der Erklärbarkeit identifizieren können, und das führt dann zu der Option, das Modell zu verbessern, die Datenquelle zu verbessern und so weiter, so dass wir im Grunde genommen viel besser informierte Entwickler:innen für maschinelles Lernen sind als vor der Erklärung.

The learning unit has not been completed

You have successfully completed the learning unit.