DE / EN / IT / SL / EL 

AIAE » E-LEARNING » INTERVIEW 7

Maschinelles Lernen

Die folgenden Interviewausschnitte wurden mit Fabio Del Frate aufgenommen und behandeln die Definition von KI, die wichtigsten Aspekte des maschinellen Lernens, die Interpretationen über Deep Learning, die Themen überwachtes und unüberwachtes Lernen und deren Zusammenhang mit KI sowie die verschiedenen Arten des maschinellen Lernens.

Transkript

Fabio Del Frate erwarb an der Universität Rom “Tor Vergata” einen Master-Abschluss in Elektrotechnik (1992) und den Doktortitel in Informatik (1997). Von 1995 bis 1996 war er Gastwissenschaftler am Massachusetts Institute of Technology, und von 1998 bis 1999 arbeitete er bei der Europäischen Weltraumorganisation. Danach wechselte er an die Universität Rom “Tor Vergata”, wo er derzeit außerordentlicher Professor für Fernerkundung und angewandten Elektromagnetismus in verschiedenen Master- und PhD-Programmen ist. Zu diesen Themen war er als Dozent an mehreren europäischen Universitäten tätig und leitete als Principal Investigator/Projektmanager mehrere von der Europäischen Weltraumorganisation (ESA) und der Italienischen Weltraumorganisation (ASI) finanzierte Projekte, bei denen er Forschungsaktivitäten im Bereich der auf Satellitendaten angewandten künstlichen Intelligenz für die Erdbeobachtung (im Folgenden als “EO” bezeichnet) leitete.

Quiz question 1/8

Der Befragte, Fabio Del Frate, ist Doktor der Informatik und derzeit als Professor an der
Universität Rom Tor Vergata tätig. Er hält Vorlesungen über Fernerkundung und
Elektromagnetik. Bei den europäischen und italienischen Raumfahrtbehörden leitete er
Forschungsaktivitäten auf dem Gebiet der künstlichen Intelligenz, die auf Satellitendaten für Erdbeobachtung angewandt wird.


Quiz question 1/1

You have completed the Quiz!

Loading...

Transkript

Q1. Herr Prof. Del Frate, lassen Sie uns mit den Grundlagen beginnen. Was ist Künstliche Intelligenz?

Nun, um kurz zu erklären, was KI ist, zitiere ich gerne einen der Väter der KI, Prof. Nils John Nilsson. Für ihn ist “Künstliche Intelligenz die Tätigkeit, die darauf abzielt, Maschinen intelligent zu machen, und Intelligenz ist die Eigenschaft, die ein Wesen befähigt, in seiner Umgebung angemessen und vorausschauend zu handeln.” 

Wir können also sagen, dass wir den Maschinen und Computern mehr Freiräume geben. Wir fordern sie auf, ihre eigenen Entscheidungen zu treffen, um über das hinauszugehen, was bei der traditionellen Computerprogrammierung geschieht, nämlich im Wesentlichen eine Abfolge von Befehlszeilen auszuführen, auch wenn diese lang und komplex ist. 

Wie setzen wir das um? Es besteht im Wesentlichen darin, die Maschinen mit Daten zu füttern und sie in die Lage zu versetzen, nach Beziehungen zwischen diesen Daten zu suchen, selbst wenn diese sehr subtil sind. Mit diesen beiden Elementen – Daten und Interpretationsmodellen – entwickelt und baut die KI ihr eigenes Wissen, ihre eigene Erfahrung auf.

Ich denke, dass in diesem Zusammenhang auch eine historische Perspektive interessant sein könnte, so dass wir fragen könnten, wann die ersten Algorithmen für künstliche Intelligenz und maschinelles Lernen vorgeschlagen wurden. Es mag verschiedene Antworten geben, aber meiner Meinung nach sollten wir, um die Wurzeln der künstlichen Intelligenz zu finden, bis ins Jahr 1943 zurückgehen, als das erste mathematische Modell neuronaler Netze in der wissenschaftlichen Arbeit “A logical calculus of the ideas immanent in nervous activity” von Walter Pitts und Warren McCulloch vorgestellt wurde. In diesem Aufsatz wird zum ersten Mal ein einzelnes Neuron als elementare nichtlineare Verarbeitungseinheit dargestellt und es wird angenommen, dass es mit anderen Neuronen verbunden ist. Mit anderen Worten: eine erste grobe, aber effektive mathematische Darstellung des Gehirns.

Nun stellt sich die Frage: Ist das alles gefährlich? Ich denke, die Antwort lautet: “Ja, das könnte es sein”, aber genauso, wie es jedes Mal der Fall ist oder war, wenn wir von einer neuen Technologie fasziniert sind und sie wachsen lassen wollen. Die Entwicklung einer “sicheren” KI ist ein Thema, mit dem sich Wissenschaftler:innen und Forscher:innen intensiv beschäftigen. Der wichtigste Punkt ist, dass der Mensch immer als Aufsichtsperson fungieren sollte. Die Regeln, die Leitlinien, aber vor allem die Daten, auf denen die Maschine, wie wir bereits sagten, ihr Wissen aufbaut und auf die sie sich bei ihren Entscheidungen stützt, werden von menschlichen Experten:innen bereitgestellt, so dass die Maschine zwar mit einem gewissen Grad an Autonomie handelt, aber innerhalb eines genau festgelegten Spielfelds, dessen Grenzen von Menschen festgelegt werden.

Quiz question 1/8

Die KI bietet Maschinen und Computern mehr Freiheitsgrade, was bedeutet, dass Maschinen
aufgefordert werden, über die traditionelle Computerprogrammierung hinauszugehen.
Damit Maschinen Muster und Beziehungen erkennen und ihr eigenes Wissen aufbauen können,
müssen sie mit Daten versorgt werden. Zwei wichtige Elemente für die Interpretation der
Ergebnisse der KI sind Daten und Modelle. KI hat sowohl positive als auch inspirierende
Ergebnisse, aber sie kann sich auch als gefährlich erweisen. Daher müssen sich die
Forscher:innen auf eine sichere Entwicklung der künstlichen Intelligenz konzentrieren. Der
wichtigste Grundsatz muss sein, dass der Mensch immer in der Rolle des Überprüfers von Regeln und
Richtlinien, aber vor allem von Daten ist.


Quiz question 1/1

You have completed the Quiz!

Loading...

Transkript

Q2. Was ist maschinelles Lernen?

Nun, ich würde sagen, dass maschinelles Lernen ein möglicher, ich schätze, im Moment der am meisten genutzte, technische Prozess ist, um künstliche Intelligenz in einer Maschine zu erzeugen. Wir haben bereits gesehen, dass es zwei Hauptakteure gibt: die Daten und das Modell, genauer gesagt ein mathematisches Modell. Die Herausforderung besteht darin, die Parameter des mathematischen Modells so zu finden, dass es die Beziehungen zwischen den Daten darstellen kann. Alles hängt davon ab, dass ein Lernprozess auf der Grundlage der Daten selbst eingeleitet wird. Es gibt verschiedene Arten von Modellen, z. B. neuronale Netze oder Support-Vector-Maschinen, und folglich auch verschiedene Algorithmen zum Erlernen des Modells. Das Endziel ist jedoch immer dasselbe: Wissen aus den im Lernprozess verwendeten Trainingsdaten zu extrahieren und dieses extrahierte Wissen auf neue Daten anzuwenden. Übrigens ist die Bewertung, wie gut die Leistung des Modells auf den neuen Daten ist, d. h. auf Daten, die während der Trainingsphase nicht berücksichtigt wurden, sehr wichtig. Sie sagt uns, inwieweit das Modell in der realen Welt anwendbar ist, inwieweit es in der Lage ist, zu verallgemeinern. 

In jedem Fall sind die Qualität und die Quantität der in der Lernphase verwendeten Daten entscheidende Faktoren für eine erfolgreiche Leistung. Insbesondere muss die Menge der Daten statistisch signifikant sein, um die relevanten Merkmale des Phänomens, das wir untersuchen wollen, zu liefern. Ein weiterer wichtiger Punkt ist die Entscheidung, wie komplex unser mathematisches Modell sein soll. Es wäre ein ernstes Problem, wenn wir ein zu einfaches Modell wählen, um nach sehr subtilen Beziehungen zwischen den Daten zu suchen, aber wenn die den Daten zugrundeliegenden Regeln weniger kompliziert sind, kann auch die Struktur des Modells leichter sein, manchmal…. ist weniger mehr, wie wir sagen, wobei weniger sich auf die Anzahl der Parameter bezieht, die das Modell charakterisieren. 

Die Komplexität des Modells hat übrigens auch mit der Zeit zu tun, die wir zum Trainieren des Modells benötigen, und mit der Menge an Daten, die für die Durchführung des gesamten Lernprozesses erforderlich ist.

Quiz question 1/8

Was ist maschinelles Lernen?





Quiz question 1/8

Was macht maschinelles Lernen?





Quiz question 1/8

Was sind die Ergebnisse der verschiedenen Modelltypen?





Quiz question 1/8

Warum ist es wichtig, die Leistung des Modells anhand neuer Daten zu bewerten?





Quiz question 1/8

Welches sind die entscheidenden Faktoren für die erfolgreiche Anwendung von KI?





Quiz question 1/1

You have completed the Quiz!

Loading...

Transkript

Q3. KI und ML werden oft mit Begriffen wie “Deep Learning” in Verbindung gebracht. Was ist Deep Learning?

Nun, wir können sagen, dass das Wort “deep” in “deep learning” zwei verschiedene Bedeutungen hat, obwohl sie sehr stark miteinander verbunden sind. Die eine hat mit der hierarchischen Darstellung des Szenarios zu tun, an dem wir interessiert sind.  Handelt es sich bei dem Szenario beispielsweise um Objekterkennung, so hat tiefes Lernen mit den verschiedenen Stufen des Erkennungsprozesses des Objekts zu tun: als Tier, als Hund, als Dalmatinerhund.

Diese verschiedenen Stufen der Repräsentation korrespondieren mit den verschiedenen Schichten des mathematischen Modells, das wir zur Repräsentation verwenden wollen, d. h. vereinfacht gesagt, eine Schicht des mathematischen Modells konzentriert sich auf das Tier, eine Schicht auf den Hund, eine Schicht auf die Art des Hundes.  Genau das geschieht bei einem tiefen neuronalen Netz. Neuronale Netze sind die am häufigsten verwendeten Modelle für tiefes Lernen. Hier haben wir also die zweite Bedeutung, die eine topologische Bedeutung ist und sich auf die Anzahl der Schichten der Struktur bezieht. Wir haben also tiefe neuronale Netze, wie z. B. Convolutional Neural Networks, die viele Verarbeitungsschichten umfassen, und flache neuronale Netze, wie z. B. herkömmliche Multi-Layer Perceptrons, die neuronale Netze mit einer begrenzten Anzahl von Schichten sind. Um auf das zurückzukommen, was wir über die Komplexität der Modelle gesagt haben: Deep-Learning-Strukturen sind zweifellos sehr komplex, was einen hohen Rechenaufwand und die Verfügbarkeit großer Mengen von Lerndaten erfordert. Der Bedarf an einer sehr großen Anzahl von Daten hat die Entwicklung neuer Techniken zur so genannten “Datenerweiterung” angeregt, die darin besteht, die Anzahl der Daten ausgehend von einem begrenzten Datensatz zu erhöhen.

Quiz question 1/8

Ja
Nein
 

Kann man sagen, dass Deep Learning zwei Bedeutungen hat?


Ist Deep Learning für mehrere Stufen im Prozess der Objekterkennung verantwortlich?


Enthält ein mathematisches Modell verschiedene Wissensschichten?


Stimmt es, dass neuronale Netze nicht die am häufigsten verwendeten Netze für Deep Learning sind?


Ist eine der Bedeutungen von Deep Learning die topologische?


Können neuronale Netze flach oder faltig sein?


Ist tiefes Lernen eine nicht-komplexe Strategie?



Quiz question 1/1

You have completed the Quiz!

Loading...

Transkript

Q4. Was ist überwachtes Lernen? Können Sie einige Beispiele für Anwendungen nennen, die es verwenden?

Nun, ich würde sagen, dass das überwachte Lernen heute der am weitesten verbreitete Unterzweig des maschinellen Lernens ist. Überwachtes Lernen ist eine Form des Lernens, bei der für eine gegebene Eingabe ein “wahres” Ergebnis verfügbar ist und diese Wahrheit dem Modell beigebracht werden kann. Mit anderen Worten: Als Lehrer:in oder Betreuer:in wissen wir für jede Eingabe, die wir dem Modell geben, was die Ausgabe des Modells sein sollte, und wir wollen, dass das Modell diese allgemeine Regel berücksichtigt. In der Regel geschieht dies durch Minimierung einer so genannten Fehler- oder Kostenfunktion, die den Abstand zwischen den gewünschten Ausgabewerten und den vom Modell während der Trainingsphase erzeugten tatsächlichen Ausgabewerten darstellt. Eigentlich kann man davon ausgehen, dass das überwachte Lernen erfolgreich ist, wenn die endgültige Fehlerrate über eine Reihe von Beispielen, die während der Trainingsphase nicht verwendet wurden, unter einem vordefinierten Schwellenwert liegt. Die Trainingsphase kann sehr lang sein, aber wenn wir sie erst einmal abgeschlossen haben, haben wir ein sehr leistungsfähiges Werkzeug, das im Grunde in Echtzeit arbeitet, um die neuen Daten zu verarbeiten. Überwachtes Lernen kann in vielen Bereichen nützlich sein. Eine ziemlich umfangreiche Anwendung betrifft die Bildklassifizierung. In diesem Fall handelt es sich bei den echten Daten um Daten, die durch menschliche Bildinterpretation beschriftet wurden. Die Klassifizierung kann auf verschiedenen Ebenen erfolgen: Pixelebene, Fleckenebene, Objektebene. Die Klassifizierungsebene bestimmt die Wahl des Inputs, den wir dem Modell geben wollen. Insbesondere das überwachte Lernen wird heute sehr häufig in der Erdbeobachtung eingesetzt, wenn es darum geht, bio-geophysikalische Parameter aus von Satelliten gesammelten Daten abzuschätzen. Ein interessantes Beispiel ist die Präzisionslandwirtschaft in der Landwirtschaft. Wenn wir die Biomasse einer Kultur überwachen wollen, um die Menge des einzusetzenden Düngers zu optimieren, können wir die von Satelliten erfassten Daten dieser Kultur nutzen. Insbesondere im Mikrowellenbereich des elektromagnetischen Spektrums ist die Gewinnung von Vegetationsparametern jedoch nicht trivial, da die Messung auch, sagen wir, durch den darunter liegenden Boden verunreinigt ist. Daher können überwachte KI-Modelle definitiv eines der Werkzeuge sein, die es uns ermöglichen, den Teil der Informationen in der Messung abzurufen, der mehr mit der Vegetation zusammenhängt, und den Teil zu verwerfen, der mehr durch den Boden bedingt ist.

Quiz question 1/8

Überwachtes Lernen ist kein gängiger Unterzweig des maschinellen Lernens.




Quiz question 1/8

Der Fehler ist der Abstand zwischen den beschlossenen und den tatsächlichen Ausgabewerten.




Quiz question 1/8

Die Trainingsphase des überwachten Lernens ist kurz.




Quiz question 1/8

Das Endergebnis des überwachten Lernens ist sehr leistungsfähig, da es in Echtzeit mit neuen Daten arbeiten kann.




Quiz question 1/8

Bildklassifizierung und Objekterkennung sind Beispiele für überwachtes Lernen.




Quiz question 1/8

Überwachtes Lernen wird selten auf Erdbeobachtungen angewendet.




Quiz question 1/8

Biophysikalische Parameter aus von Satelliten gesammelten Daten werden in das überwachte Lernen einbezogen, wenn Erdbeobachtungen gemacht werden.




Quiz question 1/1

You have completed the Quiz!

Loading...

Transkript

Q5. Was ist unüberwachtes Lernen? Können Sie einige Beispiele für Anwendungen nennen, die es verwenden?

Der Hauptzweck des unüberwachten Lernens besteht darin, Korrelationen zwischen Daten zu finden, um sie in ähnliche Kategorien umzugruppieren. Beim unüberwachten Lernen brauchen wir keine externen Markierungsvorgänge oder eine:n Lehrer:in, der:die Zielwerte vorgibt. Das gesamte Training des mathematischen Modells basiert nur auf den vorhandenen Originaldaten, so dass der Prozess in diesem Fall im Vergleich zum überwachten Lernen durch einen höheren Automatisierungsgrad gekennzeichnet ist. Man kann sagen, dass das Modell am Ende des Trainings eine interne Repräsentation der Daten erstellt, die sie verständlicher und leichter zu interpretieren macht. Wie bei den anderen Lernparadigmen kann auch das unüberwachte Lernen mit Hilfe verschiedener mathematischer Modelle umgesetzt werden. Auch in diesem Fall müssen wir immer die Komplexität des Modells im Auge behalten, die die Komplexität der angestrebten internen Repräsentation widerspiegeln sollte. In der EO und in anderen Bereichen kann unüberwachtes Lernen zur Verringerung der Dimensionalität eingesetzt werden. Betrachtet man eine hyperspektrale Messung, so kann die gesammelte Information über Hunderte von Wellenlängen verteilt sein. In vielen Fällen wäre es wünschenswert, solche Informationen oder die wichtigsten davon in einer geringeren Anzahl von Komponenten zu komprimieren. Dies kann mit unüberwachten Lerntechniken erreicht werden.

Quiz question 1/8

1) Wonach suchen wir in Daten mit unüberwachtem Lernen? Korrelation.
2) Auf welcher Grundlage werden die Daten beim unüberwachten Lernen neu gruppiert?
Ähnlichkeiten.
3) Sind beim unüberwachten Lernen externe Beschriftungsvorgänge erforderlich? Nein.
4) Worauf basiert das Training von mathematischen Modellen? Originaldaten.
5) Was macht das Modell am Ende des Trainings beim unüberwachten Lernen mit den Daten?
Es ordnet sie.
6) Worauf müssen wir beim unüberwachten Lernen achten? Die Komplexität des Modells.
7) Wofür kann unüberwachtes Lernen im Besonderen verwendet werden? Reduzierung der
Dimensionalität.


Quiz question 1/1

You have completed the Quiz!

Loading...

Transkript

Q6. Es gibt verschiedene Gruppierungen von Algorithmen des maschinellen Lernens, z. B. Regression, Klassifizierung und so weiter. Können Sie deren Bedeutung und den Unterschied zwischen ihnen erklären?

Es gibt verschiedene Möglichkeiten, Algorithmen des maschinellen Lernens zu gruppieren. Ich denke, die wichtigste hängt von der Art des mathematischen Modells ab. Insbesondere gibt es, wie bereits erwähnt, Modelle für überwachtes Training und Modelle für unbeaufsichtigtes Training. Zu den wichtigsten Modellen gehören neuronale Netze, Deep oder shallow, Support Vector Machines, Entscheidungsbäume und Ensemble-Techniken. Bei den unüberwachten Modellen können wir k-means, Hauptkomponentenanalyse, auto-assoziative neuronale Netze, selbstorganisierte Karten und so weiter nennen. 

Aber wie Ihre Frage zeigt, gibt es noch eine andere Möglichkeit, Algorithmen des maschinellen Lernens zu gruppieren, nämlich die Unterscheidung zwischen Regression und Klassifikation. Sobald unserem mathematischen Modell ein bestimmter Input zur Verfügung gestellt wird, hängt der Unterschied zwischen Regression und Klassifizierung hauptsächlich von der Art des Outputs ab, an dem wir interessiert sind. Im Falle der Klassifizierung ist die Ausgabe eine Bezeichnung, eine Klasse. Nehmen wir als Beispiel wieder eine Satellitenanwendung, bei der die Fernerkundung für die Meteorologie eingesetzt wird. Nehmen wir also an, wir müssen eine meteorologische Analyse durchführen und wollen entscheiden, welches Pixel in einem Bild des Himmels einem bewölkten Himmel und welches Pixel des Bildes einem klaren Himmel zuzuordnen ist, so dass das Endziel darin besteht, eine Karte zu erstellen, in der wir mit der blauen Farbe die klaren Himmelspixel und mit der grauen Farbe die bewölkten Pixel darstellen. Wir sagen in diesem Fall, dass wir eine Klassifizierungskarte erhalten wollen. Bei der Regression geht es im Wesentlichen darum, dass unser mathematisches Modell als Reaktion auf die Datenverarbeitung eine Zahl berechnet oder schätzt, und zwar im Allgemeinen eine reelle Zahl. Betrachten wir also dasselbe Szenario im Bereich der Meteorologie, so wollen wir anhand der Fernerkundungsdaten wissen, wie hoch die Luftfeuchtigkeit oder die Niederschlagsmenge (reale Zahlen) in einem bestimmten Gebiet ist. Es ist jedoch interessant zu sehen, wie ein Regressionsproblem in ein Klassifizierungsproblem umgewandelt werden kann. Dies geschieht, wenn ich sage: Innerhalb dieses Bereichs von Niederschlagswerten, also zwischen diesen beiden Zahlen, habe ich die Klasse “geringer Niederschlag”, in diesem anderen Intervall oder Bereich habe ich “mäßiger Niederschlag”, und so weiter. In diesem Fall ordne ich die Wertebereiche den Klassen zu.

Vielen Dank, Prof. Fabio Del Frate, wir wissen das wirklich zu schätzen. Das war ein deutlicher und interessanter Einblick in die Funktionen der Künstlichen Intelligenz und die entsprechenden Anwendungen.

Quiz question 1/8

Es gibt nur zwei verschiedene Algorithmen für maschinelles Lernen.




Quiz question 1/8

Algorithmen für neuronale Netze können tief oder oberflächig sein.




Quiz question 1/8

Support-Vektor-Maschinen und Entscheidungsbäume sind Algorithmen für überwachtes maschinelles Lernen.




Quiz question 1/8

Selbstorganisierende Karten, Mittelwert-Clustering und Hauptkomponentenanalyse sind Arten des überwachten maschinellen Lernens.




Quiz question 1/8

Der Hauptunterschied zwischen Klassifikation und Regression liegt in der Art der Ausgabe.




Quiz question 1/8

Die Ausgabe bei der Klassifizierung ist eine Bezeichnung/Klasse.




Quiz question 1/8

Die Regression schätzt eine reelle Zahl.




Quiz question 1/8

Wir können das Regressionsproblem nicht in ein Klassifikationsproblem übertragen.




Quiz question 1/1

You have completed the Quiz!

Loading...

The learning unit has not been completed

You have successfully completed the learning unit.