SL / EN / DE / IT / EL 

AIAE » E-LEARNING » INTERVJU 7

Strojno učenje

Naslednji izseki intervjuja, ki ga je opravil Fabio Del Frate, zajemajo opredelitev umetne inteligence, najpomembnejše vidike strojnega učenja, razlage o globokem učenju, teme nadzorovanega in nenadzorovanega učenja in njegovo povezavo z umetno inteligenco ter različne vrste strojnega učenja.

prepis

Fabio Del Frate je na Univerzi Tor Vergata v Rimu magistriral iz elektronike (1992) in doktoriral iz računalništva (1997). V letih 1995-1996 je bil gostujoči znanstvenik na Tehnološkem inštitutu v Massachusettsu, v letih 1998-1999 pa je delal na Evropski vesoljski agenciji. Nato se je pridružil rimski univerzi “Tor Vergata”, kjer je trenutno izredni profesor za daljinsko zaznavanje in uporabni elektromagnetizem v različnih magistrskih in doktorskih programih. Na teh področjih je predaval na več evropskih univerzah ter bil glavni raziskovalec/vodja projekta v več projektih, ki jih financirata Evropska vesoljska agencija (ESA) in Italijanska vesoljska agencija (ASI), pri čemer je vodil raziskovalne dejavnosti na področju uporabe umetne inteligence pri satelitskih podatkih za opazovanje Zemlje (v nadaljevanju “OZ”).

Quiz question 1/8

Intervjuvanec Fabio Del Frate je doktor računalništva, trenutno zaposlen kot profesor na rimski univerzi Tor Vergata. Predava o daljinskem zaznavanju in elektromagnetiki. V evropskih in italijanskih vesoljskih agencijah je vodil raziskovalno dejavnost na področju uporabe umetne inteligence pri satelitskih podatkih za opazovanje Zemlje.


Quiz question 1/1

You have completed the Quiz!

Loading...

prepis

Q1. Prof. Del Frate, začnimo z osnovami. Kaj je umetna inteligenca?

Za kratko razlago, kaj je umetna inteligenca, pogosto rad citiram enega od očetov umetne inteligence, profesorja Nilsa Johna Nilssona. Po njegovem mnenju je “umetna inteligenca dejavnost, ki je namenjena temu, da stroji postanejo inteligentni, inteligenca pa je tista lastnost, ki entiteti omogoča ustrezno in predvidljivo delovanje v njenem okolju.” 

Torej lahko rečemo, da strojem in računalnikom zagotavljamo več stopenj svobode. Od njih zahtevamo, da sprejemajo lastne odločitve, da presežejo to, kar se je dogajalo pri tradicionalnem računalniškem programiranju, tj. da v bistvu izvajajo zaporedje, četudi dolgih in zapletenih ukaznih vrstic. 

Kako to uresničujemo? V bistvu gre za to, da stroje oskrbimo s podatki in jim omogočimo, da med temi podatki iščejo povezave, četudi zelo subtilne. S tema dvema elementoma: podatki in modeli za razlago, umetna inteligenca razvija in gradi lastno znanje, lastne izkušnje.

Menim, da bi bil v tem kontekstu lahko zanimiv tudi zgodovinski pogled, tako da bi nas morda zanimalo, kdaj so bili predlagani prvi algoritmi umetne inteligence in strojnega učenja. Odgovori so lahko različni, vendar menim, da se moramo za iskanje korenin umetne inteligence vrniti v leto 1943, ko sta Walter Pitts in Warren McCulloch v znanstvenem članku “A logical calculus of the ideas immanent in nervous activity” predstavila prvi matematični model nevronskih mrež. V tem članku je en sam nevron prvič predstavljen kot osnovna nelinearna procesna enota in predpostavljeno je, da je povezan z drugimi nevroni. Z drugimi besedami, prva groba, a učinkovita matematična predstavitev možganov.

Vprašanje je: “Ali je vse to nevarno?” Mislim, da je odgovor: “Da, morda je, vendar prav toliko, kot bi bilo ali je bilo vsakič, ko nas navduši nova tehnologija in ji želimo omogočiti razvoj.”. Pravzaprav je vprašanje razvoja “varne” umetne inteligence vsekakor v središču pozornosti skupnosti znanstvenikov in raziskovalcev. Ključna točka je, da mora človek vedno delovati kot nadzornik. Pravila, smernice, predvsem pa podatke, na katerih stroj, kot smo že rekli, gradi svoje znanje in na katere se bo opiral pri sprejemanju odločitev, zagotavljajo človeški strokovnjaki, tako da se stroj obnaša z določeno stopnjo avtonomije, vendar znotraj dobro določenega igrišča, meje tega igrišča pa določajo ljudje.

Quiz question 1/8

Umetna inteligenca daje strojem in računalnikom več stopenj svobode, kar pomeni, da se od strojev zahteva, da presežejo tradicionalno računalniško programiranje. Da bi stroji lahko prepoznali vzorce, odnose in zgradili svoje lastno znanje, jim je potrebno zagotoviti podatke. Pomembni elementi za razlago rezultatov v umetni inteligenci so podatki in modeli. UI ima pozitivne in navdihujoče rezultate, lahko pa se izkaže tudi za nevarno. Zato se morajo raziskovalci osredotočiti na varen razvoj umetne inteligence. Glavno načelo mora biti, da je človek vedno v vlogi nadzornika pravil in smernic, predvsem pa podatkov.


Quiz question 1/1

You have completed the Quiz!

Loading...

prepis

Q2. Kaj je strojno učenje?

No, rekel bi, da je strojno učenje verjetno trenutno najbolj uporabljen tehnični postopek za ustvarjanje umetne inteligence v stroju. Videli smo že, da obstajata dva glavna akterja: podatki in model, natančneje matematični model. Izziv je poiskati parametre matematičnega modela, da bo lahko predstavljal odnose med podatki. Vse je odvisno od vzpostavitve procesa učenja, ki temelji na samih podatkih. Imamo lahko različne vrste modelov, na primer nevronske mreže ali podporne vektorske stroje, in posledično različne algoritme za učenje modela. Vendar je končni cilj vedno enak: pridobiti znanje iz učnih podatkov, ki se uporabljajo v procesu učenja, in to pridobljeno znanje uporabiti za nove podatke. Mimogrede, zelo pomembno je oceniti, kako dobro je delovanje modela na novih podatkih, tj. podatkih, ki niso bili upoštevani v fazi usposabljanja. To nam pove, koliko je model uporaben v resničnem svetu in koliko je sposoben posploševanja. 

V vsakem primeru sta kakovost in količina podatkov, uporabljenih v fazi učenja, ključna dejavnika za uspešno delovanje. Zlasti količina podatkov mora biti statistično pomembna, da zagotovi ustrezne značilnosti pojava, ki ga želimo raziskati. Drugo pomembno ključno vprašanje je odločitev, kako zapleten naj bo naš matematični model. Resna težava bi bila, če bi za iskanje zelo subtilnih povezav med podatki izbrali preveč preprost model, včasih pa je lahko, če so pravila, na katerih temeljijo podatki, manj zapletena, tudi struktura modela lažja…. manj je več, kot pravimo, pri čemer se manj nanaša na število parametrov, značilnih za model. 

Mimogrede, zapletenost modela je povezana tudi s časom, ki ga potrebujemo za učenje modela, in s količino podatkov, ki so potrebni za izvedbo celotnega postopka učenja.

Quiz question 1/8

Kaj je strojno učenje?





Quiz question 1/8

Kaj počne strojno učenje?





Quiz question 1/8

Kakšni so rezultati različnih vrst modelov?





Quiz question 1/8

Zakaj je pomembno oceniti uspešnost modela na novih podatkih?





Quiz question 1/8

Kateri so ključni dejavniki za uspešno delovanje umetne inteligence?





Quiz question 1/1

You have completed the Quiz!

Loading...

prepis

Q3. Umetna inteligenca in strojno učenje se pogosto povezujeta z izrazi, kot je “globoko učenje”. Kaj je globoko učenje?

Lahko rečemo, da ima beseda globoko v besedni zvezi globoko učenje dva različna pomena, čeprav sta zelo povezana. Eden je povezan s hierarhično predstavitvijo scenarija, ki nas zanima.  Če je scenarij na primer prepoznavanje predmetov, je beseda globoko povezana z več stopnjami v procesu prepoznavanja predmeta: kot žival, kot pes, kot dalmatinski pes.

Te večstopenjske predstavitve najdejo ujemanje z različnimi plastmi matematičnega modela, ki ga želimo uporabiti za predstavitev, zato se, če poenostavim, plast matematičnega modela osredotoča na žival, plast na psa, plast na vrsto psa. To se zgodi pri globoki nevronski mreži. Nevronske mreže so najpogosteje uporabljeni modeli za globoko učenje. Tu imamo torej drugi pomen, ki je topološki pomen in obravnava število slojev arhitekture. Tako imamo globoke nevronske mreže, kot so konvolucijske nevronske mreže, ki vključujejo veliko slojev obdelave, nasproti plitvim nevronskim mrežam, kot so običajni večslojni perceptroni, ki so nevronske mreže z omejenim številom slojev. Če se vrnemo k temu, kar smo povedali o zapletenosti modelov, so arhitekture globokega učenja nedvomno zelo zapletene, kar pomeni, da je potrebna velika računska obremenitev in da so na voljo ogromne količine učnih podatkov. Potreba po zelo velikem številu podatkov je dejansko spodbudila razvoj novih tehnik za tako imenovano “povečevanje podatkov”, ki vključuje povečanje števila podatkov, začenši z bolj omejenim naborom podatkov.

Quiz question 1/8

da
ne
 

Ali lahko rečemo, da ima globoko učenje dva pomena?


Ali je globoko učenje odgovorno za več faz v procesu prepoznavanja predmetov?


Ali matematični model vsebuje različne plasti znanja?


Ali je res, da nevronske mreže niso najbolj uporabljene mreže za globoko učenje?


Ali je eden od pomenov globokega učenja topološki pomen?


Ali so lahko nevronske mreže plitve ali konvolucijske?


Ali je globoko učenje nekompleksna strategija?



Quiz question 1/1

You have completed the Quiz!

Loading...

prepis

Q4. Kaj je nadzorovano učenje? Ali lahko navedete nekaj primerov aplikacij, ki ga uporabljajo?

Rekel bi, da je nadzorovano učenje danes najpogostejša podpanoga strojnega učenja. Nadzorovano učenje je oblika učenja, pri kateri je za dani vhodni podatek na voljo “pravi” rezultat, ki ga je mogoče naučiti model. Z drugimi besedami, kot učitelj ali nadzornik za vsak vhod, ki ga dobi model, vemo, kakšen mora biti izhod modela, in želimo, da model vključi splošno pravilo. Običajno se to zgodi z minimiziranjem tako imenovane napake ali stroškovne funkcije, ki predstavlja razdaljo med želenimi izhodnimi vrednostmi in dejanskimi izhodnimi vrednostmi, ki jih je model ustvaril v fazi učenja. Dejansko lahko domnevamo, da je nadzorovano učenje uspešno, če je končna splošna napaka v nizu primerov, ki niso bili uporabljeni v fazi učenja, pod vnaprej določenim pragom. Faza učenja je lahko zelo dolga, ko pa jo ustrezno zaključimo, imamo za obdelavo novih podatkov zelo močno orodje, ki v bistvu deluje v realnem času. Nadzorovano učenje je lahko uporabno na številnih področjih. Precej obsežna uporaba se nanaša na klasifikacijo slik. V tem primeru so pravi podatki podatki, ki so označeni s človeško interpretacijo slik. Klasifikacija se lahko izvaja na različnih ravneh: na ravni pikslov, zaplat, objektov. Raven klasifikacije je vodilo pri izbiri vhodnih podatkov, ki jih želimo dati modelu. Natančneje, nadzorovano učenje se zdaj zelo pogosto uporablja pri opazovanju Zemlje, kjer želimo oceniti bio-geofizikalne parametre iz podatkov, zbranih s sateliti. Zanimiv primer je natančno kmetovanje v kmetijstvu. Če želimo spremljati biomaso pridelka, da bi optimizirali količino gnojil, ki jih je treba uporabiti, lahko uporabimo satelitske meritve tega pridelka. Vendar pa zlasti v mikrovalovnem območju elektromagnetnega spektra pridobivanje parametrov vegetacije ni trivialno, saj je meritev recimo onesnažena tudi z zemljo pod njo, zato so nadzorovani modeli umetne inteligence vsekakor lahko eno od orodij, ki nam omogočajo, da pridobimo tisti del informacij v meritvi, ki je bolj povezan z vegetacijo, in zavržemo tiste, ki so bolj pogojene z zemljo.

Quiz question 1/8

Nadzorovano učenje ni tako pogosta podpanoga strojnega učenja.




Quiz question 1/8

Napaka predstavlja razdaljo med odločeno in dejansko izhodno vrednostjo.




Quiz question 1/8

Faza usposabljanja pri nadzorovanem učenju je kratka.




Quiz question 1/8

Končni rezultat nadzorovanega učenja je zelo močan, saj lahko deluje na novih podatkih v realnem času.




Quiz question 1/8

Klasifikacija slik in odkrivanje predmetov sta primera nadzorovanega učenja.




Quiz question 1/8

Nadzorovano učenje se redko uporablja pri opazovanju Zemlje.




Quiz question 1/8

Biofizikalni parametri iz podatkov, zbranih s sateliti, so vključeni v nadzorovano učenje, ko se izvajajo opazovanja Zemlje.




Quiz question 1/1

You have completed the Quiz!

Loading...

prepis

Q5. Kaj je nenadzorovano učenje? Ali lahko navedete nekaj primerov aplikacij, ki ga uporabljajo?

Glavni namen nenadzorovanega učenja je poiskati korelacije med podatki, da bi jih pregrupirali v podobne kategorije. Pri nenadzorovanem učenju ne potrebujemo zunanjih operacij označevanja ali učitelja, ki zagotavlja ciljne vrednosti. Celotno usposabljanje matematičnega modela temelji le na obstoječih izvirnih podatkih, zato je v tem primeru glede na nadzorovano učenje za postopek značilna višja stopnja avtomatizacije. Lahko rečemo, da na koncu usposabljanja model organizira notranjo predstavitev podatkov, zaradi česar so ti bolj razumljivi in jih je lažje razlagati. Tako kot druge paradigme učenja se lahko tudi nenadzorovano učenje izvaja s pomočjo različnih matematičnih modelov. Tudi v tem primeru moramo vedno paziti na kompleksnost modela, ki mora odražati kompleksnost notranje predstavitve, ki jo iščemo. V opazovanju Zemlje in na drugih področjih se lahko nenadzorovano učenje uporablja za zmanjševanje dimenzionalnosti. Če upoštevamo hiperspektralno meritev, ugotovimo, da so lahko zbrane informacije porazdeljene po več sto valovnih dolžinah. V številnih primerih bi bilo zaželeno, da se takšne informacije ali najpomembnejše od njih stisnejo v manjše število komponent. To je mogoče doseči s tehnikami nenadzorovanega učenja.

Quiz question 1/8

  1. Kaj iščemo v podatkih z nenadzorovanim učenjem? Korelacijo oz. povezanost.
  2. Na podlagi česa se pri nenadzorovanem učenju izvede pregrupiranje podatkov? Na podlagi podobnosti.
  3. Ali so pri nenadzorovanem učenju potrebne zunanje operacije označevanja? Ne.
  4. Na čem temelji usposabljanje matematičnih modelov? Na izvirnih podatkih.
  5. Kaj model naredi s podatki ob koncu usposabljanja pri nenadzorovanem učenju? Model podatke organizira.
  6. Na kaj moramo biti pozorni pri nenadzorovanem učenju? Na kompleksnost modela.
  7. Za kaj se lahko uporablja nenadzorovano učenje? Za zmanjšanje dimenzionalnosti.

Quiz question 1/1

You have completed the Quiz!

Loading...

prepis

Q6. Obstajajo različne skupine algoritmov strojnega učenja, npr. regresija, klasifikacija itd. Ali lahko pojasnite njihov pomen in razlike med njimi?

Obstajajo različne možnosti združevanja algoritmov strojnega učenja v skupine. Menim, da je glavna odvisna od vrste matematičnega modela. Natančneje, kot je bilo že omenjeno, imamo modele za nadzorovano usposabljanje in modele za nenadzorovano usposabljanje. Kar zadeva prve, so med najpomembnejšimi nevronske mreže, globoke ali plitve, podporni vektorski stroji, odločitvena drevesa, združitvene tehnike. Pri nenadzorovanih modelih lahko omenimo k-means, analizo glavnih komponent, avtoasociativne nevronske mreže, samoorganizirane zemljevide itd. 

Kot je bilo poudarjeno v vašem vprašanju, pa se druga možnost za razvrščanje algoritmov strojnega učenja nanaša na razlikovanje med regresijo in klasifikacijo. Ko našemu matematičnemu modelu zagotovimo določen vhodni podatek, je razlika med regresijo in klasifikacijo odvisna predvsem od vrste rezultata, ki nas zanima. V primeru klasifikacije bo izhodni rezultat oznaka, razred. Na primer, ponovno si oglejmo satelitsko aplikacijo, kjer se daljinsko zaznavanje uporablja za meteorologijo. Predpostavimo torej, da moramo opraviti meteorološko analizo in se želimo odločiti, katero piko na sliki neba je treba povezati z oblačnim nebom in katero piko na sliki z jasnim nebom, tako da je končni namen izdelati zemljevid, na katerem z modro barvo predstavimo pike jasnega neba in s sivo barvo pike oblačnega neba. V tem primeru pravimo, da želimo dobiti klasifikacijsko karto. Pri regresiji v bistvu želimo, da naš matematični model kot odziv na obdelavo podatkov izračuna ali oceni neko število, bolj splošno realne vrednosti. Če torej upoštevamo isti scenarij na področju meteorologije, želimo iz podatkov daljinskega zaznavanja izvedeti, kolikšna je vlažnost ali količina padavin, realna števila, na določenem območju. Vendar je zanimivo opaziti, kako je mogoče problem regresije pretvoriti v problem klasifikacije. To se zgodi, če rečem: v tem razponu vrednosti padavin, torej med tema dvema številoma, imam razred “malo padavin”, v tem drugem intervalu ali razponu imam “zmerne padavine” in tako naprej. V tem primeru razpone vrednosti prikažem v razrede.

Zahvaljujemo se vam, profesor Fabio Del Frate, res smo vam hvaležni. To je bil jasen in zanimiv pogovor o značilnosti umetne inteligence in ustreznih aplikacij.

Quiz question 1/8

Obstajata le dva različna algoritma strojnega učenja.




Quiz question 1/8

Algoritmi nevronskih mrež so lahko globoki ali plitvi.




Quiz question 1/8

Podporni vektorski stroji in odločitvena drevesa so algoritmi za nadzorovano strojno učenje.




Quiz question 1/8

Samoorganizacijski zemljevidi, grozdenje in analiza glavnih komponent, so vrste nadzorovanega strojnega učenja.




Quiz question 1/8

Glavna razlika med klasifikacijo in regresijo je v vrsti rezultatov.




Quiz question 1/8

Rezultat klasifikacije je oznaka/razred.




Quiz question 1/8

Regresija ocenjuje realno število.




Quiz question 1/8

Regresijskega problema ne moremo prenesti v klasifikacijski problem.




Quiz question 1/1

You have completed the Quiz!

Loading...

The learning unit has not been completed

You have successfully completed the learning unit.