Prižiūrimas ir neprižiūrimas mokymasis: pagrindiniai skirtumai

Turinys:

Anonim

Kas yra prižiūrimas mašininis mokymasis?

Mokydamiesi prižiūrint, mokote mašiną naudodami duomenis, kurie yra gerai paženklinti . Tai reiškia, kad kai kurie duomenys jau pažymėti teisingu atsakymu. Tai galima palyginti su mokymusi, kuris vyksta dalyvaujant vadovui ar mokytojui.

Prižiūrimas mokymosi algoritmas mokosi iš paženklintų mokymo duomenų, padeda nuspėti nenumatytų duomenų rezultatus. Norint sėkmingai sukurti, keisti mastelį ir įdiegti tikslią prižiūrimą mašininį mokymąsi Duomenų mokslo modelis reikalauja laiko ir techninės patirties iš aukštos kvalifikacijos duomenų mokslininkų komandos. Be to, duomenų mokslininkas turi atstatyti modelius, kad įsitikintų, jog pateiktos įžvalgos išlieka teisingos, kol jos duomenys nepasikeis.

Šioje pamokoje sužinosite

  • Kas yra prižiūrimas mašininis mokymasis?
  • Kas yra neprižiūrimas mokymasis?
  • Kodėl verta mokytis?
  • Kodėl mokomasi be priežiūros?
  • Kaip veikia prižiūrimas mokymasis?
  • Kaip veikia neprižiūrimas mokymasis?
  • Prižiūrimų mašininio mokymosi metodų tipai
  • Neprižiūrimų mašininio mokymosi metodų tipai
  • Prižiūrimas ir neprižiūrimas mokymasis

Kas yra neprižiūrimas mokymasis?

Neprižiūrimas mokymasis yra mašininio mokymosi technika, kai nereikia prižiūrėti modelio. Vietoj to, jūs turite leisti modeliui veikti savarankiškai, kad atrastumėte informaciją. Jis daugiausia susijęs su nepažymėtais duomenimis.

Neprižiūrimi mokymosi algoritmai leidžia atlikti sudėtingesnes apdorojimo užduotis, palyginti su prižiūrimu mokymu. Nors neprižiūrimas mokymasis gali būti labiau nenuspėjamas, palyginti su kitais natūralaus mokymosi giluminio mokymosi ir sustiprinimo mokymosi metodais.

Kodėl verta mokytis?

  • Prižiūrimas mokymasis leidžia rinkti duomenis arba kurti duomenis iš ankstesnės patirties.
  • Naudodamiesi patirtimi, galite optimizuoti našumo kriterijus
  • Prižiūrimas mašininis mokymasis padeda išspręsti įvairias realaus pasaulio skaičiavimo problemas.

Kodėl mokomasi be priežiūros?

Čia pateikiamos pagrindinės neprižiūrimo mokymosi naudojimo priežastys:

  • Neprižiūrimas mašininis mokymasis randa visokių nežinomų duomenų šablonų.
  • Neprižiūrimi metodai padeda rasti funkcijas, kurios gali būti naudingos skirstant į kategorijas.
  • Jis vyksta realiuoju laiku, todėl visi įvesties duomenys turi būti analizuojami ir pažymimi besimokančiųjų akivaizdoje.
  • Nepaženklintus duomenis iš kompiuterio gauti lengviau nei su etiketėmis, kuriems reikia rankinio įsikišimo.

Kaip veikia prižiūrimas mokymasis?

Pavyzdžiui, norite išmokyti mašiną, kuri padėtų nuspėti, kiek laiko užtruksite važiuodami namo iš savo darbo vietos. Pradėkite nuo etikečių duomenų rinkinio sukūrimo. Šie duomenys apima

  • Oro sąlygos
  • Dienos laikas
  • Atostogos

Visa ši informacija yra jūsų įvestis. Rezultatas yra laikas, kurio prireikė grįžti namo tą konkrečią dieną.

Instinktyviai žinote, kad jei lauke lyja, tada jums reikės ilgiau važiuoti namo. Bet mašinai reikia duomenų ir statistikos.

Pažiūrėkime, kaip galite sukurti šio pavyzdžio prižiūrimą mokymosi modelį, kuris padėtų vartotojui nustatyti kelionės į darbą ir atgal laiką. Pirmas dalykas, kurį jums reikia sukurti, yra mokymo duomenų rinkinys. Šiame treniruočių rinkinyje bus nurodytas bendras kasdienės kelionės į darbą ir atgal laikas bei atitinkami veiksniai, pvz., Oras, laikas ir kt. Remiantis šiuo treniruočių rinkiniu, jūsų mašina gali pastebėti, kad yra tiesioginis ryšys tarp lietaus kiekio ir laiko, kurio prireiks namo.

Taigi, ji įsitikina, kad kuo daugiau lyja, tuo ilgiau važiuosite, kad grįžtumėte į savo namus. Tai taip pat gali pamatyti ryšį tarp laiko, kurį paliekate iš darbo, ir laiko, kurį praleisite kelyje.

Kuo arčiau 18 val., Tuo ilgiau užtruksite namo. Jūsų mašina gali rasti tam tikrų ryšių su jūsų pažymėtais duomenimis.

Tai yra jūsų duomenų modelio pradžia. Tai pradeda daryti įtaką lietaus įtakai žmonių vairavimui. Taip pat pradeda matyti, kad tam tikru paros metu keliauja daugiau žmonių.

Kaip veikia neprižiūrimas mokymasis?

Paimkime kūdikio ir jos šeimos šuns atvejį.

Ji pažįsta ir atpažįsta šį šunį. Po kelių savaičių šeimos draugas atsiveda šunį ir bando žaisti su kūdikiu.

Kūdikis anksčiau nematė šio šuns. Bet jis atpažįsta daugybę bruožų (2 ausys, akys, vaikščiojimas ant 4 kojų) yra kaip jos augintinis. Ji nustato naują gyvūną kaip šunį. Tai yra neprižiūrimas mokymasis, kai jūsų nemoko, bet mokotės iš duomenų (šiuo atveju duomenų apie šunį). Jei tai būtų buvę prižiūrimas, šeimos draugas būtų pasakęs kūdikiui, kad tai šuo.

Prižiūrimų mašininio mokymosi metodų tipai

Regresija:

Regresijos technika, naudojant treniruotės duomenis, numato vieną išėjimo vertę.

Pavyzdys: naudodamiesi regresija galite numatyti namo kainą iš mokymo duomenų. Įvesties kintamieji bus vietovė, namo dydis ir kt.

Klasifikacija:

Klasifikavimas reiškia produkcijos grupavimą klasės viduje. Jei algoritmas bando žymėti įvestį į dvi skirtingas klases, tai vadinama dvejetainiu klasifikavimu. Pasirinkimas tarp daugiau nei dviejų klasių vadinamas daugiasluoksne klasifikacija.

Pavyzdys : nustatoma, ar kas nors neįvykdys paskolos.

Stipriosios pusės: išėjimai visada turi tikimybinę interpretaciją, o algoritmą galima reguliuoti, kad būtų išvengta per didelio pritaikymo.

Silpnybės : Logistinė regresija gali būti neveiksminga, kai yra kelios ar netiesinės sprendimo ribos. Šis metodas nėra lankstus, todėl neužfiksuoja sudėtingesnių santykių.

Neprižiūrimų mašininio mokymosi metodų tipai

Neprižiūrimos mokymosi problemos toliau grupuojamos į grupes ir asociacijos problemas.

Grupavimas

Klasteriai yra svarbi sąvoka, kai kalbama apie neprižiūrimą mokymąsi. Daugiausia kalbama apie struktūros ar modelio paiešką nekategorizuotų duomenų rinkinyje. Grupavimo algoritmai apdoros jūsų duomenis ir ras natūralius klasterius (grupes), jei jų yra duomenyse. Taip pat galite modifikuoti, kiek klasterių turėtų identifikuoti jūsų algoritmai. Tai leidžia koreguoti šių grupių detalumą.

Asociacija

Asociacijos taisyklės leidžia jums nustatyti duomenų objektų asociacijas didelėse duomenų bazėse. Ši neprižiūrima technika skirta atrasti įdomius ryšius tarp kintamųjų didelėse duomenų bazėse. Pavyzdžiui, žmonės, kurie perka naujus namus, greičiausiai perka naujus baldus.

Kiti pavyzdžiai:

  • Vėžiu sergančių pacientų pogrupis, sugrupuotas pagal jų genų ekspresijos matavimus
  • Pirkėjų grupės pagal jų naršymo ir pirkimo istoriją
  • Filmų grupė pagal filmų žiūrovų suteiktą įvertinimą

Prižiūrimas ir neprižiūrimas mokymasis

Parametrai Prižiūrima mašininio mokymosi technika Neprižiūrima mašininio mokymosi technika
Procesas Pagal prižiūrimą mokymosi modelį bus pateikti įvesties ir išvesties kintamieji. Neprižiūrimo mokymosi modelyje bus pateikti tik įvesties duomenys
Įvesties duomenys Algoritmai mokomi naudojant paženklintus duomenis. Algoritmai naudojami prieš duomenis, kurie nėra pažymėti etiketėmis
Naudojami algoritmai Palaikykite vektorinę mašiną, neuronų tinklą, tiesinę ir logistinę regresiją, atsitiktinius miškus ir klasifikavimo medžius. Neprižiūrimus algoritmus galima suskirstyti į skirtingas kategorijas: pvz., „Klasterio“ algoritmus, „K“ reikšmę, „hierarchinį“ grupavimą ir kt.
Skaičiavimo sudėtingumas Prižiūrimas mokymasis yra paprastesnis metodas. Neprižiūrimas mokymasis yra sudėtingas skaičiavimais
Duomenų naudojimas Prižiūrimo mokymosi modelis naudoja mokymo duomenis, kad sužinotų ryšį tarp įvesties ir išvesties. Neprižiūrimas mokymasis nenaudoja išvesties duomenų.
Rezultatų tikslumas Labai tikslus ir patikimas metodas. Mažiau tikslus ir patikimas metodas.
Mokymasis realiuoju laiku Mokymosi metodas vyksta neprisijungus. Mokymosi metodas vyksta realiuoju laiku.
Klasių skaičius Klasių skaičius yra žinomas. Klasių skaičius nežinomas.
Pagrindinis trūkumas Didžiųjų duomenų klasifikavimas gali būti tikras iššūkis prižiūrint mokymąsi. Negalite gauti tikslios informacijos apie duomenų rūšiavimą, o išvestis kaip duomenys, naudojami neprižiūrint mokymosi, yra paženklinti ir nežinomi.

Santrauka

  • Mokydamiesi prižiūrint, mokote mašiną naudodami duomenis, kurie yra gerai paženklinti.
  • Neprižiūrimas mokymasis yra mašininio mokymosi technika, kai nereikia prižiūrėti modelio.
  • Prižiūrimas mokymasis leidžia rinkti duomenis arba kurti duomenis iš ankstesnės patirties.
  • Neprižiūrimas mašininis mokymasis padeda surasti visokius nežinomus duomenų modelius.
  • Pavyzdžiui, galėsite nustatyti laiką, per kurį grįžtate, atsižvelgdami į oro sąlygas, dienos laiką ir atostogas.
  • Pavyzdžiui, kūdikis gali atpažinti kitus šunis, remdamasis praeities prižiūrimais mokymais.
  • Regresija ir klasifikacija yra dviejų rūšių prižiūrimi mašininio mokymosi metodai.
  • Klasteriai ir asociacija yra dvi neprižiūrimo mokymosi rūšys.
  • Prižiūrimo mokymosi modelyje bus pateikti įvesties ir išvesties kintamieji, o naudojant neprižiūrimą mokymosi modelį, bus pateikti tik įvesties duomenys