50 geriausių mašininio mokymosi interviu klausimų ir Atsakymai

Anonim

Atsisiųsti PDF

1) Kas yra mašininis mokymasis?

Mašininis mokymasis yra informatikos šaka, užsiimanti sistemos programavimu, siekiant automatiškai mokytis ir tobulėti patyrus. Pvz .: Robotai užprogramuoti taip, kad jie galėtų atlikti užduotį pagal duomenis, kuriuos surenka iš jutiklių. Jis automatiškai išmoksta programas iš duomenų.

2) Paminėkite skirtumą tarp duomenų gavybos ir mašininio mokymosi?

Mašininis mokymasis yra susijęs su algoritmų, kurie suteikia kompiuteriams galimybę mokytis be aiškaus programavimo, tyrinėjimo, projektavimo ir tobulinimo. Nors duomenų gavyba gali būti apibrėžta kaip procesas, kurio metu nestruktūrizuoti duomenys bando išgauti žinias ar nežinomus įdomius modelius. Šios proceso mašinos metu naudojami mokymosi algoritmai.

3) Kas yra „overfitting“ mašininiame mokyme?

Mašininio mokymosi metu, kai statistinis modelis apibūdina atsitiktinę klaidą ar triukšmą, o ne pagrindinį santykį, įvyksta „perpildymas“. Kai modelis yra pernelyg sudėtingas, paprastai pastebimas per didelis pritaikymas, nes jis turi per daug parametrų, palyginti su mokymo duomenų tipų skaičiumi. Modelis pasižymi prastu našumu, kuris buvo per didelis.

4) Kodėl įvyksta per didelis montavimas?

Pertvarkymo galimybė egzistuoja, nes modelio mokymui naudojami kriterijai nėra tokie patys kaip kriterijai, naudojami modelio efektyvumui įvertinti.

5) Kaip išvengti per didelio montavimo?

Naudojant daugybę duomenų, galima išvengti perteklinio įrengimo, perteklinis įrengimas įvyksta palyginti su tuo, kad turite mažą duomenų rinkinį ir bandote iš jo mokytis. Bet jei turite mažą duomenų bazę ir esate priversti pateikti tuo pagrįstą modelį. Tokioje situacijoje galite naudoti metodą, vadinamą kryžminiu patvirtinimu . Taikant šį metodą, duomenų rinkinys padalijamas į du skyrius - testavimo ir mokymo duomenų rinkinius. Testavimo duomenų rinkinys išbandys tik modelį, o mokymo duomenų rinkinyje duomenų taškai susidurs su modeliu.

Taikant šią techniką, modeliui paprastai pateikiamas žinomų duomenų, pagal kuriuos vykdomas mokymas (mokymo duomenų rinkinys), rinkinys ir nežinomų duomenų rinkinys, pagal kurį modelis yra išbandomas. Kryžminio patvirtinimo idėja yra apibrėžti duomenų rinkinį, kuris „išbandytų“ modelį mokymo etape.

6) Kas yra indukcinis mašininis mokymasis?

Indukcinis mašininis mokymasis apima mokymosi procesą pavyzdžiais, kai sistema iš stebimų atvejų rinkinio bando sukelti bendrą taisyklę.

7) Kokie penki populiarūs mašininio mokymosi algoritmai?

  • Sprendimų medžiai
  • Neuroniniai tinklai (sklidimas atgal)
  • Tikimybiniai tinklai
  • Artimiausias kaimynas
  • Palaikykite vektorines mašinas

8) Kokios yra skirtingos mašininio mokymosi algoritmo technikos?

Skirtingi mašininio mokymosi metodai yra

  • Vadovaujamasi mokymuisi
  • Neprižiūrimas mokymasis
  • Pusiau prižiūrimas mokymasis
  • Mokymasis sustiprinti
  • Perdavimas
  • Mokymasis mokytis

9) Kokie yra trys etapai, norint sukurti mašininio mokymosi hipotezes ar modelį?

  • Modelio pastatas
  • Modelio testavimas
  • Taikant modelį

10) Koks yra standartinis prižiūrimo mokymosi metodas?

Standartinis požiūris į prižiūrimą mokymąsi yra padalinti pavyzdį į mokymo rinkinį ir testą.

11) Kas yra „treniruočių rinkinys“ ir „testų rinkinys“?

Įvairiose informacijos mokslo srityse, tokiose kaip mašininis mokymasis, duomenų rinkinys naudojamas potencialiam nuspėjamam ryšiui, vadinamam „Mokymo rinkiniu“, atrasti. Mokymo rinkinys yra pavyzdžiai, pateikiami besimokančiajam, o „Test set“ yra naudojamas besimokančiojo sukurtų hipotezių tikslumui patikrinti, ir tai yra besimokančiojo sulaikytas pavyzdžių rinkinys. Treniruočių rinkinys skiriasi nuo testo rinkinio.

12) Išvardykite įvairius mašininio mokymosi metodus?

Skirtingi mašininio mokymosi metodai yra

  • Sąvoka Vs Klasifikacija Mokymasis
  • Simbolinis Vs statistinis mokymasis
  • Indukcinis Vs analitinis mokymasis

13) Kas nėra mašininis mokymasis?

  • Dirbtinis intelektas
  • Taisyklėmis pagrįstas išvada

14) Paaiškinkite, kokia yra „Neprižiūrimo mokymosi“ funkcija?

  • Raskite duomenų grupes
  • Raskite duomenų matmenis mažais matmenimis
  • Duomenyse raskite įdomių nuorodų
  • Įdomios koordinatės ir koreliacijos
  • Raskite naujų stebėjimų / duomenų bazės valymo

15) Paaiškinkite, kokia yra „prižiūrimo mokymosi“ funkcija?

  • Klasifikacijos
  • Kalbos atpažinimas
  • Regresija
  • Numatyti laiko eilutes
  • Anotuoti stygas

16) Kas yra nepriklausomas mašininis mokymasis nuo algoritmų?

Mašinų mokymasis, kai matematiniai pagrindai nepriklauso nuo konkretaus klasifikatoriaus ar mokymosi algoritmo, vadinami savarankišku mašininiu mokymuisi nuo algoritmų?

17) Kuo skiriasi dirbtinis mokymasis nuo mašininio mokymosi?

Algoritmų projektavimas ir tobulinimas pagal elgseną, pagrįstą empiriniais duomenimis, yra žinomas kaip mašininis mokymasis. Dirbtinis intelektas, be mašininio mokymosi, apima ir kitus aspektus, tokius kaip žinių vaizdavimas, natūralios kalbos apdorojimas, planavimas, robotika ir kt.

18) Kas yra mašininio mokymosi klasifikatorius?

Mašininio mokymosi klasifikatorius yra sistema, įvedanti atskirų ar tęstinių požymių reikšmių vektorių ir išvedanti vieną diskrečiąją vertę - klasę.

19) Kokie yra „Naive Bayes“ pranašumai?

Naiviųjų Bayes klasifikatorius suartės greičiau nei diskriminaciniai modeliai, pvz., Logistinė regresija, todėl jums reikia mažiau mokymo duomenų. Pagrindinis privalumas yra tas, kad jis negali išmokti sąveikos tarp funkcijų.

20) Kokiose srityse naudojamas modelio atpažinimas?

Rašto atpažinimas gali būti naudojamas

  • Kompiuterio vizija
  • Kalbos atpažinimas
  • Duomenų gavyba
  • Statistika
  • Neformalus paieška
  • Bioinformatika

21) Kas yra genetinis programavimas?

Genetinis programavimas yra viena iš dviejų mašininio mokymosi metodų. Modelis pagrįstas testavimu ir geriausio pasirinkimo pasirinkimu tarp rezultatų rinkinio.

22) Kas yra indukcinis loginis programavimas mašininiame mokyme?

Indukcinės logikos programavimas (ILP) yra mašininio mokymosi pogrupis, kuriame naudojamas loginis programavimas, atspindintis pagrindines žinias ir pavyzdžius.

23) Kas yra modelio pasirinkimas mokantis mašinoje?

Modelių pasirinkimas tarp skirtingų matematinių modelių, kurie naudojami tam pačiam duomenų rinkiniui apibūdinti, yra žinomas kaip modelio pasirinkimas. Modelio pasirinkimas taikomas statistikos, mašininio mokymosi ir duomenų gavybos srityse.

24) Kokie du metodai naudojami kontroliuojamam mokymuisi kalibruoti?

Du metodai, naudojami prognozuojant didelę prižiūrimo mokymosi tikimybę, yra

  • Plokštelių kalibravimas
  • Izotoninė regresija

Šie metodai skirti dvejetainiai klasifikacijai, ir tai nėra trivialu.

25) Kuris metodas dažnai naudojamas siekiant išvengti per didelio įrengimo?

Kai yra pakankamai duomenų, „izotoninė regresija“ naudojama norint išvengti per didelio pritaikymo.

26) Kuo skiriasi euristinė taisyklėms mokytis ir sprendimų medžių euristika?

Skirtumas yra tas, kad sprendimų medžių euristika vertina daugelio nesusijusių rinkinių vidutinę kokybę, o besimokantieji taisyklę vertina tik egzempliorių, kuriems taikoma kandidatų taisyklė, kokybę.

27) Kas yra „Perceptron“ mokantis mašinoje?

Mašinų mokymuose „Perceptron“ yra prižiūrimo įvesties klasifikavimo į vieną iš kelių galimų nebinarinių išėjimų algoritmas.

28) Paaiškinkite du Bajeso logikos programos komponentus?

Bajeso logikos programa susideda iš dviejų komponentų. Pirmasis komponentas yra logiškas; jis susideda iš Bajeso sakinių rinkinio, kuris atspindi kokybinę srities struktūrą. Antrasis komponentas yra kiekybinis, jame užkoduota kiekybinė informacija apie sritį.

29) Kas yra Bajeso tinklai (BN)?

Bajeso tinklas naudojamas grafiniam tikimybių santykio tarp kintamųjų rinkinio modeliui vaizduoti.

30) Kodėl egzemplioriais pagrįstas mokymosi algoritmas kartais vadinamas Lazy mokymosi algoritmu?

Egzemplioriais pagrįstas mokymosi algoritmas taip pat vadinamas Lazy mokymosi algoritmu, nes jie atideda įvedimo ar apibendrinimo procesą, kol bus atlikta klasifikacija.

31) Kokius du klasifikavimo metodus gali naudoti SVM („Support Vector Machine“)?

  • Dvejetainių klasifikatorių derinimas
  • Dvejetainio modifikavimas įtraukiant daugialypį mokymąsi

32) Kas yra ansamblio mokymasis?

Norint išspręsti tam tikrą skaičiavimo programą, strategiškai sukuriami ir derinami keli modeliai, tokie kaip klasifikatoriai ar ekspertai. Šis procesas yra žinomas kaip ansamblio mokymasis.

33) Kodėl naudojamas ansamblio mokymasis?

Ansamblio mokymasis naudojamas siekiant pagerinti modelio klasifikavimą, numatymą, funkcijų aproksimavimą ir kt.

34) Kada naudoti ansamblio mokymąsi?

Mokymasis ansambliais naudojamas, kai kuriate tikslesnius ir vienas nuo kito nepriklausomus komponentų klasifikatorius.

35) Kokios yra dvi ansamblio metodų paradigmos?

Dvi ansamblio metodų paradigmos yra

  • Nuoseklūs ansamblio metodai
  • Lygiagretaus ansamblio metodai

36) Koks yra bendras ansamblio metodo principas ir kas yra maišelio rinkimas ir skatinimas ansamblio metodu?

Bendras ansamblio metodo principas yra derinti kelių modelių, sukurtų su tam tikru mokymosi algoritmu, prognozes, siekiant pagerinti vieno modelio tvirtumą. Maišavimas yra metodas, padedantis patobulinti nestabilias vertinimo ar klasifikavimo schemas. Nors padidinimo metodas naudojamas nuosekliai, siekiant sumažinti kombinuoto modelio šališkumą. „Boosting“ ir „Bagging“ gali sumažinti klaidų skaičių, nes sumažėja dispersijos trukmė.

37) Kas yra klasifikavimo klaidos šališkumas-dispersija skaidant ansamblio metodą?

Laukiamą mokymosi algoritmo paklaidą galima išskaidyti į šališkumą ir dispersiją. Poslinkio terminas matuoja, kaip tiksliai mokymosi algoritmo sukurtas vidutinis klasifikatorius atitinka tikslinę funkciją. Dispersijos terminas matuoja, kiek svyruoja mokymosi algoritmo prognozė skirtingiems mokymo rinkiniams.

38) Kas yra papildomas mokymosi algoritmas kartu?

Prieauginis mokymosi metodas yra algoritmo galimybė mokytis iš naujų duomenų, kurie gali būti prieinami po to, kai klasifikatorius jau sugeneruotas iš jau turimo duomenų rinkinio.

39) Kam naudojami PCA, KPCA ir ICA?

PCA (pagrindinių komponentų analizė), KPCA (branduoliu pagrįsta pagrindinių komponentų analizė) ir ICA (nepriklausomų komponentų analizė) yra svarbios funkcijų išskyrimo technologijos, naudojamos mažinant matmenis.

40) Kas yra mašininio mokymosi dimensijų mažinimas?

Mašinų mokymuose ir statistikoje dimensijų mažinimas yra atsitiktinių kintamųjų skaičiaus sumažinimo procesas, kurį galima apsvarstyti, ir jį galima suskirstyti į funkcijų pasirinkimą ir funkcijų išskyrimą.

41) Kas yra atraminių vektorių mašinos?

Palaikomosios vektorinės mašinos yra prižiūrimi mokymosi algoritmai, naudojami klasifikacijai ir regresijos analizei.

42) Kokie yra santykinio vertinimo metodų komponentai?

Svarbūs santykinių vertinimo metodų komponentai yra

  • Duomenų gavimas
  • Pagrindinės tiesos įgijimas
  • Kryžminio patvirtinimo technika
  • Užklausos tipas
  • Įvertinimo metrika
  • Reikšmingumo testas

43) Kokie yra skirtingi nuosekliojo mokymosi metodai?

Skirtingi prižiūrimų mokymosi problemų sprendimo būdai yra

  • Stumdomų langų metodai
  • Pasikartojantys stumdomi langai
  • „Hidden Markow“ modeliai
  • Maksimalūs entropijos „Markow“ modeliai
  • Sąlyginiai atsitiktiniai laukai
  • Grafikų transformatorių tinklai

44) Kokios yra robotikos ir informacijos apdorojimo sritys, kuriose kyla nuoseklios prognozavimo problemos?

Robotikos ir informacijos apdorojimo sritys, kuriose kyla nuoseklios prognozavimo problemos, yra

  • Mokymasis imitacija
  • Struktūrizuotas prognozavimas
  • Mokymasis pagal modelį

45) Kas yra paketinis statistinis mokymasis?

Statistiniai mokymosi metodai leidžia išmokti funkciją arba numatiklį iš stebimų duomenų, kurie gali prognozuoti nematytus ar būsimus duomenis. Šie metodai, remdamiesi statistine prielaida apie duomenų generavimo procesą, suteikia garantijas, kad išmoktas prognozuotojas veikia būsimus nematytus duomenis.

46) Kas yra PAC mokymasis?

PAC (tikriausiai apytiksliai teisingas) mokymasis yra mokymosi sistema, kuri buvo sukurta analizuojant mokymosi algoritmus ir jų statistinį efektyvumą.

47) Kokias skirtingas kategorijas galite suskirstyti į sekos mokymosi procesą?

  • Sekos prognozavimas
  • Sekos generavimas
  • Eilės atpažinimas
  • Nuoseklus sprendimas

48) Kas yra sekos mokymasis?

Sekos mokymasis yra logiško mokymo ir mokymosi metodas.

49) Kokios yra dvi mašininio mokymosi technikos?

Dvi mašininio mokymosi technikos yra

  • Genetinis programavimas
  • Indukcinis mokymasis
50) Pateikite populiarią mašininio mokymosi programą, kurią matote kasdien?

Rekomendacijų variklis, kurį įdiegė pagrindinės el. Prekybos svetainės, naudoja mašininį mokymąsi.