30 geriausių „Hbase“ interviu klausimų ir Atsakymai

Anonim

Atsisiųsti PDF

Toliau pateikiami dažnai užduodami klausimai interviu naujokams ir patyrusiems „HBase“ kūrėjams.

1) Paaiškinkite, kas yra „Hbase“?

„Hbase“ yra į stulpelius orientuota duomenų bazių valdymo sistema, veikianti ant HDFS („Hadoop Distribute File System“). „Hbase“ nėra reliacinė duomenų saugykla ir ji nepalaiko struktūrizuotos užklausos kalbos, tokios kaip SQL.

„Hbase“ pagrindinis mazgas reguliuoja grupių ir regionų serverius, kad būtų saugomos lentelių dalys, ir valdo duomenų darbą.

2) Paaiškinkite, kodėl reikia naudoti Hbase?

  • Didelės talpos saugojimo sistema
  • Paskirstytas dizainas skirtas dideliems staliukams patenkinti
  • Kolonos orientuotos parduotuvės
  • Horizontaliai keičiamas
  • Aukštas našumas ir prieinamumas
  • Pagrindinis „Hbase“ tikslas yra milijonai stulpelių, tūkstančiai versijų ir milijardai eilučių
  • Skirtingai nuo HDFS („Hadoop Distribute File System“), jis palaiko atsitiktines realaus laiko CRUD operacijas

3) Paminėkite, kokie yra pagrindiniai Hbase komponentai?

  • „Zookeeper“: jis atlieka kliento ir „Hbase Maser“ koordinavimo darbą
  • „Hbase Master“: „ Hbase Master“ stebi regiono serverį
  • RegionServer: RegionServer stebi regioną
  • Regionas: Jame yra atminties duomenų saugykloje („MemStore“) ir „Hfile“.
  • Katalogo lentelės: Katalogo lentelės susideda iš ROOT ir META

4) Paaiškinkite, iš ko susideda Hbase?

  • „Hbase“ sudaro lentelių rinkinys
  • Kiekvienoje lentelėje yra eilutės ir stulpeliai, pavyzdžiui, tradicinė duomenų bazė
  • Kiekvienoje lentelėje turi būti elementas, apibrėžtas kaip pagrindinis raktas
  • Hbase stulpelis žymi objekto atributą

5) Paminėkite, kiek operacinių komandų yra „Hbase“?

Operacinė komanda „Hbases“ yra apie penkis tipus

  • Gaukite
  • Įdėk
  • Ištrinti
  • Nuskaityti
  • Prieaugis

6) Paaiškinkite, kas yra WAL ir „Hlog“ „Hbase“?

WAL (Write Ahead Log) yra panašus į „MySQL BIN“ žurnalą; jis fiksuoja visus įvykusius duomenų pokyčius. Tai yra standartinis Hadoopo failas, kuriame saugomi „HLogkey“ failai. Šiuos raktus sudaro nuoseklus skaičius, taip pat faktiniai duomenys, ir jie naudojami atkurti dar neišsaugotus duomenis po serverio gedimo. Taigi grynaisiais dėl serverio gedimo WAL veikia kaip gyvenimo linija ir suranda prarastus duomenis.

7) Kada turėtumėte naudoti „Hbase“?

  • Duomenų dydis yra didžiulis: kai turite daug tonų ir milijonų įrašų veikti
  • Visiškas pertvarkymas: Kai perkeliate RDBMS į „Hbase“, tai laikote visiškai pertvarkytu, tada tiesiog pakeiskite prievadus
  • SQL-Less komandos: turite keletą funkcijų, tokių kaip operacijos; vidiniai sujungimai, surinkti stulpeliai ir kt.
  • Infrastruktūros investicijos: Kad „Hbase“ būtų tikrai naudinga, turite turėti pakankamai klasterių

8) Kas yra „Hbase“ kolonų šeimos?

Stulpelių šeimas sudaro pagrindinis fizinio saugojimo Hbase vienetas, kuriam taikomos tokios funkcijos kaip suspaudimas.

9) Paaiškinkite, kas yra eilutės raktas?

Eilutės raktą apibrėžia programa. Kadangi kombinuotą raktą iš anksto nustato eilutės raktas, tai leidžia programai nustatyti norimą rūšiavimo tvarką. Tai taip pat leidžia logiškai sugrupuoti langelius ir įsitikinti, kad visos tos pačios eilutės ląstelės yra tame pačiame serveryje.

10) Paaiškinkite ištrynimą Hbase? Paminėkite, kokie yra trys Hbase antkapių žymenų tipai?

Kai ištrinsite langelį „Hbase“, duomenys iš tikrųjų nebus ištrinti, bet bus nustatytas antkapio žymeklis, todėl ištrintos ląstelės bus nematomos. Ištrintos Hbase iš tikrųjų pašalinamos sutankinant.

Yra trijų tipų antkapių žymekliai:

  • Versijos ištrynimo žymeklis: norint ištrinti, jis pažymi vieną stulpelio versiją
  • Stulpelio ištrynimo žymeklis: jei norite ištrinti, jis pažymi visas stulpelio versijas
  • Šeimos ištrynimo žymeklis: jei norite ištrinti, jis pažymi visus stulpelių šeimos stulpelius

11) Paaiškinkite, kaip „Hbase“ iš tikrųjų ištrina eilutę?

„Hbase“ viskas, ką parašysite, bus saugoma iš RAM į diską, šie disko įrašai yra nepakeičiami, neleidžiantys sutankinti. „Hbase“ trynimo proceso metu pagrindinis sutankinimo procesas ištrina žymeklį, o nedidelis sutankinimas - ne. Įprasto ištrynimo metu ištrinamas antkapio žymeklis - šie jų ištrinti duomenys pašalinami sutankinant.

Be to, jei ištrinsite duomenis ir pridėsite daugiau duomenų, bet su ankstesne laiko žyme nei antkapio laiko žyme, tolesni „ Gets“ gali būti užmaskuoti ištrynimo / antkapio žymekliu, taigi įterptos vertės gausite tik po pagrindinio sutankinimo.

12) Paaiškinkite, kas nutiks, jei pakeisite jau užimtos duomenų bazės stulpelių šeimos bloko dydį?

Kai pakeisite stulpelių šeimos bloko dydį, nauji duomenys užims naują bloko dydį, o seni duomenys išliks senojo bloko dydžio. Tankinant duomenis, seniems duomenims bus pritaikytas naujas bloko dydis. Nauji failai, kai jie yra išvalyti, turi naują bloko dydį, o esami duomenys ir toliau bus teisingai skaitomi. Po kito pagrindinio sutankinimo visi duomenys turėtų būti pertvarkyti į naują bloko dydį.

13) Paminėkite skirtumą tarp Hbase ir Reliacinės duomenų bazės?

Hbase Reliacinė duomenų bazė
  • Tai be schemos
  • Tai yra stulpelių duomenų saugykla
  • Jis naudojamas nenormalizuotiems duomenims saugoti
  • Jame yra retai apgyvendintos lentelės
  • Automatinis skaidymas atliekamas „Hbase“
  • Tai schema pagrįsta duomenų bazė
  • Tai yra eilučių duomenų saugykla
  • Jis naudojamas normalizuotiems duomenims saugoti
  • Jame yra plonos lentelės
  • Nėra tokios nuostatos ar integruotos palaikymo skaidymui

14) Kas yra HBaseFsck klasė?

„HBase“ yra įrankio pavadinimas, vadinamas atgal, kurį įgyvendina „HBaseFsck“ klasė. Jis siūlo kelis komandinės eilutės jungiklius, turinčius įtakos jo elgesiui.

15) Kokios yra pagrindinės HBase struktūros?

Eilutės raktas ir stulpelio raktas yra dvi svarbiausios pagrindinės struktūros, naudojamos „HBase“

16) Aptarkite, kaip galite naudoti „Apache HBase“ filtrus

Filtrai „HBase Shell“. Jis buvo pristatytas „Apache HBase 0.92“, kuris padeda atlikti serverio filtravimą, norint pasiekti HBase per HBase apvalkalą ar taupumą.

17) „HBase“ palaiko sintaksės struktūrą, pvz., „SQL“ taip ar ne?

Ne, deja, SQL palaikymas „HBase“ šiuo metu nėra prieinamas. Tačiau naudodami „Apache Phoenix“ duomenis galime gauti iš „HBase“ per SQL užklausas.

18) Ką reiškia tankinimas HBase?

Tuo metu, kai gaunama daug įrašų, neįmanoma pasiekti optimalaus našumo, turint po vieną failą kiekvienoje parduotuvėje. „HBase“ padeda sujungti visas šias HFiles, kad sumažintumėte diskų sėklų skaičių kiekvienam skaitymui. Šis procesas yra žinomas kaip sutankinimas HBase.

19) Kaip įgyvendinsite prisijungimus „HBase“?

„HBase“, tiesiogiai nepalaikanti prisijungimų, tačiau naudojant „MapReduce“ užduotis, prisijungimo užklausas galima įgyvendinti gavus duomenis skirtingų HBase lentelių pagalba.

20) Paaiškinkite JMX apie HBSE

„Java“ valdymo plėtiniai arba „JMX“ yra „Java“ programų eksporto būsena.

21) Kas yra „MasterServer“ naudojimas?

„Master sever“ taip pat padeda priskirti regioną regiono serveriui. Tai taip pat padeda jums valdyti apkrovos balansavimą, kurį naudojame „MasterServer“.

22) Apibrėžkite taupymo terminą

„Apache Thrift“ parašyta C ++. Čia pateikiami schemų kompiliatoriai įvairioms programavimo kalboms, tokioms kaip C ++, Perl, PHP, Python, Ruby ir kt.

23) Kodėl verta naudoti „HColumnDescriptor“ klasę?

Išsami informacija apie stulpelių šeimą, pvz., Suspaudimo parametrai, Versijų skaičius, saugoma. „HColumnDescriptor“.

24) Kas yra HBase ląstelė?

Ląstelė HBase yra mažiausias Hbase lentelės vienetas. Tai padeda jums laikyti dalį duomenų po kelis {eilutė, stulpelis, versija}

25) Kas yra „Bloom“ filtras?

„HBase“ palaiko „Bloom Filter“, kuris padeda pagerinti bendrą klasterio pralaidumą. „HBase Bloom“ filtras yra erdvėje efektyvus mechanizmas, skirtas patikrinti, ar HFile yra tam tikros eilutės, ar eilutės-kolonėlės langeliai.

26) Papasakok man apie HBase operacijų tipus?

Ans. Dviejų tipų „HBase“ operacijos yra:

  • Skaityti operaciją
  • Rašymo operacija

27) Kas yra „HBase HMaster“ naudojimas?

Pagrindinės kapitono pareigos yra:

  1. Koordinuoti regiono serverius
  2. Administratoriaus funkcijos

28) Kokią techniką galite naudoti „HBase“, kad galėtumėte tiesiogiai pasiekti „HFile“ be „HBase“ pagalbos?

Norėdami tiesiogiai pasiekti HFile nenaudodami HBase, mes naudojame metodą HFile.main ().

29) Ar regiono serveris gali būti visuose „DataNodes“?

Taip, regiono serveriai veikia tuose pačiuose serveriuose kaip ir „DataNodes“

30) Pavadinkite filtrą, kuris priima puslapio dydį kaip parametrą „HBase“

Filtras pavadinimu „PageFilter“ priima puslapio dydį kaip parametrą.

Šis dokumentas buvo sudarytas naudojant tiesioginio HTML keitiklio įrankius.