25 populiariausi ETL testavimo interviu klausimai ir Atsakymai

Turinys

Toliau pateikiami dažnai užduodami klausimai interviu naujokams, taip pat patyrusiems ETL testuotojams ir kūrėjams.

1) Kas yra ETL?

Duomenų sandėliavimo architektūroje ETL yra svarbus komponentas, tvarkantis bet kokio verslo proceso duomenis. ETL reiškia ištraukimas, transformavimas ir apkrova . „Extract“ atlieka duomenų nuskaitymo iš duomenų bazės procesą. „Transform“ konvertuoja duomenis į formatą, kuris galėtų būti tinkamas ataskaitoms ir analizei. Nors apkrova vykdo duomenų įrašymą į tikslinę duomenų bazę.

2) Paaiškinkite, ką apima ETL testavimo operacijos?

ETL bandymai apima

  • Patikrinkite, ar duomenys tinkamai transformuojami pagal verslo reikalavimus
  • Patikrinkite, ar projektuojami duomenys įkeliami į duomenų saugyklą be jokių sutrumpinimų ir duomenų praradimo
  • Įsitikinkite, kad ETL programa praneša apie neteisingus duomenis ir pakeičia jas numatytosiomis reikšmėmis
  • Norėdami pagerinti mastelį ir našumą, įsitikinkite, kad duomenys įkeliami numatytu laikotarpiu

3) Paminėkite, kokie yra duomenų saugyklos programų tipai ir kuo skiriasi duomenų gavyba ir duomenų saugojimas?

Duomenų saugyklos programų tipai yra

  • Informacijos apdorojimas
  • Analitinis apdorojimas
  • Duomenų gavyba

Duomenų gavyba gali būti apibrėžta kaip paslėptos nuspėjamosios informacijos išgauti iš didelių duomenų bazių procesas ir interpretuoti duomenis, o duomenų saugykloje gali būti naudojama duomenų kasykla, kad duomenys būtų analizuojami greičiau. Duomenų saugojimas yra duomenų, gautų iš kelių šaltinių, kaupimas į vieną bendrą saugyklą

4) Kokios yra įvairios ETL naudojamos priemonės?

  • „Cognos“ sprendimų srautas
  • „Oracle Warehouse Builder“
  • Verslo objektai XI
  • SAS verslo sandėlis
  • „SAS Enterprise ETL“ serveris

5) Kas yra faktas? Kokios yra faktų rūšys?

Tai yra daugialypio modelio, kuriame yra analizuotinos priemonės, pagrindinis komponentas. Faktai yra susiję su matmenimis.

Faktų tipai yra

  • Priedų faktai
  • Pusiau adityvūs faktai
  • Faktai be priedų

6) Paaiškinkite, kas yra kubai ir OLAP kubai?

Kubai yra duomenų apdorojimo vienetai, susidedantys iš duomenų lentelės faktų lentelių ir matmenų. Tai teikia daugialypę analizę.

OLAP reiškia „Online Analytics Processing“, o „OLAP“ kubas didelius duomenis saugo daugialypės formos ataskaitų teikimo tikslais. Tai susideda iš faktų, vadinamų matais, suskirstytais pagal matmenis.

7) Paaiškinkite, kas yra sekimo lygis ir kokie yra tipai?

Stebėjimo lygis yra duomenų, saugomų žurnalo failuose, kiekis. Atsekimo lygį galima suskirstyti į du „Normal“ ir „Verbose“. Įprastas lygis išsamiai paaiškina sekimo lygį, o žodžiu - kiekvienos eilės sekimo lygius.

8) Paaiškinkite, kas yra faktų grūdas?

Grūdų faktą galima apibrėžti kaip faktų informacijos saugojimo lygį. Jis taip pat žinomas kaip „Fact Granularity“

9) Paaiškinkite, kas yra faktų be faktų schema ir kas yra priemonės?

Faktų lentelė be matų yra vadinama „Factless fact table“. Jis gali peržiūrėti įvykių skaičių. Pavyzdžiui, jis naudojamas įrašyti įvykį, pavyzdžiui, darbuotojų skaičių įmonėje.

Skaitiniai duomenys, pagrįsti faktų lentelės stulpeliais, yra žinomi kaip matai

10) Paaiškinkite, kas yra transformacija?

Transformacija yra saugyklos objektas, kuris generuoja, modifikuoja ar perduoda duomenis. Transformacija yra dviejų tipų - aktyvi ir pasyvi

11) Paaiškinkite paieškos transformacijos naudojimą?

Paieškos transformacija yra naudinga

  • Susijusios vertės iš lentelės gavimas naudojant stulpelio vertę
  • Atnaujinkite lėtai besikeičiančią matmenų lentelę
  • Patikrinkite, ar lentelėje jau yra įrašų

12) Paaiškinkite, kas yra skaidymas, maišos skaidymas ir apvaliojo paskirstymo skaidymas?

Norint pagerinti našumą, operacijos yra padalijamos dalimis, tai vadinama skaidymu. Padalijimas įgalina „Informatica Server“ sukurti kelis ryšius su įvairiais šaltiniais

Pertvarų tipai yra

„Round-Robin“ skaidymas:

  • Pagal informatiką duomenys paskirstomi tolygiai tarp visų skaidinių
  • Kiekviename skaidinyje, kuriame apdorojamų eilučių skaičius yra maždaug toks pats, taikomas šis skaidymas

Maišos skaidymas:

  • Informatica serveris, norėdamas suskirstyti raktus į duomenų grupavimą tarp skaidinių, taiko maišos funkciją
  • Jis naudojamas užtikrinant procesų eilučių grupes su tuo pačiu skaidinio raktu tame pačiame skaidinyje

13) Paminėkite, koks yra „DataReader“ paskirties adapterio naudojimo pranašumas?

„DataReader“ paskirties adapterio naudojimo pranašumas yra tas, kad jis užpildo ADO įrašų rinkinį (susideda iš įrašų ir stulpelių) atmintyje ir atskleidžia duomenis iš užduoties „DataFlow“ įgyvendindamas „DataReader“ sąsają, kad kita programa galėtų suvartoti duomenis.

14) Kaip galima atnaujinti lentelę naudojant SSIS („SQL Server Integration Service“)?

Norėdami atnaujinti lentelę naudodami SSIS, galimi šie būdai:

  • Naudokite SQL komandą
  • Naudokite sustojimo stalą
  • Naudokite talpyklą
  • Naudokite scenarijaus užduotį
  • Jei naudojate MSSQL, atnaujinimui naudokite visą duomenų bazės pavadinimą

15) Jei turėtumėte ne OLEDB (objektų susiejimo ir įdėjimo duomenų bazės) šaltinį, ką darytumėte?

Jei turite ne OLEBD šaltinį paieškai, turite naudoti talpyklą duomenims įkelti ir naudoti kaip šaltinį

16) Kokiu atveju naudojate dinaminę talpyklą ir statinę talpyklą sujungtose ir nesujungtose transformacijose?

  • Dinaminė talpykla naudojama, kai turite atnaujinti pagrindinę lentelę ir lėtai keičiant 1 tipo matmenis (SCD)
  • Plokštiems failams naudojama statinė talpykla

17) Paaiškinkite, kuo skiriasi neprisijungta ir neprijungta paieška?

Prijungta paieška

Neprijungta paieška

  • Susieta paieška dalyvauja žemėlapiuose

- Jis naudojamas, kai kartografuojant vietoj išraiškos transformacijos naudojama paieškos funkcija

  • Galima pateikti kelias reikšmes

- Grąžina tik vieną išvesties prievadą

  • Jis gali būti prijungtas prie kitų transformacijų ir grąžina vertę
  • Kitos transformacijos negalima prijungti
  • Statinei arba dinaminei talpyklai galima naudoti prijungtą paiešką
  • Neprijungta kaip tik statinė talpykla
  • Prijungta paieška palaiko vartotojo nustatytas numatytąsias reikšmes
  • Nesusieta paieška nepalaiko vartotojo nustatytų numatytųjų reikšmių
  • „Connected Lookup“ stulpelyje galima grįžti iš tos pačios eilutės arba įterpti į dinaminę paieškos talpyklą
  • Neprijungtas peržiūra nurodo vieną grąžinimo prievadą ir grąžina po vieną stulpelį iš kiekvienos eilutės

18) Paaiškinkite, kas yra duomenų šaltinio rodinys?

Duomenų šaltinio rodinys leidžia apibrėžti reliacinę schemą, kuri bus naudojama analizės paslaugų duomenų bazėse. Objektai, o ne tiesiogiai iš duomenų šaltinių, matmenys ir kubai kuriami iš duomenų šaltinio rodinių.

19) Paaiškinkite, kuo skiriasi OLAP įrankiai nuo ETL įrankių?

Skirtumas tarp ETL ir OLAP įrankio yra tas

ETL įrankis skirtas duomenims iš senų sistemų išgauti ir į tam tikrą duomenų bazę įkelti į tam tikrą duomenų valymo procesą.

Pavyzdys: duomenų stadija, „Informatica“ ir kt.

Nors OLAP yra skirtas ataskaitų teikimo tikslui OLAP duomenyse, kurie yra daugialypiai.

Pavyzdys: verslo objektai, „Cognos“ ir kt.

20) Kaip galite išgauti SAP duomenis naudodamiesi „Informatica“?

  • Naudodami maitinimo prijungimo parinktį, išskleidžiate SAP duomenis naudodamiesi informatika
  • Įdiekite ir sukonfigūruokite „PowerConnect“ įrankį
  • Importuokite šaltinį į šaltinio analizatorių. Tarp „Informatica“ ir „SAP Powerconnect“ veikia kaip takas. Kitas žingsnis yra generuoti ABAP kodą žemėlapiui kurti, tada tik „informatica“ gali gauti duomenis iš SAP
  • Šaltinių prijungimui ir importavimui iš išorinių sistemų naudojama „Power Connect“

21) Paminėkite, kuo skiriasi „Power Mart“ ir „Power Center“?

Maitinimo centras

Galia Mart

  • Tarkime, apdoroti didžiulį duomenų kiekį
  • Tarkime, kad bus apdorotas nedidelis duomenų kiekis
  • Jis palaiko ERP šaltinius, tokius kaip SAP, „soft soft“ ir kt.
  • Jis nepalaiko ERP šaltinių
  • Jis palaiko vietinę ir pasaulinę saugyklą
  • Jis palaiko vietinę saugyklą
  • Tai paverčia vietinę į pasaulinę saugyklą
  • Jame nėra specifikacijos, kaip konvertuoti vietinę į visuotinę saugyklą

22) Paaiškinkite, kas yra sustojimo vieta ir koks yra sustojimo vietos tikslas?

Duomenų išdėstymas yra sritis, kurioje laikinai laikote duomenis duomenų saugyklos serveryje. Duomenų išdėstymas apima šiuos veiksmus

  • Šaltinių duomenų gavimas ir duomenų transformavimas (restruktūrizavimas)
  • Duomenų transformavimas (duomenų valymas, vertės transformavimas)
  • Pakeisti raktų priskyrimus

23) Kas yra autobusų schema?

Įvairiems verslo procesams nustatyti bendrus matmenis naudojama BUS schema. Jame pateikiami suderinti matmenys ir standartizuotas informacijos apibrėžimas

24) Paaiškinkite, kas yra duomenų valymas?

Duomenų išvalymas yra duomenų ištrynimo iš duomenų saugyklos procesas. Jis ištrina šlamšto duomenis kaip eilutes su nulinėmis reikšmėmis arba papildomais tarpais.

25) Paaiškinkite, kas yra schemos objektai?

Schemos objektai yra loginė struktūra, tiesiogiai nukreipianti į duomenų bazių duomenis. Schemos objektai apima lenteles, rodinius, sekos sinonimus, indeksus, grupes, funkcijų paketus ir duomenų bazių nuorodas

26) Paaiškinkite šiuos terminus „Session“, „Worklet“, „Mapplet“ ir „Workflow“?

  • Mapplet: jis sutvarko arba sukuria transformacijos rinkinius
  • Darbalapis: jis atspindi konkretų užduočių rinkinį
  • Darbo eiga: tai instrukcijų rinkinys, nurodantis serveriui, kaip vykdyti užduotis
  • Seansas: tai parametrų rinkinys, nurodantis serveriui, kaip perkelti duomenis iš šaltinių į tikslą

Nemokamas PDF atsisiuntimas: ETL interviu klausimų ir atsakymų testavimas

Įdomios straipsniai...