Žvaigždžių ir snaigių schema duomenų saugykloje su pavyzdžiais

Turinys:

Anonim

Kas yra daugiamatė schema?

Daugialypė schema yra specialiai sukurta duomenų sandėlių sistemoms modeliuoti. Schemos yra skirtos patenkinti unikalius labai didelių duomenų bazių, sukurtų analizės tikslams (OLAP), poreikius.

Duomenų saugyklos schemos tipai:

Toliau pateikiami 3 pagrindiniai daugiamačių schemų tipai, kiekvienas turintis unikalių pranašumų.

  • Žvaigždžių schema
  • Snaigės schema
  • „Galaxy Schema“

Šioje pamokoje sužinosite daugiau apie

  • Kas yra žvaigždžių schema?
  • Kas yra snaigių schema?
  • Žvaigždžių schema prieš snaigių schemą: pagrindiniai skirtumai
  • Kas yra „Galaxy“ schema?
  • Kas yra žvaigždžių spiečiaus schema?

Kas yra žvaigždžių schema?

Žvaigždžių schema duomenų saugykloje, kurioje žvaigždės centre gali būti viena faktų lentelė ir daugybė susijusių matmenų lentelių. Ji yra žinoma kaip žvaigždžių schema, nes jos struktūra primena žvaigždę. „Star Schema“ duomenų modelis yra paprasčiausias „Data Warehouse“ schemos tipas. Jis taip pat žinomas kaip „Star Join Schema“ ir yra optimizuotas didelių duomenų rinkinių užklausoms.

Šiame „Žvaigždžių schemos“ pavyzdyje faktų lentelė yra centre, kurioje yra raktai į kiekvieną aspektų lentelę, pvz., Pardavėjo_ID, modelio ID, datos_ID, produkto_ID, šakos_ID ir kiti atributai, pvz., Parduoti vienetai ir pajamos.

Žvaigždžių schemos schemos pavyzdys

Žvaigždžių schemos charakteristikos:

  • Kiekvienas žvaigždžių schemos matmuo pateikiamas tik su viena matmenų lentele.
  • Aspektų lentelėje turėtų būti atributų rinkinys.
  • Dimensijų lentelė sujungiama su faktų lentele naudojant svetimą raktą
  • Matmenų lentelė nėra sujungta viena su kita
  • Faktų lentelėje būtų raktas ir matas
  • „Star“ schema yra lengvai suprantama ir suteikia optimalų disko naudojimą.
  • Matmenų lentelės nėra normalizuotos. Pavyzdžiui, aukščiau pateiktame paveikslėlyje „Country_ID“ nėra „Country lookup“ lentelės, kaip turėtų OLTP dizainas.
  • Schemą plačiai palaiko „BI Tools“

Kas yra snaigių schema?

Snaigių schema duomenų saugykloje yra logiškas daugiadimensės duomenų bazės lentelių išdėstymas, kad ER diagrama primintų snaigės formą. „Snaigės“ schema yra „Žvaigždžių schemos“ pratęsimas ir ji prideda papildomų matmenų. Dimensijų lentelės yra normalizuotos, todėl duomenys padalijami į papildomas lenteles.

Šiame „Snaigių schemos“ pavyzdyje šalis toliau normalizuojama į atskirą lentelę.

Snaigių schemos pavyzdys

Snaigių schemos charakteristikos:

  • Pagrindinis snaigių schemos pranašumas reikalauja mažesnės vietos diske.
  • Prie schemos pridedama lengviau įgyvendinti aspektą
  • Dėl kelių lentelių užklausos našumas sumažėja
  • Pagrindinis iššūkis, su kuriuo susidursite naudodamiesi snaigių schema, yra tai, kad turite atlikti daugiau priežiūros pastangų dėl daugiau paieškos lentelių.

Žvaigždžių schema prieš snaigių schemą: pagrindiniai skirtumai

Toliau pateikiamas pagrindinis skirtumas tarp „Star Schema“ ir „Snowflake Schema“:

Žvaigždžių schema Snaigės schema
Matmenų hierarchijos saugomos matmenų lentelėje. Hierarchijos skirstomos į atskiras lenteles.
Jame yra faktų lentelė, apsupta matmenų lentelėmis. Viena faktų lentelė, apsupta matmenų lentelės, kurią savo ruožtu supa matmenų lentelė
Žvaigždžių schemoje tik vienas sujungimas sukuria ryšį tarp faktų lentelės ir visų matmenų lentelių. Norint gauti duomenis, norint gauti snaigės schemą reikia daug prisijungimų.
Paprastas DB dizainas. Labai sudėtingas DB dizainas.
Denormalizuota duomenų struktūra ir užklausos taip pat veikia greičiau. Normalizuota duomenų struktūra.
Aukštas duomenų pertekliaus lygis Labai žemo lygio duomenų atleidimas
Vieno aspekto lentelėje yra apibendrinti duomenys. Duomenys suskirstyti į skirtingas matmenų lenteles.
Kubas apdorojamas greičiau. Kubas gali būti lėtas dėl sudėtingo sujungimo.
Siūlomos našesnės užklausos naudojant „Star Join Query Optimization“. Lentelės gali būti sujungtos keliais matmenimis. „Snaigės“ schemą vaizduoja centralizuota faktų lentelė, kuri mažai tikėtina susieta su keliais matmenimis.

Kas yra „Galaxy“ schema?

Galaxy Schema“ yra dvi faktų lentelės, kurios dalijasi matmenų lentelėmis. Jis taip pat vadinamas faktų žvaigždynų schema. Schema vertinama kaip žvaigždžių kolekcija, taigi ir pavadinimas „Galaxy Schema“.

„Galaxy Schema“ pavyzdys

Kaip matote aukščiau pateiktame pavyzdyje, yra dvi faktų lentelės

  1. Pajamos
  2. Produktas.

„Galaxy“ schemoje akcijų matmenys vadinami Suderintais matmenimis.

„Galaxy Schema“ charakteristikos:

  • Šios schemos matmenys yra suskirstyti į atskirus matmenis, atsižvelgiant į įvairius hierarchijos lygius.
  • Pavyzdžiui, jei geografija turi keturis hierarchijos lygius, pvz., Regioną, šalį, valstiją ir miestą, tada „Galaxy“ schema turėtų turėti keturis matmenis.
  • Be to, galima sukurti tokio tipo schemą, padalinant vienos žvaigždės schemą į daugiau „Star“ schemų.
  • Matmenys yra dideli šioje schemoje, kuri reikalinga kuriant remiantis hierarchijos lygiais.
  • Ši schema yra naudinga kaupiant faktų lenteles, kad būtų geriau suprantama.

Kas yra žvaigždžių spiečiaus schema?

„Snaigių“ schemoje yra visiškai išplėstos hierarchijos. Tačiau tai gali padidinti schemos sudėtingumą ir reikalauti papildomų prisijungimų. Kita vertus, žvaigždžių schemoje yra visiškai sugriuvusios hierarchijos, o tai gali sukelti perteklių. Taigi geriausias sprendimas gali būti pusiausvyra tarp šių dviejų schemų, kuri yra „Žvaigždžių klasterio schemos“ dizainas.

Žvaigždžių sankaupos schemos pavyzdys

Dimensijas, kurios sutampa, hierarchijose galima rasti kaip šakutes. Šakutė įvyksta, kai subjektas veikia kaip tėvas dviejose skirtingų matmenų hierarchijose. Šakės subjektai tada identifikuojami kaip klasifikacija, turinti santykius „vienas su daugeliu“.

Santrauka:

  • Daugialypė schema yra specialiai sukurta duomenų sandėlių sistemoms modeliuoti
  • Žvaigždžių schema yra paprasčiausias duomenų saugyklos schemos tipas. Ji yra žinoma kaip žvaigždžių schema, nes jos struktūra primena žvaigždę.
  • „Snaigės“ schema yra „Žvaigždžių schemos“ pratęsimas ir ji prideda papildomų matmenų. Jis vadinamas snaigė, nes jo schema primena snaigę.
  • Žvaigždžių schemoje tik vienas sujungimas apibrėžia faktų lentelės ir visų matmenų lentelių santykį.
  • Žvaigždžių schemoje yra faktų lentelė, apsupta matmenų lentelėmis.
  • Snaigės schemą supa matmenų lentelė, kurią savo ruožtu supa matmenų lentelė
  • Norint gauti duomenis, norint gauti snaigės schemą reikia daug prisijungimų.
  • „Galaxy Schema“ yra dvi faktų lentelės, kuriomis dalijamasi matmenų lentelėmis. Jis taip pat vadinamas faktų žvaigždynų schema.
  • Žvaigždžių sankaupos schemoje yra žvaigždžių ir snaigių schemos atributų.