Kas yra OLAP? Kubas, operacijos ir amp; Tipai duomenų saugykloje

Kas yra OLAP?

Internetinis analitinis apdorojimas (OLAP) yra programinės įrangos kategorija, leidžianti vartotojams analizuoti informaciją iš kelių duomenų bazių sistemų vienu metu. Tai technologija, leidžianti analitikams išgauti ir peržiūrėti verslo duomenis iš skirtingų taškų.

Analitikams dažnai reikia grupuoti, kaupti ir sujungti duomenis. Šios reliacinių duomenų bazių operacijos reikalauja daug išteklių. Su OLAP duomenis galima iš anksto apskaičiuoti ir iš anksto sujungti, todėl analizė yra greitesnė.

OLAP duomenų bazės yra suskirstytos į vieną ar daugiau kubų. Kubai yra suprojektuoti taip, kad lengva kurti ir peržiūrėti ataskaitas. OLAP reiškia internetinį analitinį apdorojimą.

Šioje pamokoje sužinosite

  • OLAP kubas
  • Pagrindinės OLAP analitinės operacijos
  • OLAP sistemų tipai
  • ROLAP
  • MOLAP
  • Hibridinis OLAP
  • OLAP privalumai
  • OLAP trūkumai

OLAP kubas:

OLAP koncepcijos esmė yra OLAP kubas. OLAP kubas yra duomenų struktūra, optimizuota labai greitai duomenų analizei.

OLAP kubas susideda iš skaitinių faktų, vadinamų matais, kurie skirstomi pagal matmenis. OLAP kubas dar vadinamas hiperkubu .

Paprastai duomenų operacijos ir analizė atliekama naudojant paprastą skaičiuoklę, kur duomenų reikšmės yra išdėstytos eilutės ir stulpelio formatu. Tai idealiai tinka dvimačiams duomenims. Tačiau OLAP yra daugiamačių duomenų, o duomenys dažniausiai gaunami iš kito ir nesusijusio šaltinio. Skaičiuoklės naudojimas nėra optimalus pasirinkimas. Kubas gali logiškai ir tvarkingai saugoti ir analizuoti daugialypius duomenis.

Kaip tai veikia?

Duomenų sandėlis gautų informaciją iš kelių duomenų šaltinių ir formatų, tokių kaip tekstiniai failai, „Excel“ lapas, daugialypės terpės failai ir kt.

Ištraukti duomenys yra išvalomi ir transformuojami. Duomenys įkeliami į OLAP serverį (arba OLAP kubą), kur informacija iš anksto apskaičiuojama tolesnei analizei atlikti.

Pagrindinės OLAP analitinės operacijos

Keturi OLAP analitinių operacijų tipai:

  1. Suvynioti
  2. Kastis žemyn
  3. Skiltelė ir kauliukas
  4. „Pivot“ (pasukti)

1) Sudėjimas:

Sudėtinis dar vadinamas „konsolidavimu“ arba „sujungimu“. Sudedamąją operaciją galima atlikti dviem būdais

  1. Matmenų mažinimas
  2. Pakilimas į koncepcijos hierarchiją. Sąvokos hierarchija yra dalykų grupavimo sistema, pagrįsta jų tvarka ar lygiu.

Apsvarstykite šią diagramą

  • Šiame pavyzdyje miestai New Jersey ir Lost Angles ir išvynioti į šalį JAV
  • Naujojo Džersio ir Los Andželo pardavimų skaičius yra atitinkamai 440 ir 1560. Po sukūrimo jie tampa 2000 m
  • Šiame kaupimo procese duomenys yra vietovės hierarchija, kylanti iš miesto į šalį.
  • Sudarant procesą reikia pašalinti bent vieną ar daugiau matmenų. Šiame pavyzdyje Quater matmuo pašalinamas.

2) Gręžimas

Išsamiuose duomenyse duomenys suskaidomi į mažesnes dalis. Tai yra priešinga sukūrimo procesui. Tai galima padaryti per

  • Judėjimas žemyn sąvokų hierarchijoje
  • Dimensijos didinimas

Apsvarstykite aukščiau pateiktą diagramą

  • „Quater Q1“ išnagrinėtas iki sausio, vasario ir kovo mėnesių. Atitinkami pardavimai taip pat yra registrai.
  • Šiame pavyzdyje pridedami aspektų mėnesiai.

3) Skiltelė:

Čia pasirenkamas vienas matmuo ir sukuriamas naujas sub-kubas.

Šioje diagramoje paaiškinama, kaip atlikta pjūvio operacija:

  • Matmenų laikas pjaustomas, kai filtras yra Q1.
  • Iš viso sukuriamas naujas kubas.

Kauliukai:

Ši operacija yra panaši į skiltelę. Kauliukų skirtumas yra tai, kad pasirenkate 2 ar daugiau dimensijų, kurios sukuria sub-kubą.

4) pasukimas

„Pivot“ sistemoje sukite duomenų ašis, kad būtų pateiktas pakaitinis duomenų pateikimas.

Šiame pavyzdyje suvestinė yra pagrįsta elementų tipais.

OLAP sistemų tipai

OLAP hierarchinė struktūra

OLAP tipas Paaiškinimas
Santykinis OLAP (ROLAP): ROLAP yra išplėstinis RDBVS kartu su daugialypiu duomenų susiejimu, kad būtų atlikta standartinė reliacinė operacija.
Daugialypis OLAP (MOLAP) MOLAP įgyvendina daugiadimensių duomenų operaciją.
Hibridinis internetinis analitinis apdorojimas (HOLAP) Taikant HOLAP metodą, bendros sumos saugomos daugialypėje duomenų bazėje, o išsamūs duomenys - reliacinėje duomenų bazėje. Tai suteikia ROLAP modelio duomenų efektyvumą ir MOLAP modelio našumą.
Stalinis OLAP (DOLAP) „Desktop OLAP“ vartotojas dalį duomenų iš duomenų bazės atsisiunčia vietoje arba savo darbalaukyje ir analizuoja. DOLAP yra palyginti pigesnis diegimas, nes jis siūlo labai mažai funkcijų, palyginti su kitomis OLAP sistemomis.
Žiniatinklio OLAP (WOLAP) Žiniatinklio OLAP, kuri yra OLAP sistema, pasiekiama per interneto naršyklę. WOLAP yra trijų pakopų architektūra. Jį sudaro trys komponentai: klientas, tarpinė programinė įranga ir duomenų bazės serveris.
Mobilusis OLAP: Mobilusis OLAP padeda vartotojams pasiekti ir analizuoti OLAP duomenis naudojant savo mobiliuosius įrenginius
Erdvinis OLAP: SOLAP sukurtas siekiant palengvinti erdvinių ir netelpinių duomenų valdymą geografinės informacijos sistemoje (GIS)

ROLAP

ROLAP veikia su duomenimis, esančiais reliacinėje duomenų bazėje. Faktai ir matmenų lentelės saugomos kaip reliacinės lentelės. Tai taip pat leidžia daugiamatę duomenų analizę ir yra greičiausiai augantis OLAP.

ROLAP modelio pranašumai:

  • Didelis duomenų efektyvumas. Tai užtikrina didelį duomenų efektyvumą, nes užklausų našumas ir prieigos kalba yra optimizuoti ypač atliekant daugiamatę duomenų analizę.
  • Mastelis. Šio tipo OLAP sistema suteikia mastelį valdant didelius duomenų kiekius ir net tada, kai duomenys nuolat auga.

ROLAP modelio trūkumai:

  • Didesnių išteklių poreikis: ROLAP reikia daug išnaudoti darbo jėgos, programinės ir aparatinės įrangos išteklius.
  • Apibendrinti duomenų apribojimai. ROLAP įrankiai naudoja SQL apskaičiuodami visus suvestinius duomenis. Tačiau skaičiavimams tvarkyti nėra nustatytų apribojimų.
  • Lėtas užklausos našumas. Šio modelio užklausos yra lėtos, palyginti su MOLAP

MOLAP

MOLAP naudoja masyvo pagrindu sukurtus daugiamačius saugojimo variklius, kad būtų rodomi daugiamačiai duomenų rodiniai. Iš esmės jie naudoja OLAP kubą.

Sužinokite daugiau apie OLAP čia

Hibridinis OLAP

Hibridinis OLAP yra ROLAP ir MOLAP mišinys. Tai suteikia galimybę greitai apskaičiuoti MOLAP ir didesnį ROLAP mastelį. HOLAP naudoja dvi duomenų bazes.

  1. Apibendrinti arba apskaičiuoti duomenys saugomi daugiamatėje OLAP kubelyje
  2. Išsami informacija saugoma reliacinėje duomenų bazėje.

Hibridinio OLAP pranašumai:

  • Ši OLAP rūšis padeda taupyti vietą diske, be to, ji išlieka kompaktiška, padedanti išvengti problemų, susijusių su prieigos greičiu ir patogumu.
  • Hibridinis HOLAP's naudoja kubo technologiją, kuri leidžia greičiau atlikti visų tipų duomenis.
  • ROLAP yra nedelsiant atnaujinami, o HOLAP vartotojai turi prieigą prie šių realiuoju laiku atnaujinamų duomenų. MOLAP padeda išvalyti ir konvertuoti duomenis, taip pagerindamas duomenų aktualumą. Tai atneša geriausius iš abiejų pasaulių.

Hibridinio OLAP trūkumai:

  • Didesnis sudėtingumo lygis : Pagrindinis HOLAP sistemų trūkumas yra tas, kad ji palaiko tiek ROLAP, tiek MOLAP įrankius ir programas. Taigi, tai yra labai sudėtinga.
  • Galimi sutapimai : yra didesnė tikimybė sutapti, ypač dėl jų funkcijų.

OLAP privalumai

  • OLAP yra visų rūšių verslo platforma, apimanti planavimą, biudžeto sudarymą, ataskaitų teikimą ir analizę.
  • Informacija ir skaičiavimai yra vienodi OLAP kube. Tai yra esminė nauda.
  • Greitai sukurkite ir išanalizuokite scenarijus „Kas būtų, jei būtų“
  • Lengvai ieškokite plačių ar konkrečių terminų OLAP duomenų bazėje.
  • OLAP teikia verslo modeliavimo įrankių, duomenų gavybos įrankių, našumo ataskaitų įrankių sudedamąsias dalis.
  • Leidžia vartotojams atlikti dalelių ir kauliukų kubelių duomenis pagal įvairius matmenis, matus ir filtrus.
  • Tai gerai analizuoti laiko eilutes.
  • Naudodamiesi OLAP, lengva rasti grupes ir išskirtinius rodiklius.
  • Tai galinga vizualizacijos analizės internete sistema, suteikianti greitesnį atsako laiką

OLAP trūkumai

  • OLAP reikalauja sutvarkyti duomenis į žvaigždžių arba snaigių schemą. Šias schemas sunku įgyvendinti ir administruoti
  • Viename OLAP kube negali būti daug matmenų
  • Su operacijų duomenimis negalima naudotis naudojant OLAP sistemą.
  • Bet kokį OLAP kubo pakeitimą reikia visiškai atnaujinti. Tai daug laiko reikalaujantis procesas

Santrauka:

  • OLAP yra technologija, leidžianti analitikams išgauti ir peržiūrėti verslo duomenis iš skirtingų taškų.
  • OLAP koncepcijos esmė yra OLAP kubas.
  • Įvairioms verslo programoms ir kitoms duomenų operacijoms reikia naudoti „OLAP Cube“.
  • OLAP yra pagrindiniai penki analitinių operacijų tipai: 1) sudedamoji 2) išskaidoma 3) dalis 4) kauliukai ir 5) „Pivot“
  • Trijų tipų plačiai naudojamos OLAP sistemos yra MOLAP, ROLAP ir Hybrid OLAP.
  • Stalinis OLAP, žiniatinklio OLAP ir mobilusis OLAP yra keletas kitų tipų OLAP sistemų.

Įdomios straipsniai...