Kas yra ETL?
ETL yra „Extract“, „Transform“ ir „Load“ santrumpa. Šiame procese ETL įrankis išskiria duomenis iš skirtingų RDBMS šaltinių sistemų, tada transformuoja duomenis, pavyzdžiui, taikydamas skaičiavimus, sujungimus ir pan., Tada įkelia duomenis į duomenų saugyklos sistemą.
ETL duomenys yra srautai iš šaltinio į tikslą. ETL proceso transformavimo variklis rūpinasi bet kokiais duomenų pakeitimais.
Kas yra ELT?
ELT yra skirtingas būdas žiūrėti į įrankių požiūrį į duomenų judėjimą. Užuot transformavusi duomenis prieš juos parašant, ELT leidžia tikslinei sistemai atlikti transformaciją. Duomenys pirmiausia nukopijuoti į tikslą ir tada transformuoti į vietą.
ELT paprastai naudojamas su „SQL“ neturinčiomis duomenų bazėmis, pvz., „Hadoop“ grupe, duomenų įrenginiu ar debesies diegimu.
PAGRINDINIAI SKIRTUMAI
- ETL reiškia ištraukti, transformuoti ir įkelti, o ELT - ištraukti, įkelti, transformuoti.
- ETL įkelia duomenis pirmiausia į sustojimo serverį ir paskui į tikslinę sistemą, o ELT duomenis įkelia tiesiai į tikslinę sistemą.
- ETL modelis naudojamas vietiniams, reliaciniams ir struktūrizuotiems duomenims, o ELT - keičiamo dydžio debesies struktūrizuotiems ir nestruktūrizuotiems duomenų šaltiniams.
- ETL daugiausia naudojamas nedideliam duomenų kiekiui, o ELT - dideliems duomenų kiekiams.
- ETL neteikia duomenų ežero palaikymo, o ELT teikia duomenų ežero palaikymą.
- ETL yra lengva įgyvendinti, o ELT reikia nišinių įgūdžių, kad juos būtų galima įgyvendinti ir palaikyti.
Skirtumas tarp ETL ir ELT
ETL ir ELT procesas skiriasi šiais parametrais:
Parametrai | ETL | ELT |
---|---|---|
Procesas | Duomenys transformuojami sustojimo serveryje ir perkeliami į „Datawarehouse DB“. | Duomenys lieka duomenų saugyklos DB. |
Kodo naudojimas | Naudojama
| Naudojamas dideliems duomenų kiekiams |
Transformacija | Transformacijos atliekamos ETL serveryje / sustojimo srityje. | Transformacijos atliekamos taikinio sistemoje |
Laiko apkrova | Duomenys pirmiausia įkeliami į etapus, o vėliau įkeliami į tikslinę sistemą. Intensyvus laikas. | Duomenys į tikslinę sistemą įkeliami tik vieną kartą. Greičiau. |
Laiko transformacija | ETL procesas turi laukti, kol baigsis transformacija. Didėjant duomenų dydžiui, transformacijos laikas ilgėja. | ELT procese greitis niekada nepriklauso nuo duomenų dydžio. |
Laiko priežiūra | Ją reikia prižiūrėti, nes reikia pasirinkti duomenis, kuriuos norite įkelti ir transformuoti. | Mažai priežiūros, nes duomenys visada prieinami. |
Įgyvendinimo sudėtingumas | Ankstyvoje stadijoje, lengviau įgyvendinti. | Norint įgyvendinti ELT procesą, organizacija turėtų išmanyti įrankius ir ekspertų įgūdžius. |
Duomenų sandėlio palaikymas | ETL modelis, naudojamas vietoje, reliaciniams ir struktūriniams duomenims. | Naudojama keičiamoje debesų infrastruktūroje, palaikančioje struktūrizuotus, nestruktūruotus duomenų šaltinius. |
„Data Lake“ parama | Nepalaiko. | Leidžia naudoti „Data lake“ su nestruktūrizuotais duomenimis. |
Sudėtingumas | ETL procesas įkelia tik svarbius duomenis, nustatytus projektavimo metu. | Šis procesas apima kūrimą iš atgalinio atgalinio ir tik atitinkamų duomenų įkėlimą. |
Kaina | Didelės išlaidos mažam ir vidutiniam verslui. | Mažos įėjimo išlaidos naudojant internetinę programinę įrangą kaip paslaugų platformą. |
Paieškos | ETL procese reikia pateikti faktus ir matmenis sustojimo vietoje. | Visi duomenys bus prieinami, nes ištraukimas ir įkėlimas vyksta vienu veiksmu. |
Suvestinės | Sudėtingumas padidėja papildomu duomenų kiekiu duomenų rinkinyje. | Tikslinės platformos galia gali greitai apdoroti didelį duomenų kiekį. |
Skaičiavimai | Perrašo esamą stulpelį arba Reikia pridėti duomenų rinkinį ir perkelti į tikslinę platformą. | Apskaičiuotą stulpelį lengvai pridėkite prie esamos lentelės. |
Brandumas | Procesas naudojamas daugiau nei du dešimtmečius. Tai gerai dokumentuota ir geriausia praktika yra lengvai prieinama. | Santykinai nauja koncepcija ir sudėtinga įgyvendinti. |
Aparatinė įranga | Daugumai įrankių taikomi unikalūs aparatūros reikalavimai, kurie yra brangūs. | „Saas“ aparatūros kaina nėra problema. |
Nestruktūrizuotų duomenų palaikymas | Dažniausiai palaiko reliacinius duomenis | Nestruktūrizuotų duomenų palaikymas yra lengvai prieinamas. |