Kun on kyse alustoista, joille data-analytiikkapino rakennetaan, yrityksillä on useita vaihtoehtoja. Tietojen hallinnoijat voivat harkita keskitettyä tietovarastoa, erikoistuneempien tietomarkkinoiden kokoelmaa tai näiden yhdistelmää. Vaikka tietovarastot ja datamarkkinat ovat melko samankaltaisia, ne palvelevat melko erilaisia tarkoituksia, ja organisaatio voi käyttää toista tai molempia tietyissä käyttötapauksissa. Toinen vaihtoehto on datajärvi, josta puuttuu datavaraston tai datamarketin skeemapohjainen rakenne.
Data Warehousing vs Data Marts
Ero tietovaraston ja datamarkkin välillä on se, että edellinen on tietokanta, kun taas jälkimmäinen on projektisuuntautunut tietokanta. Toinen ero Tietovaraston ja Data martin välillä on se, että tietovarastolla on laaja ja Data martin kapea.
Tietovarasto, joka tunnetaan usein yhtenä totuuden lähteenä, on arkisto, joka sisältää kaikki organisaation nykyiset ja historialliset tiedot monista lähteistä. Se on tärkeä osa data-analytiikka-arkkitehtuuria, koska se luo sopivan ympäristön päätöksenteolle, analytiikkaan, liiketoimintatiedolle ja tiedon louhinnalle.
Tietovaraston liiketoimintalähtöinen osajoukko on datakauppa. Datamarket on pienennetty versio tietovarastosta, joka sisältää tiedot, jotka ovat kriittisiä ja joita tietylle tiimille tai rajoitetulle käyttäjäryhmälle organisaation sisällä vaativat. Datamarketin käytön tavoitteena on indeksoida tietoja ja mahdollistaa haut tietyiltä yrityksen alueilta sekä vastata tietyn organisaation käyttäjäryhmän vaatimuksiin.
Data Warehousingin ja Data Martsin vertailutaulukko
Vertailuparametrit | Tietovarastointi | Data Marts |
Järjestelmän tyyppi | Keskitetty. | Hajautettu. |
Data | Yksityiskohtainen lomake. | Yhteenveto lomake. |
Denormalisointi | Hieman denormalisoitunut | Erittäin denormalisoitunut |
Tietomalli | Ylhäältä alas | Alhaalta ylös |
Luonto | Mukautuva, tietokeskeinen ja pitkäaikainen. | Rajoitettu, projektilähtöinen ja sen käyttöikä on rajallinen. |
Mitä on tietovarasto?
Data Warehouse kuuluu relaatiotietokannan hallintajärjestelmän luokkaan, joka on kehitetty vastaamaan tapahtumien käsittelyjärjestelmien vaatimuksia. Se on laaja käsite, joka viittaa mihin tahansa keskitettyyn tietovarastoon, jota voidaan käyttää kaupallisiin tarkoituksiin. Se on tietokanta, joka pitää kirjaa tiedoista, joita voidaan käyttää päätöksentekoon.
Se on kokoelma päätöksenteon apuvälineitä, jotka on suunniteltu auttamaan tietotyöntekijöitä (johtajat, johtajat ja analyytikot) tekemään parempia ja tietoisempia päätöksiä. Tämän seurauksena Data Warehousing tarjoaa järjestelmiä ja työkaluja, joiden avulla yritysjohtajat voivat järjestelmällisesti järjestää, tulkita ja soveltaa tietojaan strategisten valintojen tekemiseen. Tietovarastoon voidaan sijoittaa useita tietokantoja.
Tiedot on järjestetty taulukoihin ja sarakkeisiin kunkin tietokannan sisällä. Jokaisessa sarakkeessa määritetään tietojen kuvaus, kuten kokonaisluku, tietokenttä tai teksti. Kaavioita, joita voidaan ajatella kansioksi, voidaan käyttää taulukoiden järjestämiseen. Tiedot syötetään ja tallennetaan skeeman lukuisiin taulukoihin. Kyselytyökalut käyttävät skeemaa selvittääkseen, mitä tietotaulukoita tarkastella ja analysoida.
Käyttäjät voivat hyödyntää tietovarastoa analysoidakseen ja parantaakseen organisaationsa suorituskykyä paremmin. Kun tietokonejärjestelmät monimutkaistuvat ja vaativat suurempien tietomäärien hallintaa, tietovarastoinnin tarve kasvoi. Tietovarastointi sen sijaan ei ole uusi käsite.
Mikä Data Marts on?
Datamart on aihekohtainen tietokanta, joka on tyypillisesti osioitu osajoukko suuremmasta tietovarastosta. Datamarketilla on usein osa tiettyä liiketoimintayksikköä, kuten myyntiä, rahoitusta tai markkinointia, koskevia tietoja. Datamarketit auttavat yrityksiä toimimaan tehokkaammin tarjoamalla pääsyn tärkeisiin tietoihin tietovarastossa tai operatiivisessa tietovarastossa päivissä kuukausien tai vuosien sijaan.
Datamarket on kustannustehokas ratkaisu saada nopeasti mielekkäitä oivalluksia, sillä se sisältää vain tietylle toimialalle relevanttia dataa. Riippuvaiset, riippumattomat ja hybriditietokeskukset ovat kolme luokkaa. Ne luokitellaan riippuen niiden suhteesta tietovarastoon ja järjestelmän rakentamiseen käytetyistä tietolähteistä.
Olemassa olevasta yrityksen tietovarastosta muodostetaan riippuvainen datakauppa. Se on ylhäältä alas -menetelmä, joka alkaa tallentamalla kaikki yrityksen tiedot keskitettyyn paikkaan ja poistaa sitten selkeästi määritellyn osan tiedosta, kun sitä tarvitaan analysointia varten. Itsenäinen datakauppa on itsenäinen järjestelmä, joka keskittyy tiettyyn aiheeseen tai liiketoimintatoimintoon ja joka on rakennettu ilman tietovaraston apua.
Tiedot haetaan sisäisistä tai ulkoisista tietolähteistä (tai molemmista), käsitellään ja tallennetaan sitten datamartin arkistoon, jossa niitä säilytetään, kunnes niitä tarvitaan liiketoiminta-analytiikkaan. Hybriditietokauppa kerää tietoa nykyisestä tietovarastosta sekä muista toiminnallisista lähdejärjestelmistä.
Tärkeimmät erot Data Warehousingin ja Data Martsin välillä
- Tiedot on sijoitettu tietovarastoon, joka on yksi keskitetty arkisto. Datamarkkinat sen sijaan tallennetaan käyttäjäalueelle hajautetusti.
- Tietovarasto on tietojen kokoelma täydellisimmässä muodossaan. Datamarkkinat puolestaan käsittelevät yhteenvetoa ja valittua dataa.
- Tietovaraston tiedot ovat minimaalisesti denormalisoituja, mutta datakaupan tiedot ovat merkittävästi denormalisoituja.
- Tietovaraston rakentamiseen käytetään ylhäältä alas -menetelmää. Alhaalta ylös -strategiaa hyödynnetään toisaalta datamarkkinoiden rakentamiseen.
- Tietovaraston olemus on mukautuva, tietolähtöinen ja pitkäaikainen. Datamarket sen sijaan on rajoitettu, projektilähtöinen ja sen käyttöikä on rajallinen.
Johtopäätös
Lyhyesti sanottuna tietovarasto on massiivinen tallennustietokanta, joka voi muodostaa yhteyden lähes mihin tahansa tietolähteeseen. Datamarket puolestaan on tietovaraston alaosasto, jossa on vähemmän tallennuskapasiteettia ja joka on suunniteltu vastaamaan datan kuluttajien tiettyä toimialaa koskeviin kysymyksiin.
Tietovarastot tarjoavat yritysnäkökulman, yhden ja keskitetyn tallennusjärjestelmän, luontaisen suunnittelun ja sovellusriippumattomuuden, kun taas tietovarastot tarjoavat osastonäkymän ja hajautetun tallennustilan. Koska tietovarastot ovat niin valtavia ja monimutkaisia, on olemassa huomattava epäonnistumisen mahdollisuus ja vaikeuksia niiden perustamisessa.
Toisaalta datakauppa on yksinkertainen rakentaa ja siihen liittyvä vikariski on pieni, mutta datakauppa voi pirstoutua.