Što je skladištenje podataka?
Skladištenje podataka jest elektroničko pohranjivanje velike količine podataka od strane tvrtke ili organizacije. Skladištenje podataka bitna je komponenta poslovne inteligencije koja koristi analitičke tehnike u poslovnim podacima.
Koncept skladištenja podataka uveli su 1988. IBM istraživači Barry Devlin i Paul Murphy. Kako se računalni sustavi postajali složeniji i rješavaju sve veće količine podataka, razvila se potreba za skladištenjem podataka. Ključna knjiga o skladištenju podataka je WH Inmonova „Izgradnja skladišta podataka“ koja je prvi put objavljena 1990. godine i od tada je više puta tiskana.
Kako funkcionira skladištenje podataka
Skladištenje podataka koristi se za pružanje boljeg uvida u rad poduzeća, uspoređujući podatke objedinjene iz višestrukih heterogenih izvora. Skladište podataka je dizajnirano za pokretanje upita i analiza povijesnih podataka dobivenih iz transakcijskih izvora.
Jednom kada se podaci ugrade u skladište, ne mijenjaju se i ne mogu ih mijenjati jer skladište podataka analizira događaje koji su se već dogodili usredotočujući se na promjene podataka tijekom vremena. Podaci koji se skladište moraju biti pohranjeni na siguran, pouzdan, lagan način pretraživanja i lako upravljanje.
Postoje određeni koraci koji se poduzimaju za stvaranje skladišta podataka. Prvi korak je ekstrakcija podataka, koja uključuje prikupljanje velikih količina podataka iz više izvornih točaka. Nakon sastavljanja podataka prolazi se kroz čišćenje podataka, proces češljanja podataka za pogreške i ispravljanje ili isključenje pronađenih pogrešaka.
Očišćeni podaci pretvaraju se iz formata baze podataka u oblik skladišta. Nakon pohranjivanja u skladište, podaci prolaze kroz sortiranje, konsolidaciju, zbrajanje itd. Tako da su koordiniraniji i lakši za upotrebu. S vremenom se u skladište dodaje više podataka kako se višestruki izvori podataka ažuriraju.
Ključni odvodi
- Skladištenje podataka je elektroničko pohranjivanje velike količine podataka od strane tvrtke ili organizacije. Skladište podataka je dizajnirano za pokretanje upita i analiza povijesnih podataka dobivenih iz transakcijskih izvora za potrebe poslovne inteligencije i podataka. Skladištenje podataka koristi se za pružanje većih uvid u rad poduzeća usporedbom podataka objedinjenih iz višestrukih heterogenih izvora.
Posebna razmatranja: Mining podataka
Poduzeća mogu skladištiti podatke za korištenje u istraživanju i vađenju podataka tražeći obrasce informacija koji će im pomoći da poboljšaju svoje poslovne procese. Dobar sustav skladištenja podataka također može olakšati pristup različitim podacima odjela unutar tvrtke.
Na primjer, skladište podataka može omogućiti tvrtki da lako procijeni podatke prodajnog tima i pomogne u donošenju odluka o tome kako poboljšati prodaju ili pojednostaviti odjel. Posao se može odlučiti usredotočiti na navike potrošnje svojih kupaca kako bi bolje pozicionirao svoje proizvode i povećao prodaju.
Pomoću skladištenja podataka, tvrtka može prikupiti povijesne podatke o potrošnji svojih kupaca u posljednjih - recimo, 20 godina - i pokrenuti analitiku na tim podacima. Dobivene informacije mogle bi pružiti uvid u sklonosti svojih potrošača; doba dana, mjeseca ili godine s većom prodajom; ili najveći potrošač u godini.
Učinkovito pohranjivanje podataka i upravljanje njima su također procesi, poput pokretanja rezervacija putovanja i korištenja automatiziranih strojeva za obradu podataka.
Proces rudarjenja podataka raščlanjuje se na pet koraka:
- Organizacije prikupljaju podatke i unose ih u svoja skladišta podataka. Potom pohranjuju i upravljaju podacima, bilo na internim poslužiteljima ili u oblaku. Poslovni analitičari, menadžerski timovi i stručnjaci za informatičku tehnologiju pristupaju podacima i određuju kako ih žele organizirati. Aplikacijski softver zatim razvrstava podatke na temelju rezultata korisnika. Krajnji korisnik konačno prikazuje podatke u formatu za jednostavno dijeljenje, poput grafikona ili tablice.
Skladištenje podataka u odnosu na baze podataka
Skladište podataka nije nužno isti koncept kao standardna baza podataka. Baza podataka je transakcijski sustav koji je postavljen za nadgledanje i ažuriranje podataka u stvarnom vremenu kako bi imali na raspolaganju samo najnovije podatke. Skladište podataka programirano je za agregiranje strukturiranih podataka tijekom određenog vremenskog razdoblja. Na primjer, baza podataka može imati samo najnoviju adresu kupca, dok skladište podataka može imati sve adrese na kojima je kupac živio posljednjih 10 godina.