
Preglejmo razliko med podatkovnim rudarjenjem in podatkovnim skladiščenjem s pomočjo primerjalne tabele, prikazane spodaj.
Primerjalna tabela
Podlaga za primerjavo | Data Mining | Skladiščenje podatkov |
---|---|---|
Osnovno | Podatkovno rudarjenje je proces za pridobivanje ali ekstrahiranje pomembnih podatkov iz baze podatkov / podatkovnega skladišča. | Podatkovno skladišče je skladišče, kjer so informacije iz več virov shranjene pod eno shemo. |
Opredelitev podatkovnega rudarjenja
Data Mining je proces za odkrivanje znanja, ki ga v vaši podatkovni zbirki nikoli niste pričakovali . Z uporabo tradicionalnega orodja za poizvedbe lahko pridobite znane podatke iz podatkov. Ampak, Data mining vam ponuja način za pridobivanje skritih informacij iz podatkov . Podatkovno rudarjenje ekstrahira pomembne informacije iz baze podatkov, ki jih je mogoče uporabiti za odločanje .
Odkrivanje znanja v podatkovnih bazah, imenovanih KDD, kaže odnos in vzorec . Povezava je lahko med dvema ali več različnimi predmeti, med atributi istega objekta. Vzorec je še en rezultat podatkovnega rudarjenja, ki prikazuje redno in razumljivo zaporedje informacij, ki pomagajo pri odločanju.
Ukrepe, ki so vključeni v KDD, tj. Odkrivanje znanja v podatkovnih bazah, lahko povzamemo kot prvo, izbiro podatkovnega niza, na katerem je potrebno izvesti podatkovno rudarjenje. Naprej je predobdelava, ki vključuje odstranitev neskladnih podatkov. Nato pride do preoblikovanja podatkov, kjer se podatki pretvorijo v obliko, primerno za podatkovno rudarjenje. Sledi podatkovno rudarjenje, pri čemer se za podatke uporabljajo algoritmi za rudarjenje podatkov. In končno, interpretacija in vrednotenje, ki zajemata izločanje odnosa ali vzorca med podatki.
Podatkovno rudarjenje se dobro prilega v okolje podatkovnega skladišča, ki je shranilo podatke na agregirani in povzeti način. Podatke v podatkovnem skladišču je mogoče preprosto izkopati
Definiranje skladiščenja podatkov
Skladišče podatkov je osrednje mesto, kjer so informacije, zbrane iz več virov, shranjene v eni enotni shemi . Podatki se najprej zberejo, različni viri podjetja se nato očistijo in transformirajo ter shranijo v podatkovnem skladišču. Ko se podatki vnesejo v podatkovno skladišče, ostane tam dolgo časa in so dostopni preko časa.
Skladišče podatkov je popolna mešanica tehnologij, kot so modeliranje podatkov, zajemanje podatkov, upravljanje podatkov, upravljanje metapodatkov, upravljanje trgovin z razvojnimi orodji . Vse te tehnologije podpirajo funkcije, kot so ekstrakcija podatkov, transformacija podatkov, shranjevanje podatkov, zagotavljanje uporabniških vmesnikov za dostop do podatkov .
Podatkovno skladišče ni izdelek ali programska oprema, temveč informacijsko okolje, ki zagotavlja informacije, kot je integriran pogled na podjetje. Dostopate lahko do trenutnih in zgodovinskih podatkov podjetja, ki pomagajo pri odločanju. Podpira transakcije, sprejete za sprejemanje odločitev, brez vpliva na operativne sisteme. Je prilagodljiv vir za pridobivanje strateških informacij.
Ključne razlike med podatkovnim rudarjenjem in skladiščenjem podatkov
- Obstaja osnovna razlika, ki ločuje rudarjenje podatkov in skladiščenje podatkov, kar pomeni, da je rudarjenje podatkov proces pridobivanja pomembnih podatkov iz velike baze podatkov ali podatkovnega skladišča. Vendar pa podatkovno skladišče zagotavlja okolje, v katerem so podatki shranjeni v integrirani obliki, ki olajšuje rudarjenje podatkov za učinkovitejše pridobivanje podatkov.
Sklep:
Podatkovno rudarjenje se lahko izvede le, če je dobro integrirana velika podatkovna baza, tj. Podatkovno skladišče. Torej mora biti podatkovno skladišče končano pred rudarstvom podatkov. Podatkovno skladišče mora imeti informacije v dobro integrirani obliki, tako da lahko rudarjenje podatkov ekstrahira znanje na učinkovit način.