Priporočena, 2024

Izbira Urednika

Razlika med tabelo dejstev in tabelo razsežnosti

Tabela dejstev in tabela razsežnosti sta bistvena dejavnika za oblikovanje sheme . Zapis tabele dejstev je kombinacija atributov iz različnih tabel razsežnosti. Tabela dejstev pomaga uporabniku analizirati poslovne razsežnosti, ki mu pomagajo pri odločanju za izboljšanje svojega poslovanja. Po drugi strani pa tabele razsežnosti pomagajo tabeli dejstev za zbiranje dimenzij, po katerih je treba sprejeti ukrepe.

Točka, ki razlikuje tabelo faktorjev in tabelo razsežnosti, je, da tabela dimenzij vsebuje atribute, po katerih so ukrepi sprejeti v tabeli dejstev . Obstajajo še drugi dejavniki, ki ustvarjajo razlike med tabelo dejstev in tabelo razsežnosti, da si jih ogledate, si oglejmo primerjalno tabelo spodaj.

Primerjalna tabela

Podlaga za primerjavoTabela dejstevTabela razsežnosti
OsnovnoTabela dejstev vsebuje meritve vzdolž atributov tabele dimenzij.Tabela dimenzij vsebuje atribute, po katerih tabela dejstev izračuna metriko.
Atributi in zapisiTabela dejstev vsebuje manj atributov in več zapisov.Tabela dimenzij vsebuje več atributov in manj zapisov.
Velikost tabeleTabela dejstev raste navpično.Dimenzijska tabela raste vodoravno.
KljučTabela dejstev vsebuje primarni ključ, ki je združitev primarnih ključev vse tabele dimenzij.Vsaka tabela dimenzij vsebuje njen primarni ključ.
UstvarjanjeTabelo dejstev lahko ustvarite samo, ko so tabele dimenzij dokončane.Najprej je treba ustvariti tabele razsežnosti.
ShemaShema vsebuje manj število tabel dejstev.Shema vsebuje več število tabel razsežnosti.
LastnostiTabela dejstev lahko vsebuje podatke v numeričnem in besedilnem formatu.Tabela dimenzij vedno vsebuje atribute v besedilni obliki.

Opredelitev tabele dejstev

Tabela dejstev je tabela, ki vsebuje meritve vzdolž atributov tabel dimenzij. Vsebuje lahko informacije na najnižji možni ravni. Nekatera tabela dejstev vsebuje le zbirne podatke, imenovane tabela združenih dejstev . Tabela dejstev skoraj vsebuje podatke z žigom datuma . Razpravljamo o značilnostih tabele dejstev.

Sklopni ključ
Tabela dejstev vsebuje Concatenated ključ, ki je združevanje primarnih ključev vseh tabel dimenzij. Združena tabela dejstev mora enolično identificirati vrstico v tabeli dejstev.

Data Grain
Podatkovna zrna kažejo, kako globoko so bile shranjene meritve v tabeli. Podatkovno žito mora biti na najvišji možni ravni.

Dodatni ukrepi
Atributi tabele dejstev so lahko popolnoma aditivni ali pol-aditivi . Popolnoma aditivni ukrepi so tisti, ki jih je mogoče enostavno povzeti za vse dimenzije v tabeli dejstev. Na primer quantity_ordered, je atribut, ki ga lahko povzamemo za vse dimenzije. Podobno lahko vzamemo skupno količino, za določeno stranko, regijo, datum, blagovno znamko itd. Semiaditivni ukrepi so tisti, ki jih lahko povzamemo po nekaterih razsežnostih tabele dejstev, ne pa vseh dimenzij. Podobno se bilančna vsota ne more povzeti skozi časovno razsežnost, saj se spreminja skozi čas.

Redki podatki
Včasih lahko vidimo zapise v tabeli dejstev, ki ima atribute z ničelnimi merami . Na primer, na počitnicah ne more biti nobenega naročila. Torej bodo atributi za ta datum imeli nične ukrepe. Za takšno evidenco ni potrebno hraniti merila, ker ne zagotavlja nobenih informacij.

Degenerirane dimenzije
Včasih lahko naletite na nekaj razsežnosti v tabeli dejstev, ki sploh niso aditivni. Na primer, številka naročila, customer_id, ti tipi dimenzij ne morete dodati. V tem primeru pa morate v tem mesecu najti naročilo, ki ga je naredil določen kupec; potem boste potrebovali customer_id za povezavo vašega iskanja. Te vrste, če se atributi ali dimenzije tabele dejstev imenujejo Degenerated Dimension .

Opredelitev tabele razsežnosti

Tabela dimenzij je ključna komponenta za začetno shemo. Tabela dimenzij vsebuje atribute, ki predstavljajo dimenzije, vzdolž katerih se meritev izvede v tabeli dejstev. Nadalje bomo razpravljali o nekaterih značilnostih tabele razsežnosti.

Atributi in tipke
Vsaka tabela Dimenzije mora imeti primarni ključ, ki enolično identificira vsak zapis tabele. Pogosto opazimo, da tabela dimenzij vsebuje veliko atributov. Zato se zdi, da je širok, tj. Ko ustvarite tabelo razsežnosti, jo boste našli horizontalno .

Vrednosti atributov
Vrednosti atributov v tabeli razsežnosti so redko številčne, večino časa, ko najdete vrednosti v atributih, so v besedilnem formatu . Na primer ime izdelka, blagovna znamka, kategorija, podkategorija itd.

Razmerje med atributi
Pogosto lahko opazujete, da atributi, na katere naletite v tabeli razsežnosti, niso neposredno povezani. Podobno, Product_brand ne sme ničesar storiti z paketom_datuma, vendar sta lahko oba atributa tabele razsežnosti izdelka.

Normalizacija
Tabela dimenzij naj ne bi bila normalizirana . To je zato, ker bi normalizacija tabele ustvarila veliko vmesnih tabel. Ko poizvedba prevzame atribut iz tabele z dimenzijami in povrne meritve po tisti za tabelo dejstev, mora poizvedba potekati skozi vmesne tabele, ki postanejo neučinkovite. Zato tabele dimenzij niso normalizirane.

Vrtanje, navijanje
Atributi tabele razsežnosti omogočajo, da dobite podrobnosti bodisi s prečenjem iz višje ravni združenih atributov na atribute nižje ravni. Na primer, če želite poiskati celotno prodajo v regiji, se lahko odločite za prodajo po državi, mestu, pošti. Lahko celo zvitek, da bi našli skupno prodajo najprej zip, nato po mestu in nato stanju.

Več hierarhije
Pogosto tabela razsežnosti ponuja več hierarhij. Na primer, za prodajno trgovino imamo tabelo dimenzij izdelka. Zdaj imamo dva oddelka za marketing in računovodstvo.

Oddelek za trženje bo med atributi tabele razsežnosti izdelka v določeni hierarhiji določil meritve za tabelo dejstev.

Po drugi strani bo računovodska služba med atributi tabele razsežnosti izdelka v različnih hierarhijah pridobila meritve za tabelo dejstev.

Torej mora imeti tabela razsežnosti več hierarhij ali stopnjo združevanja atributov, ki uporabniku omogočajo vrtanje navzgor po kateri koli več hierarhiji.

Zapisi
Čeprav ima tabela dimenzij preveč atributov, ima manj zapisov.

Ključne razlike med tabelo dejstev in tabelo razsežnosti

  1. Tabela dejstev vsebuje meritve vzdolž dimenzije / atributov tabele dimenzij.
  2. Tabela dejstev vsebuje več zapisov in manj atributov v primerjavi z tabelo dimenzij, medtem ko tabela dimenzij vsebuje več atributov in manj zapisov.
  3. Tabela velikosti tabele se povečuje navpično, medtem ko se velikost tabele dimenzijske tabele poveča vodoravno.
  4. Vsaka tabela dimenzij vsebuje primarni ključ za identifikacijo vsakega zapisa v tabeli, medtem ko tabela dejstev vsebuje združen ključ, ki je kombinacija vseh primarnih ključev vse tabele razsežnosti.
  5. Pred izdelavo tabele dejstev je treba zabeležiti tabelo razsežnosti.
  6. Shema vsebuje manj tabel dejstev, vendar več tabel razsežnosti.
  7. Atributi v tabeli dejstev so tako numerični kot tekstualni, vendar imajo atributi tabele razsežnosti samo besedilne atribute.

Sklep:

Oba sta enako pomembna za izdelavo sheme, vendar mora biti tabela dimenzij zabeležena pred tabelo dejstev. Ker je nemogoče ustvariti tabelo dejstev z našimi dimenzijami.

Top