O Que São E Qual A Diferença Entre Tabela Fato e Tabela Dimensão?

0
5541

Última Atualização 23 de março de 2021

QUESTÃO CERTA: Com relação à teoria de modelagem multidimensional, a figura abaixo ilustra um conjunto de tabelas modeladas obedecendo o esquema em estrela (Star Schema). Nestas condições, são ditas tabela FATO e DIMENSÃO respectivamente: VENDAS e LOCAL

Tabela Fato – > contém as chaves estrangeiras (FK);

Tabela Dimensão -> Chaves primarias (PK);

STAR SCHEMA = tabela desnormalizada;

Tabela fato possui muitas PK;

QUESTÃO ERRADA:  na modelagem multidimensional, caso haja as dimensões tempo e local ligadas a fato, é necessário optar-se por uma delas, pois somente uma dimensão poderá estar presente em cada modelo.

Uma tabela fato tem que ter, no mínimo, 2 tabelas dimensão.

QUESTÃO ERRADA: Os fatos e dimensões não são tabelas do banco de dados, pois, no modelo dimensional, são componentes do cubo de um data warehouse.

Os fatos e dimensões são tabelas dos bancos de dados multidimensionais estruturados em uma base relacional.

  • Requisitos: verificação da existência dos dados necessários para a solução
  • Modelagem do DW (Data Warehouse): organização e armazenamento destes dados de maneira a otimizar a análise.
  • Processos de ETL: extração, transformação e carregamento. Os dados são extraídos de onde estão arquivados, transformados conforme estabelecido na organização anterior e carregados no DW (data warehouse).
  • Cubos: cruzamento dos dados, levando as respostas e insights esperados.
  • Dashboards: apresentação do resultado.

Aqui utilizamos o termo cubo apenas por conta de sua grande utilização na área, porém é cada vez mais comuns analistas de dados que nunca ouviram falar nesta expressão. Os cubos OLAP (Online Analytical Processing) recebem esse nome pelo fato dos dados possuírem uma organização semelhante a um cubo, com informações agregadas por dimensões e um fato, sendo facilmente localizadas respostas a partir da intersecção das dimensões. Hoje podemos enxergar esta etapa como sendo a análise efetiva dos dados, que podem ser facilmente consultados no DW, levando as respostas que o dashboard deve exibir.

QUESTÃO CERTA: Diferentemente dos bancos de dados transacionais, a modelagem de bancos de dados multidimensionais é caracterizada pelo uso de tabelas fato e tabelas periféricas, que armazenam, respectivamente, a transação e as dimensões.

QUESTÃO CERTA: Ao construir um modelo de dados para um data warehouse de sua empresa, um desenvolvedor viu-se às voltas com três tabelas relacionais: venda, cliente e vendedor. Ao fazer uma transformação para o modelo estrela, ele deve organizar: venda, como tabela fato; cliente e vendedor, como tabelas dimensão.

Dados descritivos: Tabelas Dimensões;

Dados escalares (quantitativos): Tabela Fato.

Venda = Tabela Fato; (é a tabela dominante)

Cliente e Vendedor = Tabelas Dimensão (tabelas auxiliares)

O Star schema ou esquema em estrela é uma metodologia de modelagem de dados utilizada do desenho de um Data warehouse.

Os dados são modelados em tabelas dimensionais ligadas a uma tabela de fatos. As tabelas dimensionais contêm as características de um evento. A tabela de fatos armazena os fatos ocorridos e as chaves para as características correspondentes, nas tabelas dimensionais.

O nome foi adotado devido à semelhança do modelo como uma estrela. No “centro” da estrela, existe a o que chamou tabela de fatos, rodeada por tabelas auxiliares, chamadas de dimensões. A tabela de fato conecta-se as demais dimensões por múltiplas junções e as tabelas de dimensões conectam-se com apenas uma junção a tabela de fatos.

Desta forma a consulta ocorre inicialmente nas tabelas de dimensão e depois nas tabelas de fatos, assegurando a precisão dos dados por meio de uma estrutura de chaves onde não é preciso percorrer todas as tabelas, garantindo um acesso mais eficiente de com melhor desempenho.

Tabela fato:

É uma tabela central que é, basicamente, uma coleção de valores-chave de tabelas dimensões;

Tudo que pode ser representado por valor aditivo;

Valores números (métricas ou medidas);

É evolutivo e muda suas medidas com o tempo.

Tabela Dimensão

Elementos, entidades, que participam de algum fato, o “por” dos dados;

Lembrando que a tabela Fato possui uma de suas características ser referenciada por chave estrangeira FK;

Dimensão possui a Chave Primária.

QUESTÃO ERRADA: As dimensões na modelagem da base de dados podem ser do tipo aditivas e não aditivas, sendo ambas oriundas da modelagem Snow Flake.

Pode ser oriunda do Star Schema também.

QUESTÃO CERTA: Para melhor manter o controle sobre identificadores de registro de ambientes de data warehouse (armazém de dados), em geral recomenda-se a geração de chaves substitutas (surrogate keys). Assim, cada junção entre as tabelas de dimensão e tabelas fato

Advertisement
em um ambiente de data warehouse deve se basear nessas chaves substitutas, e não nas chaves naturais existentes.

A Surrogate Key é uma chave artificial e auto incremental.

A palavra artificial vem do tipo, porque ela não existe em lugar nenhum, não está lá no transacional como a Natural Key, ela é criada no Data Warehouse.

E é auto incremental porque toda vez que é chamada, troca de número, então ela começa com 1 e vai indo para 2, 3, 4, e assim por diante.

Resumindo: ela é a famosa sequence do banco de dados ou a sequência no Excel.

Uma Surrogate Key (chave substituta) nada mais é que um campo com as características de uma Primary Key, e é gerada automaticamente na hora da carga, quando você carrega a dimensão no ETL.

Na tabela fato essa Surrogate Key vai ser uma Foreign Key (chave estrangeira), a chave que serve para relacionar os dados entre duas tabelas, sempre apontando para uma Primary Key (chave primária) em outra tabela, que no caso da dimensão, vai ser a Surrogate Key.

Assim, a tabela fato receberá apenas o código da Surrogate Key da linha que ela está referenciando e não os atributos.

A Surrogate Key

– Tem as características de uma Primary Key.

– É utilizada para referenciar a dimensão na tabela fato

– É auto incremental

– É uma chave artificial

– É criada no Data Warehouse

– Não pode se repetir

QUESTÃO CERTA: Ao se modelar uma tabela-fato, deve-se considerar que a chave primária é composta e que a dimensão tempo sempre será parte integrante dessa chave.

Tempo é uma dimensão importante que TODOS os DW’s devem suportar.

Na modelagem dimensional, a chave primária da tabela-fato é composta pelas chaves primárias das tabelas-dimensão que estão ligadas diretamente a esse fato. Além disso, toda tabela-fato deve ter uma dimensão tempo associada a ela. Dessa forma podemos afirmar que a questão está correta. Dimensão tempo é sempre representada como parte da chave primária.

QUESTÃO ERRADA: A tabela agregada dimensão é composta de atributos e contém a descrição do negócio.

tabela agregada é criada com dados da tabela fato, alterando sua granularidade, ou seja, ela sumariza os dados, gerando uma tabela menor.

As tabelas de dimensão representam entidades de negócios e constituem as estruturas de entrada que servem para armazenar informações como tempo, geografia, produto, cliente. As tabelas de dimensão geralmente representam relacionamentos hierárquicos no negócio (por exemplo, produtos se associam a subcategorias que se associam a categorias). Dizemos que elas possuem característica qualitativa dentro de um DW.

QUESTÃO ERRADA: Considerando-se o modelo multidimensional a seguir, é correto afirmar que Quantidade e Valor são dimensões de Itens.

Na modelagem dimensional, temos modelos cuja tabela central é a tabela fato ou tabela de fatos, que fica circundada por dimensões. A fato contém os registros a respeito dos eventos ocorridos, contendo as chaves estrangeiras que referenciam as dimensões e as medidas ou os fatos registrados.

No caso do item acima, Quantidade e Valor são exemplos dessas medidas, não de dimensões. As dimensões do modelo são Produto, Data, Loja, Atendente e Promoção