Caderno de Prova

O Que É Tabela Fato? (Conceito, Definição e Exemplos)

A tabela fato é a principal tabela do Data Warehouse, ela vai conectar nas dimensões. Nessa tabela são armazenadas duas coisas: as métricas, que são os fatos propriamente ditos, e as foreign keys, chaves que servem para ligar os dados das dimensões com a fato.

Ou seja, a tabela fato é composta pelas métricas, que são tudo aquilo que a empresa quer medir, junto com as foreign keys, chaves que ligam às dimensões que descrevem essas métricas.

O que é métrica?

É utilizada para medir, quantificar algo, são sempre números provenientes de transações da empresa.

Tudo que a empresa quer mensurar é métrica, geralmente sendo o que o usuário quer medir. Por exemplo: número de vendas ou seguidores em determinada rede social.

O que é uma foreign key?

É uma chave estrangeira que serve para relacionar os dados entre as tabelas fato e dimensão.

TIPOS DE FATOS

Existem 6 tipos de fatos:

QUESTÃO CERTA: Na especificação de uma tabela fato de um modelo multidimensional de um data warehouse, é importante definir o grau de detalhamento de seus valores. A denominação utilizada para tal detalhamento é: granularidade.

QUESTÃO CERTA: As granularidades fundamentais para classificar todas as tabelas fato de um modelo dimensional são: transacional, snapshot periódico e snapshot acumulado.

Fato transacional -> mais comuns, usam métricas aditivas que pode se somar por todas dimensões;

Fato agregada-> Função acelerar o desempenho (reduzir o tempo) das consultas, consolidam Coisas;

Fato consolidada->Diferente da tabela agregada server para consolidar duas fatos (no processo ETL as duas tabelas fatos são carregadas e misturadas);

Fato snapshot periódico->baseada no tempo, seja data, dia, semana ou hora (pega um momento periódico, tira uma fotografia e insere no fato);

Fato de snapshot acumulado – >também é uma fotografia, entretanto em mais de um momento;

Fato sem fato (factless fact table)-> Fato sem métricas, serve para fazer intersecção de dimensões, cruzamento para comparações, pode inserir fatos fakes sem conteúdo apenas para cruzamento entre dimensões.

QUESTÃO CERTA: A tabela agregada é utilizada para reduzir o tempo de acesso de uma consulta ao banco de dados.

As tabelas fato agregadas melhoram a performance de consulta, reduzindo assim o tempo de acesso.

QUESTÃO CERTA: A tabela fato deve conter atributos numéricos, visando proporcionar dados para uma análise de atividades da empresa.

QUESTÃO ERRADA: No modelo estrela, os dados são modelados em tabelas dimensionais, ligadas a uma tabela fato; uma tabela dimensão armazena o que tiver ocorrido, e a tabela fato contém as características de um evento.

Nesta questão o CESPE inverteu a definição das tabelas. O modelo estrela, de fato, apresenta diversas dimensões ligadas a uma tabela fato. Contudo, a tabela fato contém os eventos, as medidas ou os fatos ocorridos. Já as dimensões armazenam as características que descrevem o evento. Alternativa, portanto, incorreta.

QUESTÃO ERRADA: A tabela fato não deve possuir atributos do tipo numérico.

A tabela fato possui atributos do tipo numérico.

QUESTÃO ERRADA: A tabela agregada é composta de atributos e contém a descrição do negócio.

Uma tabela agregada é um fato. A agregação dos registros da tabela fato, como ocorre na tabela fato de Snapshot Periódico, é uma técnica que visa reduzir a quantidade de registros nessa tabela, melhorando a performance de consulta. ERRADA.

QUESTÃO ERRADA: A tabela de fatos armazena todos os eventos ocorridos na empresa, possibilitando ao gestor a consulta de todo o seu histórico.

As tabelas fatos armazenam grande quantidade de dados e contém medições numéricas do negócio, representando a essência dos dados em um negócio. É através da tabela Fato que é possível fazer medições numéricas do negócio obtidas das intersecções de todas as dimensões.

QUESTÃO CERTA: Na modelagem multidimensional, é possível haver mais de uma tabela fato no mesmo modelo. A tabela fato expressa a relação N:M (muitos-para-muitos) entre as dimensões, que, por sua vez, implementam a visão e a interface do usuário ao DataWarehouse.

Sim, pois, nesse caso, estamos diante do modelo chamado constelação (mais de uma tabela fato no mesmo modelo).

QUESTÃO ERRADA: A tabela fato tem uma cardinalidade de mapeamento de um para um com cada tabela dimensão.

Na verdade a relação é 1:N.

QUESTÃO ERRADA: Na abordagem Star Schema, usada para modelar data warehouses, os fatos são representados na tabela de fatos, que normalmente: está ligada com cardinalidade n:m às tabelas de dimensão.

Segundo Kimball [KIMBALL et al, 1998], apesar de, normalmente, a cardinalidade entre as dimensões e a tabela de fatos ser 1: N (um-para-muitos), podem acontecer casos em que essa cardinalidade seja M: N (muitos-para-muitos) – caso da constelação.

QUESTÃO ERRADA: A cardinalidade do relacionamento entre tabelas dimensão e tabelas fato é de 1 para 1.

QUESTÃO CERTA: Uma tabela de fatos em um data warehouse armazena os valores detalhados de medidas, ou de valores observados, e as identifica com ligação para tabelas de dimensão.

QUESTÃO CERTA: A tabela fato deve conter atributos numéricos, visando proporcionar dados para uma análise de atividades da empresa.

De forma bem simplificada, a tabela fato vai apresentar o que realmente ocorreu, o resultado da análise, através de medidas. Para isso, é fundamental que contenha atributos numéricos, que expressem quantidades e valores.

QUESTÃO ERRADA: A tabela fato possui pelo menos 4 atributos numéricos, além das chaves estrangeiras.

Não há número específico de atributos.

QUESTÃO ERRADA: A cardinalidade de relacionamento da tabela fato para as tabelas dimensão é de um para um.

Geralmente, a cardinalidade de relacionamento da tabela fato para as tabelas dimensão é de 1:N.

QUESTÃO ERRADA: Em uma tabela fato, pode haver diferentes granularidades entre as métricas, sendo as métricas não aditivas, em regra, de menor granularidade que as aditivas ou as semiaditivas.

Cada proposta de granularidade da tabela de fato resultada em uma tabela física separada, diferentes granularidades não devem ser misturadas na mesma tabela fato.

Segundo Inmon-1997 (pág. 364): “o nível de detalhe contido em uma unidade de dados. Quanto mais detalhe houver, mais baixo o nível de granularidade. Quanto menos detalhe houver, mais alto o nível de granularidade”.

Ou seja:

– MAIOR O GRÃO -> MENOS DETALHE

– MENOR O GRÃO -> MAIS DETALHE

EX: Estamos falando de uma loja de bacon que quer estudar as suas vendas para descobrir a época do ano onde as vendas sobem. Se tomar semestre, por exemplo, o grão é GRANDE, mas o detalhe é PEQUENO, uma vez que o intervalo de tempo é muito grande. No entanto, se tomar mês, o grão já é MENOR e ele possui MAIS DETALHE sobre as vendas.

A questão indaga se métricas não aditivas possuem menor granularidade que aditivas ou semiaditivas. Ou seja, quer saber se métricas não aditivas possuem MAIS DETALHE que as aditivas ou semiaditivas.

Vamos ver as definições de métricas:

– Aditivas: São as mais frequentes e são obtidas por meio da soma de valores gerados pela seleção de membros das dimensões. Exemplo: lucro líquido;

– Semi-Aditivas: São medidas obtidas a partir da soma de apenas partes de suas dimensões. Exemplo: quantidade em estoque (não faz sentido somá-la através da dimensão tempo);

– Não-Aditivas: São medidas que não podem ser somadas através de nenhuma de suas dimensões. O exemplo mais comum desse tipo de medidas são valores percentuais.

Observe que as métricas não-aditivas não podem ser manipuladas livremente, ou seja, em geral, difíceis de você tirar muitos detalhes. Dessa forma, a questão é errada, uma vez que as métricas aditivas e semi-aditivas permitem mais detalhes, tento um menor grão.

QUESTÃO CERTA: As medições métricas do negócio, armazenadas nas tabelas de fatos, podem ser aditivas, não aditivas ou semiaditivas.

As métricas aditivas são aquelas que podem ser sumarizadas independente das dimensões utilizadas. Este tipo de métrica pode ser utilizada sem quase nenhuma restrição ou limitação e são flexíveis o suficiente para gerar informações em quaisquer perspectivas.

As métricas semi-aditivas são aquelas que podem ser sumarizadas em alguns casos. Isso porque a depender da situação empregada à métrica, ela pode perder sentido para a análise caso seja agregada. Neste caso a sumarização só fará sentido com algumas dimensões específicas. Por exemplo, a métrica ‘saldo bancário’.

As métricas não-aditivas são aquelas que não podem ser sumarizadas ao longo das dimensões. Essas métricas não podem ter agregações pois perdem a veracidade do valor. Percentuais são exemplos de valores armazenados nas métricas que não permitem sumarizações.

QUESTÃO CERTA: Considere a figura abaixo que ilustra um modelo multidimensional na forma de modelo relacional em esquema estrela. Há uma tabela central que armazena as transações que são analisadas e ao seu redor há as tabelas look up, denominadas dimensões.

De acordo com o modelo estrela da figura e sua relação com um Data Warehouse, é correto afirmar: A tabela fato armazena os indicadores que serão analisados e as chaves que caracterizam a transação. Cada dimensão registra uma entidade que caracteriza a transação e os seus atributos.

“No final das contas, o que nos importa é que a tabela fato armazena os indicadores que iremos analisar e as chaves que caracterizam a transação. Estas chaves são os elos de ligação com as tabelas de dimensão. Estas, por sua vez, armazenam as classificações que usaremos para analisar os indicadores. Cada dimensão registra uma entidade que caracteriza a transação e mais todos os atributos associados a esta entidade”.

QUESTÃO ERRADA: Em um data warehouse, cada linha em uma tabela fato corresponde a uma medida, representada por um valor aditivo, em que necessariamente essas medidas não compartilham a mesma granularidade.

A questão está errada porque as linhas compartilham a mesma granularidade, e a medida pode ser aditiva, semi-aditiva ou não aditiva.

As tabelas fato são compostas obrigatoriamente por uma chave primária composta pelas chaves primárias das tabelas que contêm as descrições do fato, as de dimensão. Além desta chave composta uma tabela fato contêm medidas que variam de numéricas ou sem medida e neste contexto tempos três tipos de tabela fato:

Existem três categorias fundamentais de granularidade: Transacional, Período no Tempo ou Período Acumulado (transacional, periodic snapshot, or accumulating snapshot).

Indiferentemente do tipo da granularidade, cada medida em um Fato deve ter, exatamente, o mesmo nível de detalhe.

Quando misturamos fatos (medidas), representando múltiplos níveis de granularidade em uma mesma tabela Fato, estaremos gerando uma confusão de informações sobre o negócio, gerando, com certeza, informações erradas e desacreditando o BI na empresa.

QUESTÃO CERTA: Um dos mais importantes aspectos do projeto de um Data Warehouse é a granularidade dos dados, que se refere ao nível de sumarização dos elementos de detalhe disponível nos dados. Quanto mais detalhes existirem, mais baixo será o nível de granularidade.

QUESTÃO CERTA: Ao se modelar uma tabela-fato, deve-se considerar que a chave primária é composta e que a dimensão tempo sempre será parte integrante dessa chave.

Tempo é uma dimensão importante que TODOS os DW’s devem suportar. Na modelagem dimensional, a chave primária da tabela-fato é composta pelas chaves primárias das tabelas-dimensão que estão ligadas diretamente a esse fato. Além disso, toda tabela-fato deve ter uma dimensão tempo associada a ela. Dessa forma podemos afirmar que a questão está correta.

QUESTÃO CERTA: Em um esquema de Data Warehouse com uma arquitetura “estrela” ou “flocos de neve”, há uma tabela central que é, basicamente, uma coleção de valores-chave de tabelas dimensões. O nome técnico dessa tabela é: tabela fato.

A tabela fato é a principal tabela do Data Warehouse, ela vai conectar nas dimensões. Nessa tabela são armazenadas duas coisas: as métricas, que são os fatos propriamente ditos, e as foreign keys, chaves que servem para ligar os dados das dimensões com a fato.

Ou seja, a tabela fato é composta pelas métricas, que são tudo aquilo que a empresa quer medir, junto com as foreign keys, chaves que ligam às dimensões que descrevem essas métricas.

O que é métrica?

É utilizada para medir, quantificar algo, são sempre números provenientes de transações da empresa.

Tudo que a empresa quer mensurar é métrica, geralmente sendo o que o usuário quer medir. Por exemplo: número de vendas ou seguidores em determinada rede social.

O que é uma foreign key?

É uma chave estrangeira que serve para relacionar os dados entre as tabelas fato e dimensão.

TIPOS DE FATOS

Existem 6 tipos de fatos:

Advertisement
Sair da versão mobile