QUESTÃO CERTA: Com relação à teoria de modelagem multidimensional, a figura abaixo ilustra um conjunto de tabelas modeladas obedecendo o esquema em estrela (Star Schema). Nestas condições, são ditas tabela FATO e DIMENSÃO respectivamente: VENDAS e LOCAL
Tabela Fato – > contém as chaves estrangeiras (FK);
Tabela Dimensão -> Chaves primarias (PK);
STAR SCHEMA = tabela desnormalizada;
Tabela fato possui muitas PK;
QUESTÃO ERRADA: na modelagem multidimensional, caso haja as dimensões tempo e local ligadas a fato, é necessário optar-se por uma delas, pois somente uma dimensão poderá estar presente em cada modelo.
Uma tabela fato tem que ter, no mínimo, 2 tabelas dimensão.
QUESTÃO ERRADA: Os fatos e dimensões não são tabelas do banco de dados, pois, no modelo dimensional, são componentes do cubo de um data warehouse.
Os fatos e dimensões são tabelas dos bancos de dados multidimensionais estruturados em uma base relacional.
- Requisitos: verificação da existência dos dados necessários para a solução
- Modelagem do DW (Data Warehouse): organização e armazenamento destes dados de maneira a otimizar a análise.
- Processos de ETL: extração, transformação e carregamento. Os dados são extraídos de onde estão arquivados, transformados conforme estabelecido na organização anterior e carregados no DW (data warehouse).
- Cubos: cruzamento dos dados, levando as respostas e insights esperados.
- Dashboards: apresentação do resultado.
Aqui utilizamos o termo cubo apenas por conta de sua grande utilização na área, porém é cada vez mais comuns analistas de dados que nunca ouviram falar nesta expressão. Os cubos OLAP (Online Analytical Processing) recebem esse nome pelo fato dos dados possuírem uma organização semelhante a um cubo, com informações agregadas por dimensões e um fato, sendo facilmente localizadas respostas a partir da intersecção das dimensões. Hoje podemos enxergar esta etapa como sendo a análise efetiva dos dados, que podem ser facilmente consultados no DW, levando as respostas que o dashboard deve exibir.
QUESTÃO CERTA: Diferentemente dos bancos de dados transacionais, a modelagem de bancos de dados multidimensionais é caracterizada pelo uso de tabelas fato e tabelas periféricas, que armazenam, respectivamente, a transação e as dimensões.
QUESTÃO CERTA: Ao construir um modelo de dados para um data warehouse de sua empresa, um desenvolvedor viu-se às voltas com três tabelas relacionais: venda, cliente e vendedor. Ao fazer uma transformação para o modelo estrela, ele deve organizar: venda, como tabela fato; cliente e vendedor, como tabelas dimensão.
Dados descritivos: Tabelas Dimensões;
Dados escalares (quantitativos): Tabela Fato.
Venda = Tabela Fato; (é a tabela dominante)
Cliente e Vendedor = Tabelas Dimensão (tabelas auxiliares)
O Star schema ou esquema em estrela é uma metodologia de modelagem de dados utilizada do desenho de um Data warehouse.
Os dados são modelados em tabelas dimensionais ligadas a uma tabela de fatos. As tabelas dimensionais contêm as características de um evento. A tabela de fatos armazena os fatos ocorridos e as chaves para as características correspondentes, nas tabelas dimensionais.
O nome foi adotado devido à semelhança do modelo como uma estrela. No “centro” da estrela, existe a o que chamou tabela de fatos, rodeada por tabelas auxiliares, chamadas de dimensões. A tabela de fato conecta-se as demais dimensões por múltiplas junções e as tabelas de dimensões conectam-se com apenas uma junção a tabela de fatos.
Desta forma a consulta ocorre inicialmente nas tabelas de dimensão e depois nas tabelas de fatos, assegurando a precisão dos dados por meio de uma estrutura de chaves onde não é preciso percorrer todas as tabelas, garantindo um acesso mais eficiente de com melhor desempenho.
Tabela fato:
É uma tabela central que é, basicamente, uma coleção de valores-chave de tabelas dimensões;
Tudo que pode ser representado por valor aditivo;
Valores números (métricas ou medidas);
É evolutivo e muda suas medidas com o tempo.
Tabela Dimensão
Elementos, entidades, que participam de algum fato, o “por” dos dados;
Lembrando que a tabela Fato possui uma de suas características ser referenciada por chave estrangeira FK;
Dimensão possui a Chave Primária.
QUESTÃO ERRADA: As dimensões na modelagem da base de dados podem ser do tipo aditivas e não aditivas, sendo ambas oriundas da modelagem Snow Flake.
Pode ser oriunda do Star Schema também.
QUESTÃO CERTA: Para melhor manter o controle sobre identificadores de registro de ambientes de data warehouse (armazém de dados), em geral recomenda-se a geração de chaves substitutas (surrogate keys). Assim, cada junção entre as tabelas de dimensão e tabelas fato
A Surrogate Key é uma chave artificial e auto incremental.
A palavra artificial vem do tipo, porque ela não existe em lugar nenhum, não está lá no transacional como a Natural Key, ela é criada no Data Warehouse.
E é auto incremental porque toda vez que é chamada, troca de número, então ela começa com 1 e vai indo para 2, 3, 4, e assim por diante.
Resumindo: ela é a famosa sequence do banco de dados ou a sequência no Excel.
Uma Surrogate Key (chave substituta) nada mais é que um campo com as características de uma Primary Key, e é gerada automaticamente na hora da carga, quando você carrega a dimensão no ETL.
Na tabela fato essa Surrogate Key vai ser uma Foreign Key (chave estrangeira), a chave que serve para relacionar os dados entre duas tabelas, sempre apontando para uma Primary Key (chave primária) em outra tabela, que no caso da dimensão, vai ser a Surrogate Key.
Assim, a tabela fato receberá apenas o código da Surrogate Key da linha que ela está referenciando e não os atributos.
A Surrogate Key
– Tem as características de uma Primary Key.
– É utilizada para referenciar a dimensão na tabela fato
– É auto incremental
– É uma chave artificial
– É criada no Data Warehouse
– Não pode se repetir
QUESTÃO CERTA: Ao se modelar uma tabela-fato, deve-se considerar que a chave primária é composta e que a dimensão tempo sempre será parte integrante dessa chave.
Tempo é uma dimensão importante que TODOS os DW’s devem suportar.
Na modelagem dimensional, a chave primária da tabela-fato é composta pelas chaves primárias das tabelas-dimensão que estão ligadas diretamente a esse fato. Além disso, toda tabela-fato deve ter uma dimensão tempo associada a ela. Dessa forma podemos afirmar que a questão está correta. Dimensão tempo é sempre representada como parte da chave primária.
QUESTÃO ERRADA: A tabela agregada dimensão é composta de atributos e contém a descrição do negócio.
A tabela agregada é criada com dados da tabela fato, alterando sua granularidade, ou seja, ela sumariza os dados, gerando uma tabela menor.
As tabelas de dimensão representam entidades de negócios e constituem as estruturas de entrada que servem para armazenar informações como tempo, geografia, produto, cliente. As tabelas de dimensão geralmente representam relacionamentos hierárquicos no negócio (por exemplo, produtos se associam a subcategorias que se associam a categorias). Dizemos que elas possuem característica qualitativa dentro de um DW.
QUESTÃO ERRADA: Considerando-se o modelo multidimensional a seguir, é correto afirmar que Quantidade e Valor são dimensões de Itens.
Na modelagem dimensional, temos modelos cuja tabela central é a tabela fato ou tabela de fatos, que fica circundada por dimensões. A fato contém os registros a respeito dos eventos ocorridos, contendo as chaves estrangeiras que referenciam as dimensões e as medidas ou os fatos registrados.
No caso do item acima, Quantidade e Valor são exemplos dessas medidas, não de dimensões. As dimensões do modelo são Produto, Data, Loja, Atendente e Promoção