O Que É Esquema Estrela (Star Schema)?

0
6144

O modelo dimensional existe há muito mais tempo que você imagina, e provavelmente, você que não conhece modelo dimensional, já até usou e não sabe. Existem dois tipos de metodologias de modelagem de dados usadas no Data Warehouse, a Snowflake e a Star Schema, que é a mais utilizada.

CEBRASPE (2015):

QUESTÃO CERTA: Considerando o modelo apresentado nessa figura, julgue o item subsecutivo, acerca de modelagem de dados.

O modelo apresentado é do tipo estrela e nele todas as dimensões relacionam-se diretamente com a tabela fato. Suas principais características são a redução do número de joins, a baixa manutenção e a repetição de informações nas tabelas de dimensão.

O conceito de Esquema Estrela (em inglês: Star Schema) foi criado pelo estadunidense Dr. Ralph Kimball, ao propor uma visão para a modelagem de base de dados para sistemas de apoio a decisão. Sua principal característica é a presença de dados altamente redundantes, melhorando o desempenho.

Star schema ou esquema em estrela é uma metodologia de modelagem de dados utilizada do desenho de um Data warehouse.

Os dados são modelados em tabelas dimensionais ligadas a uma tabela de fatos. As tabelas dimensionais contêm as características de um evento. A tabela de fatos armazena os fatos ocorridos e as chaves para as características correspondentes, nas tabelas dimensionais.

O nome foi adotado devido à semelhança do modelo como uma estrela. No “centro” da estrela, existe a o que chamou tabela de fatos, rodeada por tabelas auxiliares, chamadas de dimensões. A tabela de fato conecta-se as demais dimensões por múltiplas junções e as tabelas de dimensões conectam-se com apenas uma junção a tabela de fatos.

Propriedades

  • Uma única tabela de fatos contendo dados, sem redundância
  • Uma tabela por dimensão
  • As chaves primárias, da tabela de fatos, são apenas de uma por dimensão.
  • Cada chave é gerada (eficiência)

Cada dimensão representa uma única tabela, altamente desnormalizada.

Vantagens

Fácil de perceber, reduz o número de joins e tem baixa manutenção.

Desvantagens

Não fornece explicitamente suporte para hierarquias de atributos e as tabelas dimensionais são um problema.

As tabelas de dimensão, por não estarem normalizadas, contém repetição das informações. Não são adequadas para uso transacional pois uma alteração simples (como de o nome de um país) poderia gerar a necessidade de várias alterações no banco de dados (para todas as linhas de municípios).

FEPESE (2017):

QUESTÃO CERTA: O esquema estrela (star schema) baseia-se em tabelas dimensionais e de fatos, na relação de muitos para um.

Observe que o examinador omitiu o ‘respectivamente’: O esquema estrela (star schema) baseia-se em tabelas dimensionais e de fatos respectivamente na relação de muitos para um. Ou seja, muitas tabelas dimensionais para uma tabela de fatos.

CEBRASPE (2010):

QUESTÃO ERRADA: Em um modelo do tipo estrela (star schema), devido à ligação entre as tabelas dimensionais e suas respectivas fontes de dados, as dimensões são dependentes de códigos operacionais de produção. Desse modo, nessas tabelas, convenciona-se usar como chave primária as mesmas utilizadas no ambiente de produção – origem dos dados.

Deve ser utilizada a chave de substituição (surrogate key) que não é dependente do sistema legado, e sim criadas durante a carga do DW. Sendo assim as chaves serão diferentes do sistema de produção.

FCC (2016):

QUESTÃO CERTA: Na abordagem Star Schema, usada para modelar data warehouses, os fatos são representados na tabela de fatos, que normalmente: é única em um diagrama e ocupa a posição central.

É única, mas em UM processo de negócio. Um Data Warehouse pode haver mais de uma tabela de fato.

FCC (2016):

QUESTÃO ERRADA: Na abordagem Star Schema, usada para modelar data warehouses, os fatos são representados na tabela de fatos, que normalmente: está ligada às tabelas de dimensão, que se relacionam entre si com cardinalidade 1:n.

Aqui está afirmando que as tabelas de dimensão se relacionam entre si. Isso só acontece no modelo floco de neve, e não no modelo estrela.

FCC (2016):

QUESTÃO ERRADA: Na abordagem Star Schema, usada para modelar data warehouses, os fatos são representados na tabela de fatos, que normalmente: tem chave primária formada independente das chaves estrangeiras das tabelas de dimensão.

A chave da tabela de fato é o conjunto de chave estrangeiras das dimensões.

FCC (2016):

QUESTÃO ERRADA: Na abordagem Star Schema, usada para modelar data warehouses, os fatos são representados na tabela de fatos, que normalmente: está ligada a outras tabelas de fatos em um layout em forma de estrela.

CESAGRANRIO (2012):

QUESTÃO CERTA: O modelo estrela (star schema) é a denominação comum para um modelo de dados multidimensional. Nesse tipo de modelo: cada dimensão é representada por uma tabela.

Star Schema – Propriedades:

– Uma única tabela de fatos contendo dados, sem redundância.

– Uma tabela por dimensão.

– As chaves primárias, da tabela de fatos, são apenas de uma por dimensão.

– Cada chave é gerada (eficiência).

– Cada dimensão representa uma única tabela, altamente desnormalizada.

CEBRASPE (2010):

QUESTÃO ERRADA: O esquema estrela é a representação do modelo dimensional em banco de dados relacionais, no qual várias tabelas possuem múltiplos relacionamentos entre si.

Errado. É uma representação em bancos de dados multidimensionais;

CEBRASPE (2016):

QUESTÃO ERRADA: No esquema estrela, diversas tabelas de dimensão se relacionam tanto com diversas tabelas fato como com outras tabelas de dimensão, apresentando chaves ligando todas essas tabelas.

Tabelas de dimensão relacionam-se apenas com tabelas de fato.

CEBRASPE (2016):

QUESTÃO ERRADA: No esquema estrela, as tabelas de dimensão são organizadas em uma hierarquia por meio da sua normalização, com vistas a diminuir o espaço ocupado, eliminando-se, assim, quaisquer redundâncias.

Não há normalização no esquema estrela, o que implica em dados redundantes.

O esquema estrela exige o uso de tabelas normalizadas.

CEBRASPE (2016):

QUESTÃO ERRADA: O esquema estrela exige o uso de tabelas normalizadas.

CEBRASPE (2016):

QUESTÃO ERRADA: No esquema estrela, cada tabela de dimensão está relacionada a várias tabelas de fato, formando uma estrutura na qual a tabela de dimensão se relaciona com várias tabelas de fato obrigatoriamente.

Está relacionada a apenas UMA tabela de fato.

CEBRASPE (2016):

QUESTÃO CERTA: O esquema estrela consiste em uma tabela de fato com várias tabelas para cada dimensão e propõe uma visão cuja principal característica é a presença de dados redundantes nas tabelas de dimensão.

CESGRANRIO (2010):

QUESTÃO ERRADA: A modelagem star schema não contempla a possibilidade de armazenamento de atributos para cada dimensão, minimizando a quantidade de memória utilizada.

Errado. O modelo starschema é o que mais consome espaço, pois é não normalizado (e há muita informação redundante). O outro erro da questão é que em cada dimensão há atributos. Aliás, essa afirmativa nem faz sentido, pois sabemos que cada dimensão se relaciona com um fato e isso só já exige um atributo – o atributo chave.

Marinha (2013):

QUESTÃO CERTA: Em um Data Warehouse, as tabelas ________________ ,diferentemente das tabelas ______________ ,estão mais sujeitas ao processo de desnormalização. A abordagem do _______________ recomenda a não normalização das tabelas ______________ ,enquanto a abordagem do ______________ recomenda a normalização. Assinale a opção que completa corretamente as lacunas da sentença abaixo: dimensão, fato, STAR SCHEMA, dimensão, SNOWFLAKE SCHEMA.

Segundo Barbieri: As tabelas dimensão, diferentemente das tabelas fatos, estão mais sujeitas ao processo de desnormalização. Existem duas correntes diferentes com relação aos aspectos de normalização das tabelas dimensão:

Esquema estrela: abordagem que recomenda a não normalização das tabelas dimensão; e

Esquema de flocos de neve: abordagem que recomenda a normalização das tabelas dimensão.

CEBRASPE (2017):

QUESTÃO ERRADA: Diferentemente da estrutura relacional, a estrutura multidimensional oferece baixa redundância de dados e suporte a normalização até a segunda forma normal.

Sabemos que o modelo em estrela, mais utilizado no desenho ou projeto de bases de dados analíticas, utiliza-se de alta redundância e baixa normalização para apresentar um modelo de dados numa estrutura mais compreensiva para os usuários finais. Essa construção facilita ainda a navegação entre as diversas dimensões do modelo, facilitando a construção de relatórios. Podemos, então, concluir que a afirmação está incorreta.

FAURGS (2018)

QUESTÃO CERTA: Um esquema estrela possui uma tabela fato conectada a uma ou mais tabelas dimensão, as quais não necessitam estar normalizadas.

CEBRASPE (2015):

QUESTÃO ERRADA: Em uma modelagem dimensional que utilize o esquema estrela, a chave primária de uma tabela de fatos será a chave estrangeira na tabela de dimensões.

Na realidade é o inverso. As tabelas de dimensões não possuem chaves estrangeiras relativas às tabelas de fato. Uma tabela de fato possui atributos relativos às chaves primárias das tabelas de dimensões, ou seja, estes atributos são chaves estrangeiras das tabelas de dimensão (e não chave estrangeira na tabela de dimensão). O conjunto destas chaves estrangeiras forma a chave primária (ou parte da chave primária) da tabela de fato.

Sobre a construção da tabela fato podemos dizer que, no modelo estrela, seus atributos são os fatos e as chave primárias das dimensões. Logo a alternativa encontra-se incorreta. Em outras palavras podemos dizer que as chaves primárias das tabelas dimensões serão chave estrangeira na tabela fato.

CEBRASPE (2010):

QUESTÃO CERTA: Em um sistema OLAP, as estratégias de desnormalização de tabelas e a redundância de dados são requerimentos para a otimização de consultas. A estratégia star schema relaciona uma tabela-fato a diversas tabelas-dimensões.

O esquema em estrela (star schema) possui tabela (s) fato (s) com dados quantitativos ligados a tabelas dimensões, que possuem características descritivas. Uma tabela dimensão pode participar de uma ou mais tabelas fatos.

O outro esquema é o floco de neve. Este esquema é normalizado (até a 3 forma normal) e possui redundâncias. É mais complexo e pode comprometer o desempenho das consultas.