Medidas aditivas semiaditivas e não aditivas

0
1840

Última Atualização 13 de janeiro de 2021

O grão, também chamado de detalhe, é o menor nível da hierarquia da dimensão. É a informação base, o menor detalhe da informação. É extremamente importante entender o que é o grão e como definir ele, porque se for mal planejado, vai acabar com todo o projeto. Mas o que é esse grão? Em uma dimensão de tempo, nós podemos ter uma hierarquia com ano, mês e dia. O dia é o menor nível, isso é o grão. Em uma dimensão com diretoria, gerência, departamento e pessoa, a pessoa é o menor nível de detalhamento.

Os fatos mais interessantes que podem ser representados no modelo dimensional são os fatos numéricos aditivos, como os que apresentamos acima. Isso ocorre porque em aplicações de BI raramente se tem o interesse de visualizar um único registro da tabela fato por vez. O propósito é geralmente extrair de uma vez inúmeros registros que se amoldem a determinados parâmetros e filtros. Por exemplo, realizar uma análise a respeito de todas as vendas de uma determinada categoria de produto que foram realizadas ao longo dos meses de um ano.

Também existem os fatos semiaditivos, que são aqueles que são aditivos somente em relação a algumas dimensões, não a todas.  Um exemplo clássico é o saldo das contas contábeis. Se tivermos uma tabela fato que tenha como grão o saldo de uma conta contábil a cada dia, não podemos somar esta medida ao longo do tempo, já que não faz sentido somar o saldo de um dia com o saldo do dia seguinte. Por outro lado, pode fazer sentido somar estes saldos ao longo de outras dimensões para se obter valores totais, como por Setor, Filial, etc.

Por fim, temos as medidas não aditivas. Podemos usar como exemplo os valores percentuais. Imagine uma tabela fato que contém alíquotas de um determinado imposto, que variam ao longo do tempo e por estado. Não faz sentido somar a alíquota vigente em um ano com do ano seguinte, e muito menos somar a alíquota de um estado com a do outro. Logo, essas medidas precisam de um tratamento especial para que sejam agregadas, não podemos simplesmente somá-las ao longo das dimensões.

Veja esse exemplo para sumarizar o que você acabou de ler:

https://devhero.s3.amazonaws.com/eomLZK0xOMhb.png

 

  • As medidas aditivas, valor de venda e quantidade vendida, podem ser somadas normalmente ao longo da nossa tabela fato. 

  • Já a medida semiaditiva, o saldo da conta corrente, não pode ser somada ao longo do tempo. Não faz sentido! O saldo correto é o mesmo do registro mais recente. Se estivéssemos analisando os totais por outra dimensão, como região, poderia fazer sentido somar os saldos das contas de cada local, mas esse não é o caso.

  • Por último, temos a medida não aditiva, a alíquota do ICMS. Essa medida nos traz alguns problemas. Está claro que não faz sentido somar os valores, não é? Você poderia imaginar que é possível tirar a média aritmética dos registros, ao invés de somá-los. Seria uma ideia interessante, mas também não faz muito sentido, já que a média das três alíquotas também não nos dá uma informação importante. Para obter a alíquota média total das nossas vendas, precisaríamos realizar uma média ponderada de acordo com o valor das vendas. Teríamos, então, que desenvolver uma fórmula na linguagem de programação suportada pelo sistema de DW/BI para conseguir algo de útil a partir desse tipo de medida.

QUESTÃO ERRADA: Considerando-se o modelo multidimensional a seguir, é correto afirmar que Quantidade e Valor são dimensões de Itens.

https://www.direcaoconcursos.com.br/wp-content/uploads/2020/02/Q2.jpg

Na modelagem dimensional, temos modelos cuja tabela central é a tabela fato ou tabela de fatos, que fica circundada por dimensões. A fato contém os registros a respeito dos eventos ocorridos, contendo as chaves estrangeiras que referenciam as dimensões e as medidas ou os fatos registrados. 

No caso do item acima, Quantidade e Valor são exemplos dessas medidas, não de dimensões. As dimensões do modelo são Produto, Data, Loja, Atendente e Promoção

QUESTÃO CERTA: Na terminologia dimensional, um fato é aditivo quando pode ser agregado em todas as dimensões.

QUESTÃO CERTA: Na modelagem multidimensional, os dados são distribuídos nas tabelas dimensões e fato. Os atributos de uma dimensão podem possuir relacionamentos M:N entre eles; e as métricas, na tabela fato, podem ser aditivas, semiaditivas ou não aditivas.

“Os atributos de uma dimensão podem possuir relacionamentos M:N entre eles” Nem sabia que tinha relacionamento entre atributos, pensava que era entre entidades.

Relacionamentos de atributo são associações entre atributos que especificam como os eles são conectados. Esses relacionamentos definem como tabelas e colunas são unidas e utilizadas e quais tabelas estão relacionadas a outras tabelas. Sem relacionamentos, não existe interação entre dados e, portanto, nenhuma estrutura lógica. Os relacionamentos dão significado aos dados, fornecendo associações lógicas de atributos com base em regras de negócios.

Todo relacionamento de atributo tem duas partes: um pai e um filho. Um filho sempre deve ter um pai, enquanto um pai pode ter vários filhos. O atributo pai está em um nível lógico mais elevado do que o filho.

Em um relacionamento entre Ano e Trimestre, Ano é o atributo pai, enquanto trimestre é o filho.

Tipos de relacionamentos são definidos pelos elementos de atributo que existem nos atributos relacionados. Cada tipo está descrito a seguir:

  • Um-para-um: Cada elemento no atributo pai corresponde a um, e somente um, elemento no atributo filho, enquanto cada atributo filho corresponde a um, e somente um, elemento no atributo pai.

    Advertisement

 Um cidadão pode ter apenas um ID de contribuinte que, por sua vez, pode ser atribuído a apenas um cidadão.

  • Um-para-muitos: Cada elemento no atributo pai corresponde a um ou mais elementos no atributo filho, enquanto cada atributo filho corresponde a um, e somente um, elemento no atributo pai.

Ano tem um relacionamento de um-para-muitos com trimestre. Um ano tem muitos trimestres, mas um trimestre específico pode estar em apenas um ano. Isso pressupõe que trimestres sejam definidos com um ano acompanhante, como T4 2017, T1 2018 etc.

  • Origem e destino múltiplos: Cada elemento no atributo pai pode ter vários filhos e cada elemento filho no atributo filho pode ter vários pais.

No setor bancário, clientes e contas são um exemplo de um relacionamento de origem e destino múltiplos. Um cliente pode ter muitas contas, e cada conta pode estar associada a muitos clientes, como no caso de uma conta conjunta.

QUESTÃO ERRADA: Em uma tabela fato, pode haver diferentes granularidades entre as métricas, sendo as métricas não aditivas, em regra, de menor granularidade que as aditivas ou as semiaditivas.

Dica: menor Granularidade, maior o Detalhe.

As métricas aditivas são as que permitem operações como adição, subtração e média de valores por todas as dimensões, em quaisquer combinações de registros, como “total de itens vendidos” por combinação de data, produto e loja. 

As métricas não aditivas são valores que não podem ser manipulados livremente, como valores percentuais ou relativos. Para esses valores, os cálculos devem ser realizados nos dados absolutos nos quais se baseiam. Exemplos de métricas não-aditivas são preço de custo e preço de venda de um produto em uma venda. Por fim, as métricas semi-aditivas são valores que não podem ser somados em todas as dimensões. Por exemplo: numa tabela com o registro diário do saldo bancário dos clientes de uma agência, não faz sentido somar os saldos bancários diários de um cliente durante um mês, mas pode-se somar os saldos de todos os clientes de uma agência em determinada data.

Quanto maior o detalhe das informações, menor será a sua granularidade, o que não é o caso das métricas não aditivas, por isso o erro da questão.

Segundo Inmon-1997 (pág. 364): “o nível de detalhe contido em uma unidade de dados. Quanto mais detalhe houver, mais baixo o nível de granularidade. Quanto menos detalhe houver, mais alto o nível de granularidade”.

Ou seja:

– MAIOR O GRÃO -> MENOS DETALHE

– MENOR O GRÃO -> MAIS DETALHE

EX: Estamos falando de uma loja de bacon que quer estudar as suas vendas para descobrir a época do ano onde as vendas sobem. Se tomar semestre, por exemplo, o grão é GRANDE, mas o detalhe é PEQUENO, uma vez que o intervalo de tempo é muito grande. No entanto, se tomar mês, o grão já é MENOR e ele possui MAIS DETALHE sobre as vendas.

A questão indaga se métricas não aditivas possuem menor granularidade que aditivas ou semiaditivas. Ou seja, quer saber se métricas não aditivas possuem MAIS DETALHE que as aditivas ou semiaditivas.

Vamos ver as definições de métricas:

– Aditivas: São as mais frequentes e são obtidas por meio da soma de valores gerados pela seleção de membros das dimensões. Exemplo: lucro líquido;

– Semi-Aditivas: São medidas obtidas a partir da soma de apenas partes de suas dimensões. Exemplo: quantidade em estoque (não faz sentido somá-la através da dimensão tempo);

– Não-Aditivas: São medidas que não podem ser somadas através de nenhuma de suas dimensões. O exemplo mais comum desse tipo de medidas são valores percentuais.

Observe que as métricas não-aditivas não podem ser manipuladas livremente, ou seja, em geral, difíceis de você tirar muitos detalhes. Dessa forma, a questão é errada, uma vez que as métricas aditivas e semi-aditivas permitem mais detalhes, tento um menor grão.