Data warehouse é um banco de dados que armazena dados correntes e históricos de potencial interesse para os tomadores de decisão de toda a empresa. O data warehouse padroniza os dados oriundos dos bancos de dados operacionais da organização, possibilitando uma análise gerencial para a tomada de decisão.
Algumas organizações disponibilizam o acesso às informações do data warehouse através da sua intranet, pois o sistema permite acessar ferramentas de consultas, analíticas e de relatórios. Já o objetivo do data warehouse é criar um repositório de dados que dê acesso a dados operacionais sob formas facilmente aceitáveis para as atividades de processamento analítico. Nem todos os dados são transferidos dos bancos de dados operacionais para o data warehouse, geralmente são transferidos apenas um resumo dos dados originais. Após transferidos, os dados são organizados por assuntos e também categorizados de acordo com a área de negócio, como compras ou estoque, por exemplo.
São as principais características do data warehouse para Turban, Mclean e Wetherbe
1. Organização
Os dados são organizados por assunto específico (por exemplo, por cliente, fornecedor, produto, nível de preço e região), e contêm somente informação relevante para o apoio à decisão.
2. Consciência
Dados de diferentes bancos de dados operacionais podem ser codificados de formas diferentes. Por exemplo, dados sobre o sexo das pessoas pode ser codificado como 0 e 1 em um banco de dados relacional e como “m” e ”f” em outro. Dentro do warehouse, eles serão codificados de modo consistente.
3. Variante de tempo
Os dados são guardados entre cinco a dez anos, para poderem ser usados a fim de avaliar tendências, fazer previsões e comparações com o passar do tempo.
4. Não-volatilidade
Uma vez inseridos no warehouse, os dados não recebem atualizações.
5. Relacional
Os bancos de dados normalmente usam estrutura relacional.
6. Cliente/servidor
O data warehouse usa arquitetura cliente/servidor, principalmente para fornecer ao usuário final fácil acesso a seus dados.
Turban, Mclean e Wetherbe (2004) apontam também alguns benefícios trazidos pela implementação do data warehouse, como o fornecimento de uma visão consolidada dos dados da organização, que antes estavam fragmentados nos diversos bancos de dados, e a transferência do processamento das informações de sistemas mais caros para servidores de baixo custo
CEBRASPE (2019):
QUESTÃO ERRADA: O repositório de dados analíticos de BI é representado pelas diversas bases de dados relacionais e por repositórios de dados que utilizem modelagens relacionais.
Negativo. É representado por uma única base de dados centralizada que utiliza uma modelagem multidimensional e, não, relacional.
CEBRASPE (2021):
QUESTÃO CERTA: Enquanto os depósitos de dados e seus subconjuntos data marts são bancos estáticos, ou seja, não mais sofrem mudanças depois de agrupados, formatados e armazenados seus dados em um repositório, os bancos de dados típicos mudam constantemente, sendo dinâmicos por natureza.
CEBRASPE (2021):
QUESTÃO CERTA: Em DW (data warehouse), conjunto de dados voltado para oferecer suporte à tomada de decisões, os dados: detectam tendências e relações de longo prazo para previsão, com uma qualidade temporal para cada DW, sem necessariamente mostrar o status atual.
➱ Data Warehouse é um banco de dados. É um repositório para armazenamento em longo prazo de várias origens, organizando de modo a facilitar a tomada de decisões gerenciais.
➱ Data Warehouse é um depósito de dados orientado por assunto, integrado, não volátil, variável com o tempo, para apoiar as decisões gerenciais.
➱ A principal ideia do Data Warehouse é construir um depósito no qual será mantida a memória histórica dos dados, possibilitando a utilização dos mesmos para consulta e análise estratégica para a tomada de decisão.
Diferença:
- Data Mining: Eventos Futuros;
- DataWarehouse: Eventos Passados(Históricos).