O Que É ETL (Extract Transform, Load)? (com exemplos)

0
5193

As ferramentas de ETL mais utilizadas no mercado são o Data Stage da IBM, o ETI da ETI Corporation, Sagent da Group 1 Software, Informática Power Conect da Informática, DTS da Microsoft, Pentaho (Open Source), Talend (Open Source), Sunopsis e o Oracle Warehouse Builder da Oracle.

QUESTÃO CERTA: Sobre ETL (Extract, Transform and Load),é correto afirmar que: é o processo para tratamento dos dados de uma ou mais bases de dados de origem, para uma ou mais bases de dados de destino.

QUESTÃO ERRADA: Ferramentas ETL são utilizadas na extração, transformação e remoção de dados.

Ferramentas ETL são utilizadas na extraçãotransformação e carregamento de dados.

QUESTÃO CERTA: O Módulo de ETL (extract transform load), dedicado à extração, carga e transformação de dados, coleta informações em fontes como sistemas ERP, arquivos com extensão TXT e planilhas Excel.

QUESTÃO ERRADA:

O processo de extração, transformação e carga (ETL) ilustrado permite extrair dados de diversas fontes de dados e migrá-los para o data warehouse, mantendo sua estrutura e normalização originais.

As fontes de dados em um processo de ETL costumam ser heterogêneas, variadas. Dessa maneira, não há como manter sua estrutura original. Aliás, o propósito do processo é justamente extrair os dados e transformá-los, preparando-os para a integração no seu destino, geralmente o data warehouse.

QUESTÃO CERTA: Na etapa de extração, os dados são convertidos para um único formato devido à heterogeneidade dos sistemas organizacionais.

QUESTÃO CERTA: As ferramentas de software ETL (extract transform load) têm como função a extração de dados de diversos sistemas, a transformação desses dados de acordo com as regras de negócio e a carga dos dados em um data mart ou um DW.

QUESTÃO CERTA: No processo ETL de um data warehouse: (I) a tradução de valores codificados conhecida como limpeza de dados (por exemplo, supondo que o sistema de origem armazena 1 para sexo masculino e 2 para feminino, mas o data warehouse armazena M para masculino e F para feminino) e (II) a geração de valores de chaves substitutas (surrogate keys) são: integrantes da etapa de transformação.

A etapa extração e a etapa carga não tem atividades, pois como diz seus nomes só extraem e carregam dados respectivamente, todas as atividades são na etapa transformação.

Aplicação de Regras, Normalização, Geração de chaves sempre é feita na etapa de transformação.

QUESTÃO ERRADA: Um sistema ETL, que faz parte do processo de construção de um data warehouse, por ser voltado para a tomada de decisões, utiliza unicamente a DSL (decision support language), não suportando a SQL (structured query language).

ETL serve p/ extract, transform e load), isto é, carregar o datawarehouse com dados provenientes de diferentes fontes de dados.

QUESTÃO CERTA: Em ETL, frequentemente, é necessário limpar, ajustar e consolidar os dados antes de realizar sua carga. Nesse estágio de transformação, aplicam-se regras ou funções aos dados extraídos para ajustar os dados a serem carregados. A limpeza trata de vários tipos de erros, como, por exemplo, valores ilegais, ou que não obedeçam às regras de integridade da base, e erros de ortografia.

É o caso de uniformizar os dados de CNPJ das empresas (com hífen ou sem hífen?), todos os valores monetários deverão exibir o cifrão ou não? É o que chamamos de padronização.

QUESTÃO CERTA: As ferramentas de business inteligence, encarregadas de extrair e carregar dados na base de dados de BI, são denominadas ferramentas de ETL.

QUESTÃO ERRADA: Na construção de um data warehouse, o processo extract, transform and load (ETL), normalmente, é o menos crítico e o mais rápido. Esse processo envolve a extração dos dados, na sua transformação, e, eventualmente, influencia na limpeza desses dados.

Advertisement

O processo de ETL é o processo mais crítico e demorado na construção de um DW. ETL e as ferramentas de limpeza de dados consomem um terço do orçamento num projeto de DW. 80% do tempo de desenvolvimento de um DW consiste no processo de ETL.

O processo de ETL (Extract, Transform and Load) é um processo que exige esforço e a maior parte do tempo de construção de um Data warehouse, este processo vai extrair dados de fontes de dados heterogêneas e tem que alimentar o Data Warehouse de forma homogênea e concisa, pois vai servir de base para gerar relatórios e gráficos de apoio à decisão para a gerencia da corporação e não pode trazer resultados errôneos.

O processo de extração, transformação e carga, comumente referenciado como ETL (Extract-Transform-Load), é um processo usado na criação e na atualização de um Datawarehouse.

QUESTÃO ERRADA: O ambiente ETL permite a visualização dos dados para análise de maneira multidimensional.

ETL é o processo de Extração, Transformação e Carga. Ambiente para visualização Muldimensional é OLAP.

QUESTÃO ERRADA: ETL (extract transform load) é uma ferramenta utilizada para extrair informações e realizar análise multidimensional no data warehouse.

QUESTÃO CERTA: Em processos ligados a ETL, os dados são identificados e extraídos de diferentes fontes, incluindo sistemas de banco de dados e aplicações.

QUESTÃO CERTA: Em um ambiente de data warehousing, uma das fases mais importantes é a ETL (Extract, Transformation and Load), em que se definem as estratégias de conversão, transformação e consistência dos dados dos sistemas de origem para realizar a carga dos dados no sistema de data warehouse. Uma característica relacionada a essa fase de ETL é que: é necessária para se obter os dados das múltiplas fontes, de forma a transformá-los nas variáveis que interessam ao processo de decisão.

QUESTÃO CERTA: ETL é o método mais comum para transferir dados de uma fonte de dados OLTP para um data warehouse. Contudo, pode-se também empregar o processo de extração, carga e transformação no formato ELT. Para tanto, faz-se necessário o uso de: Staging tables ou tabelas intermediárias no banco de dados de destino (data warehouse).

Staging tables:

Cria um ambiente intermediário de armazenamento e processamento dos dados oriundos de aplicações OLTP e outras fontes padrão ETL.

Representa um armazenamento intermediário dos dados, facilitando a integração dos dados do ambiente operativo da sua atualização no DW.

Pode servir de base par a análises do ambiente operativo, pois sua granulidade é normalmente compatível com sistemas desse ambiente

É investigada para verificar a determinação de onde ocorreram erros

Limpa dados sujos que entram no processo de extração

QUESTÃO ERRADA: As ferramentas de ETL têm como objetivo efetuar extração, transformação e carga de dados vindos de uma base transacional para um data warehouse (DW). No processo de extração, que é o mais demorado dos três, ocorre a limpeza dos dados, a fim de garantir a qualidade do que será posteriormente carregado na base do DW.

Na extração não acontece a limpeza dos dados, para tal tarefa temos, dentro do processo de ETL, a etapa de transformação.