O Que É DATA MINING? (Definição e Finalidades)

0
1816

Última Atualização 20 de fevereiro de 2021

Além dos indicadores reativos que, uma vez implantados, automaticamente detectam as ocorrências com base nos indicadores mapeados, existem também os controles proativos, que requerem que os gestores os promovam periodicamente. Uma das técnicas que os gestores podem usar requer que sejam selecionadas, exploradas e modeladas grandes quantidades de dados para revelar padrões, tendências e relações que podem ajudar a identificar casos de fraude e corrupção. Relações ocultas entre pessoas, entidades e eventos são identificadas e as relações suspeitas podem ser encaminhadas para apuração específica. As anomalias apontadas por esse tipo de técnica não necessariamente indicam a ocorrência de fraude e corrupção, mas eventos singulares que merecem avaliação individualizada para a exclusão da possibilidade de fraude e corrupção e, no caso da não exclusão, uma investigação.

QUESTÃO ERRADA: Data mining é um conjunto de técnicas e ferramentas que permitem obter valores futuros a partir de dados passados processados estaticamente. Data mining substitui o data warehouse em relação à tomada de decisão, pois ambos possuem os mesmos recursos.

Datamining nada mais é do que uma série de procedimentos, técnicas e ferramentas para recuperar e analisar os dados de um Data Warehouse ou Data Mart à procura de padrões e tendências como regras de associação ou sequências temporais, para detectar relacionamentos sistemáticos entre variáveis, detectando assim novos subconjuntos de dados.)

QUESTÃO ERRADA: O processamento analítico online (OLAP) é adequado para a descoberta de padrões e relacionamentos em dados corporativos e para a inferência de regras que prevejam o efeito de decisões gerenciais.

Esse é o conceito de DATA MINING.

Conforme Barbieri – BI2 Business Intelligence pág. 109

“OLAP (On-line Analytical Processing), traduzido para processamento analítico on-line, representa esta característica de trabalhar os dados com operadores dimensionais, possibilitando uma forma múltipla e combinada de análise.

… O conceito de data mining, por outro lado, está mais relacionado com os processos de análise de inferência do que o de análise dimensional de dados e representa uma forma de busca de informação baseada em algoritmos que objetivam o reconhecimento de padrões escondidos nos dados e não necessariamente revelados pelas outras abordagens analíticas, como o OLAP.”

QUESTÃO ERRADA: Datamining é a tecnologia por intermédio da qual os processos são automatizados mediante racionalização e potencialização por meio de dois componentes: organização e tecnologia.

Mineração de dados refere-se à mineração ou descoberta de novas informações em termos de padrões ou regras com base em grandes quantidades de dados. Em nada o Datamining está relacionado com automação de processos, portanto, questão errada.

QUESTÃO CERTA: A finalidade do uso do data mining em uma organização é subsidiar a produção de afirmações conclusivas acerca do padrão de comportamento exibido por agentes de interesse dessa organização.

Sim, o data mining pode ser adotado para corroborar afirmações sobre o padrão de comportamento exibidos por agentes. Até porque data mining usa técnicas computacionais em busca de padrões e relacionamento entre os dados de um repositório, o que poderá dar aos gestores informações úteis para a tomada de decisões.

QUESTÃO CERTA: O uso prático de data mining envolve o emprego de processos, ferramentas, técnicas e métodos oriundos da matemática, da estatística e da computação, inclusive de inteligência artificial.

Data Mining (Mineração de Dados) é a principal etapa do processo de descoberta de conhecimento em bases de dados (Knowledge in Database Discovery – KDD), sendo responsável pelo processamento de dados com a finalidade de identificar novos padrões.

Esta área descende fundamentalmente de três linhas: a Estatística, a Inteligência Artificial(IA) e o Aprendizado de Máquina.

mineração de dados é o processo de descoberta de informações acionáveis em grandes conjuntos de dados. A mineração de dados usa análise matemática para derivar padrões e tendências que existem nos dados. Normalmente, esses padrões não podem ser descobertos com a exploração de dados tradicional pelo fato de as relações serem muito complexas ou por haver muitos dados.

QUESTÃO ERRADA: A descoberta de conhecimento em bases de dados, ou KDD (knowledge-discovery), é a etapa principal do processo de mineração de dados.

QUESTÃO ERRADA: No ambiente organizacional, devido à grande quantidade de dados, não é recomendado o emprego de data mining para atividades ligadas a marketing.

A questão está errada. Segundo Navathe (2011,p.715), tecnologias de mineração de dados podem ser aplicadas a uma grande variedade de contextos de tomada de decisão nos negócios. Em particular, algumas áreas de ganhos significativos devem incluir as seguintes:

-Marketing;

-Finanças;

-Manufatura;

-Saúde.

QUESTÃO CERTA: No contexto de data mining, o processo de descoberta de conhecimento em base de dados consiste na extração não trivial de conhecimento previamente desconhecido e potencialmente útil.

Data Mining é o processo de extrair informações relevantes, previamente desconhecidas e de máxima abrangência a partir de grandes bases de dados. O Data Mining permite explorar e inferir informações úteis a partir dos dados, descobrindo relacionamentos ocultos no banco de dados. Para tanto, utiliza várias técnicas da Estatística, Recuperação da Informação, Inteligência Artificial e Reconhecimento de Padrões. É a principal etapa do processo de Knowledge Discovery in Databases-KDD (descoberta de conhecimento em bases de dados), área de pesquisa que envolve Inteligência Artificial e Banco de Dados.

Advertisement

O processo de KDD (Knowledge Discovery in Databases-) pode ser dividido nas seguintes etapas: pré-processamento, extração de padrões (Data Mining), pós-processamento.

Na etapa de extração de padrões é realizada a escolha, a configuração e execução de um ou mais algoritmos para extração de padrões. Como esta etapa é um processo iterativo, pode ser necessário que seja executada diversas vezes para ajustar o conjunto de parâmetros visando à obtenção de resultados mais adequados aos objetivos estabelecidos. Esta etapa compreende a escolha da tarefa de Data Mining a ser empregada, a escolha do algoritmo e a extração dos padrões. A escolha da tarefa é feita de acordo com os objetivos pré-estabelecidos. As tarefas possíveis de um algoritmo de Data Mining podem ser agrupadas em atividades preditivas ou descritivas.

http://danuzafaria.pbworks.com/f/Figura_01.jpg

O processo Data Mining é realizado incorporando-se várias técnicas de diferentes áreas, três delas já comentadas na introdução deste trabalho (IA, Estatística e Aprendizado de Máquina), além delas temos também o Data Warehouse (DW) e Visualização de Dados.

Data Warehousing é um processo que consiste em organizar os dados corporativos a partir de várias fontes com o objetivo de ter uma visão detalhada e singular de parte ou do todo de um negócio. O produto deste processo é o Data Warehouse. O DW forma uma base de dados que permite efetuar um tratamento adequado à informação que é disponibilizada de forma rápida, segura e flexível. Para o processo de Data Mining não é necessário ter um DW, porém, apesar de não ser obrigatória, a construção de um DW reduz drasticamente a complexidade e a duração do processo de Data Mining na fase de pré-processamento (seleção, preparação e limpeza dos dados).

QUESTÃO CERTA: Um sistema de informação que objetive implementar a análise descritiva de dados deve incluir em sua arquitetura um processo composto pelas seguintes etapas: organizar os dados usando distribuições de frequência, apresentar os dados usando técnicas de visualização e calcular medidas de tendência central, variação e associação.

QUESTÃO ERRADA: Data mining é o processo não trivial de identificar, em bases de dados, padrões válidos, novos e potencialmente úteis ao usuário. KDD (knowledge discovery in databases) é um processo dentro do data mining.

O Data Mining é uma fase do KDD.

QUESTÃO CERTA: Para a realização de prognósticos por meio de técnicas de mineração de dados, parte-se de uma série de valores existentes obtidos de dados históricos bem como de suposições controladas a respeito das condições futuras, para prever outros valores e situações que ocorrerão e, assim, planejar e preparar as ações organizacionais.

QUESTÃO ERRADA: ETL é definido como o processo de descobrir padrões, associações, mudanças, anomalias e estruturas em grandes quantidades de dados armazenados ou em repositórios de informação gerais dentro do data mining.

Substitua ETL por data mining e data mining por DW – e a questão fica correta