Cross Industry Standard Process for Data Mining (CRISP-DM) é uma metodologia especificamente desenhada para processos de mineração de dados.
QUESTÃO ERRADA: CRISP-DM é uma metodologia proprietária que identifica as fases Business Understanding e Data Understanding na implantação de um projeto de data mining.
CRISP-DM é a abreviação de CRoss Industry Standard Process for Data Mining, que pode ser traduzido como Processo Padrão Inter-Indústrias para Mineração de Dados. É um modelo de processo de mineração de dados que descreve abordagens comumente usadas por especialistas em mineração de dados para atacar problemas.
Antes de preparar os dados os mesmos precisam ser entendidos. As duas primeiras fases do CRISP-DM são mesmo compreensão do negócio e compreensão dos dados. A preparação dos dados entra apenas como uma terceira fase no processo.
O CRISP-DM é um modelo de mineração de dados (não-proprietário) utilizado para guiar os esforços de Data Mining nas empresas.
QUESTÃO CERTA: Conforme o modelo CRISP-DM o ciclo de vida de um projeto de mineração de dados consiste de 6 (seis) fases que são: Compreensão do Negócio, Compreensão dos Dados, Preparação dos Dados, Modelagem, Avaliação e Desenvolvimento.
1- Entender o Negócio: foca em entender o objetivo do projeto a partir de uma perspectiva de negócios, definindo um plano preliminar para atingir os objetivos.
2- Entender os Dados: recolhimento de dados e início de atividades para familiarização com os dados, identificando problemas ou conjuntos interessantes.
3- Preparação dos Dados: construção do conjunto de dados final a partir dos dados iniciais. Normalmente ocorre várias vezes no processo.
4- Modelagem: várias técnicas de modelagem são aplicadas, e seus parâmetros calibrados para otimização. Assim, é comum retornar à Preparação dos Dados durante essa fase.
5- Avaliação: é construído um modelo que parece ter grande qualidade de uma perspectiva de análise de dados. No entanto, é necessário verificar se o modelo atinge os objetivos do negócio.
6- Desenvolvimento: o conhecimento adquirido pelo modelo é organizado e apresentado de uma maneira que o cliente possa utilizar.
QUESTÃO CERTA: A verificação da qualidade dos dados é uma atividade da fase de entendimento dos dados.
QUESTÃO CERTA: A fase de implantação do CRISP-DM (cross industry standard process for data mining) só deve ocorrer após a avaliação do modelo construído para atingir os objetivos do negócio.
QUESTÃO ERRADA: Durante a fase de entendimento do negócio, busca-se descrever claramente o problema, fazer a identificação dos dados e verificar se as variáveis relevantes para o projeto não são interdependentes.
Observe que a banca misturou conceitos das fases 1 e 2 no enunciado da questão. Durante a fase de entendimento do negócio, busca-se descrever claramente o problema, e na fase de entender os dados é possível fazer a identificação dos dados e verificar se as variáveis relevantes para o projeto não são interdependentes. Portanto, a assertiva está errada.
QUESTÃO CERTA: O modelo de referência CRISP-DM tem seu ciclo de vida estruturado nas seguintes 6 fases: Entendimento do Negócio, Entendimento dos Dados, Preparação dos Dados, Modelagem, Avaliação e Implantação.
Fases do CRISP-DM
Entender o Negócio: foca em entender o objetivo do projeto a partir de uma perspectiva de negócios, definindo um plano preliminar para atingir os objetivos.
Entender os Dados: recolhimento de dados e início de atividades para familiarização com os dados, identificando problemas ou conjuntos interessantes.
Preparação dos Dados: construção do conjunto de dados final a partir dos dados iniciais. Normalmente ocorre várias vezes no processo.
Modelagem: várias técnicas de modelagem são aplicadas, e seus parâmetros calibrados para otimização. Assim, é comum retornar à Preparação dos Dados durante essa fase.
Avaliação: é construído um modelo que parece ter grande qualidade de uma perspectiva de análise de dados. No entanto, é necessário verificar se o modelo atinge os objetivos do negócio.
Implantação: o conhecimento adquirido pelo modelo é organizado e apresentado de uma maneira que o cliente possa utilizar.
QUESTÃO ERRADA: CRISP-DM é uma suíte de ferramentas proprietárias que vem se tornando um padrão da indústria para mineração de dados, uma vez que fornece um plano completo e tecnologias para a realização de um projeto de mineração de dados.
Cross Industry Standard Process for Data Mining (CRISP-DM) é uma metodologia especificamente desenhada para processos de mineração de dados
QUESTÃO ERRADA: Durante a fase de preparação dos dados, é realizado um inventário de requisitos, suposições e restrições de recursos.
Essa é a fase de Entendimento do Negócio.
QUESTÃO ERRADA: Na fase de avaliação dos dados, são realizadas as atividades de identificar valores especiais dos dados e catalogar seu significado.
Essa é a fase de Modelagem.
QUESTÃO ERRADA: Na fase de preparação dos dados, são realizadas as atividades de analisar o potencial de implantação de cada resultado e estimar o potencial de melhoria do processo atual.
Essa é a fase de Avaliação.
QUESTÃO ERRADA: Em um processo de mineração, durante a etapa de preparação dos dados, são analisados os requisitos de negócio para consolidar os dados.
QUESTÃO ERRADA: Na primeira fase do CRISP-DM (cross industry standard process for data mining), há o entendimento dos dados para que se analise a qualidade destes.
CEBRASPE (2022):
QUESTÃO CERTA: Entendimento do negócio e compressão dos dados são algumas das fases do ciclo de vida do modelo de referência CRISP‐DM.