Árvore de Decisão e Estratificação

0
1001

Última Atualização 3 de janeiro de 2025

Nessa dica do Caderno de Prova, vamos estudar sobre árvore de decisão à ótica da estratificação. Já ouviu falar sobre elas? Para começar, vejamos uma questão da FUNCAB (2014):

QUESTÃO CERTA: Nos processos de Data Mining, a partir de uma massa de dados, uma técnica estatística cria e organiza regras de classificação em formato de diagramas, que vão ordenar suas observações ou predizer resultados futuros. Uma das abordagens empregadas nessa técnica é a estratificação, que determina regras para que se possa designar cada caso a uma dentre várias categorias existentes, como, por exemplo, classificar um cliente tomador de crédito em um grupo de elevado, médio ou baixo risco. Essa técnica estatística é denominada: árvore de decisão.

CEBRASPE (2018):

QUESTÃO CERTA: Na técnica de árvore de decisão em data mining, é empregada a abordagem denominada: estratificação.

Estratificação: É um método utilizado para separar (ou estratificar) um conjunto de dados de modo a perceber que existe um padrão. Consiste na divisão de um grupo em diversos subgrupos com base em fatores apropriados os quais são conhecidos como fatores de estratificação.

Fonte: MAGALHÃES, Ivan Luizio; PINHEIRO, Valfrido brito. Gerenciamento de serviços de TI na prática: uma abordagem com base na ITIL.

CEBRASPE (2016):

QUESTÃO CERTA: Em DataMining, as árvores de decisão podem ser usadas com sistemas de classificação para atribuir informação de tipo.

CEBRASPE (2016):

QUESTÃO ERRADA: As redes neurais são um recurso matemático/computacional usado na aplicação de técnicas estatísticas nos processos de data mining e consistem em utilizar uma massa de dados para criar e organizar regras de classificação e decisão em formato de diagrama de árvore, que vão classificar seu comportamento ou estimar resultados futuros.

A questão fala sobre as árvores decisórias.

Advertisement

Existe uma avalanche de conceitos misturados: redes neurais, que fazem parte do conjunto de assuntos relacionados a inteligência artificial; técnicas estatística e arvore de decisão. Cada técnica de mineração é usada com um propósito especifico, por exemplo, a classificação vai permitir que você classifique novas entradas de acordo com um conjunto pré-determinado de saídas, que foram construídos em uma etapa anterior do processo. A questão peca por misturar vários conceitos.

CEBRASPE (2024):

QUESTÃO ERRADA: As árvores de decisão apresentam significativa independência dos dados de treinamento, o que garante forte estabilidade dos caminhos em caso de mudanças nos dados.

As árvores de decisão são altamente dependentes dos dados de treinamento. Pequenas mudanças nos dados de treinamento podem levar a alterações significativas na estrutura da árvore, como mudanças nos nós ou nos caminhos escolhidos. Isso ocorre porque as árvores de decisão são sensíveis a variações nos dados, sendo propensas ao overfitting quando treinadas em dados ruidosos ou com alta variabilidade. Para melhorar a estabilidade, é comum utilizar métodos como ensemble learning, incluindo random forests ou boosting, que combinam múltiplas árvores para reduzir a sensibilidade e melhorar a robustez do modelo.