Análise de agrupamentos (clusterização)

0
795

Última Atualização 13 de janeiro de 2021

QUESTÃO CERTA: As aplicações de data mining utilizam diversas técnicas de natureza estatística, como a análise de conglomerados (cluster analysis), que tem como objetivo agrupar, em diferentes conjuntos de dados, os elementos identificados como semelhantes entre si, com base nas características analisadas.

A tarefa de clusterização, também chamada de Agrupamento ou Análise de Grupos, é usada para separar os registros de um conjunto de dados em subconjuntos ou grupos (clusters), de tal forma que elementos e um cluster compartilhem um conjunto de propriedades comuns que os distingam dos elementos de outros clusters. O agrupamento pode ser interpretado como um problema de otimização em que o objetivo é maximizar a similaridade intracluster e minimizar a similaridade intercluster. Diferentemente da tarefa de classificação, em que os registros estão associados a rótulos predefinidos, no Agrupamento os objetos considerados como entrada não possuem rótulos associados. Por essa razão, o Agrupamento é também denominado indução não supervisionada. A tarefa de Agrupamento pode ser definida como uma das tarefas primárias da Mineração de Dados que auxilia o usuário a identificar grupos naturais em um conjunto de dados.

QUESTÃO CERTA: Os algoritmos de Mineração de Dados podem ser classificados quanto a seus objetivos, sendo alguns a classificação, o agrupamento e a identificação de regras de associação. A respeito dessas classificações e seus algoritmos, assinale a alternativa correta: Algoritmos de agrupamento podem ser utilizados para classificação não supervisionada.

QUESTÃO CERTA: Agrupar registros em grupos, de modo que os registros em um grupo sejam semelhantes entre si e diferentes dos registros em outros grupos é uma maneira de descrever conhecimento descoberto durante processos de mineração de dados.

Clustering é a análise de dados sem consultar um rótulo (de classe ou conceito) conhecido. Geralmente, nesta tarefa, os rótulos dos dados de treinamento não estão presentes. Os dados são agrupados com base em princípios de maximização da distância intercalasses (minimização da similaridade) e minimização da distância intraclasses (maximização da similaridade).

Parte superior do formulário

QUESTÃO CERTA: Arquivos agrupados possibilitam a realização de operações de varredura e pesquisa com seleção por igualdade, mas não a de operações de inserção.

QUESTÃO CERTA: Em relação à análise de agrupamentos (clusterização) em mineração de dados, julgue o item seguinte. O método de clustering k-means objetiva particionar ‘n’ observações entre ‘k’ grupos; cada observação pertence ao grupo mais próximo da média.

Advertisement

Em mineração de dados, agrupamento k-means é um método de Clustering que objetiva particionar n observações dentre k grupos onde cada observação pertence ao grupo mais próximo da média. Isso resulta em uma divisão do espaço de dados em um Diagrama de Voronoi.

QUESTÃO ERRADA: O agrupamento (ou clustering) realiza identificação de grupos de dados que apresentam Coocorrência.

Negativo. Isso é regra de associação.

QUESTÃO CERTA: As aplicações de data mining utilizam diversas técnicas de natureza estatística, como a análise de conglomerados (cluster analysis), que tem como objetivo agrupar, em diferentes conjuntos de dados, os elementos identificados como semelhantes entre si, com base nas características analisadas.

QUESTÃO ERRADA: As regras de associação identificam grupos de dados, em que os dados têm características semelhantes aos do mesmo grupo e os grupos têm características diferentes entre si.

Negativo. Isso é clustering.

QUESTÃO ERRADA: As aglomerações, tipos de informação obtidos por meio da mineração de dados, caracterizam-se por se ligarem a um único e específico evento, em torno do qual ocorrem várias ações, com produção sistêmica de informações gerenciais que apoiarão uma nova ocorrência do mesmo tipo de evento.

Aglomerações ou clusters são grupos de indivíduos de uma amostra que possuem características semelhantes. Geralmente são definidos intervalos de valores, para cada intervalo temos um clusters, agrupamento ou aglomeração. Essa ideia de eventos em série relacionados a um evento inicial está relacionada a técnicas de associação.

QUESTÃO CERTA: na análise de grupamentos, medidas de correlação, medidas de distância e medidas de associação são alguns dos métodos utilizados para medir a semelhança entre objetos.