Mineração de texto

0
277

Última Atualização 13 de janeiro de 2021

QUESTÃO CERTA: É comum um determinado órgão público receber reclamações de pessoas sobre o atendimento do serviço. As reclamações recebidas são digitadas de forma apressada em um aplicativo de computador. O administrador do órgão pretende obter informações úteis para análise das reclamações. Assim, ele solicita o apoio tecnológico para atendimento dessa demanda. A equipe então adota, acertadamente, uma solução específica para tratamento de dados semi-estruturados (o software utiliza uma ontologia de correlação de palavras e conceitos) conhecida por mining de texto. 

Mineração de texto, conhecida também como mineração de dados textuais e semelhante à análise textual, refere-se ao processo de obtenção de informações importantes de um texto.

 

Uma aplicação comum é examinar um conjunto de documentos escritos em uma linguagem natural e, ou modelar o conjunto de documentos para fins de classificação preditiva ou preencher um banco de dados ou índice de pesquisa com as informações extraídas.

Etapas da Metodologia de Mineração de Textos

Coleta: Formatação da base de documentos ou Corpus. (Robôs de Crawling atuando em qualquer ambiente.

Pré-Processamento: Preparação dos dados. (Processamento de Linguagem Natural[PLN]).

Indexação: Objetivo acesso rápido, busca. (Recuperação de Informação [IR]).

Mineração: Cálculos, inferências e extração de conhecimento. (Mineração de Dados[DM]).

Análise: Análise humana. Navegação. (Leitura e Interpretação dos dados).

QUESTÃO CERTA: A mineração de texto consiste basicamente na extração de informação de qualidade a partir de textos em linguagem natural. Esse processo possui normalmente cinco fases principais. Com relação à fase que permite a recuperação da informação minerada, assinale a alternativa correta: Indexação.

A indexação, ou representação temática, é a ação de descrever e identificar um documento de acordo com o seu assunto. A partir dessa descrição/identificação é possível recuperá-lo.

Advertisement

QUESTÃO CERTA: É um meio de encontrar padrões interessantes ou úteis em um contexto de informações textuais não estruturadas, combinado com alguma tecnologia de extração e de recuperação da informação, processo de linguagem natural e de sumarização/indexação de documentos. (Dixson, 1997, apud TRYBULA, 1999). O conceito apresentado pelo autor se refere ao processo de: mineração de texto.

QUESTÃO CERTA: O processo de busca e recuperação da informação pode ser conceituado como o processo de localizar documentos e itens de informação que tenham sido objeto de armazenamento, com a finalidade de permitir o acesso dos usuários aos itens de informação solicitados. Rogério Henrique de Araújo Junior. Precisão no processo de busca e recuperação da informação. Brasília: Thesaurus, 2007 (com adaptações). Acerca de estratégia de busca de informação, julgue o item que se segue. No âmbito da estratégia de busca e recuperação da informação, a descoberta por análise linguística é uma tipologia de mineração de texto.