QUESTÃO CERTA: É comum um determinado órgão público receber reclamações de pessoas sobre o atendimento do serviço. As reclamações recebidas são digitadas de forma apressada em um aplicativo de computador. O administrador do órgão pretende obter informações úteis para análise das reclamações. Assim, ele solicita o apoio tecnológico para atendimento dessa demanda. A equipe então adota, acertadamente, uma solução específica para tratamento de dados semi-estruturados (o software utiliza uma ontologia de correlação de palavras e conceitos) conhecida por mining de texto.
Mineração de texto, conhecida também como mineração de dados textuais e semelhante à análise textual, refere-se ao processo de obtenção de informações importantes de um texto.
Uma aplicação comum é examinar um conjunto de documentos escritos em uma linguagem natural e, ou modelar o conjunto de documentos para fins de classificação preditiva ou preencher um banco de dados ou índice de pesquisa com as informações extraídas.
Etapas da Metodologia de Mineração de Textos
Coleta: Formatação da base de documentos ou Corpus. (Robôs de Crawling atuando em qualquer ambiente.
Pré-Processamento: Preparação dos dados. (Processamento de Linguagem Natural[PLN]).
Indexação: Objetivo acesso rápido, busca. (Recuperação de Informação [IR]).
Mineração: Cálculos, inferências e extração de conhecimento. (Mineração de Dados[DM]).
Análise: Análise humana. Navegação. (Leitura e Interpretação dos dados).
QUESTÃO CERTA: A mineração de texto consiste basicamente na extração de informação de qualidade a partir de textos em linguagem natural. Esse processo possui normalmente cinco fases principais. Com relação à fase que permite a recuperação da informação minerada, assinale a alternativa correta: Indexação.
A indexação, ou representação temática, é a ação de descrever e identificar um documento de acordo com o seu assunto. A partir dessa descrição/identificação é possível recuperá-lo.
QUESTÃO CERTA: É um meio de encontrar padrões interessantes ou úteis em um contexto de informações textuais não estruturadas, combinado com alguma tecnologia de extração e de recuperação da informação, processo de linguagem natural e de sumarização/indexação de documentos. (Dixson, 1997, apud TRYBULA, 1999). O conceito apresentado pelo autor se refere ao processo de: mineração de texto.
QUESTÃO CERTA: O processo de busca e recuperação da informação pode ser conceituado como o processo de localizar documentos e itens de informação que tenham sido objeto de armazenamento, com a finalidade de permitir o acesso dos usuários aos itens de informação solicitados. Rogério Henrique de Araújo Junior. Precisão no processo de busca e recuperação da informação. Brasília: Thesaurus, 2007 (com adaptações). Acerca de estratégia de busca de informação, julgue o item que se segue. No âmbito da estratégia de busca e recuperação da informação, a descoberta por análise linguística é uma tipologia de mineração de texto.