Última Atualização 13 de janeiro de 2021
QUESTÃO: Além de estar relacionado à grande quantidade de informações a serem analisadas, o Big Data considera o volume, a velocidade e a variedade dos dados estruturados — dos quais se conhece a estrutura de armazenamento — bem como dos não estruturados, como imagens, vídeos, áudios e documentos.
Big Data é o termo que descreve o imenso volume de dados – estruturados e não estruturados – que impactam os negócios no dia a dia. A definição da questão está perfeitamente de acordo com o conceito, citando inclusive os 3Vs da definição inicial de Doug Laney. Sendo assim, a resposta para esta alternativa está correta.
É a análise e a interpretação de grandes volumes de dados de grande variedade, estruturados ou não.
Os V’s do Big data:
· Volume: Dados de grande variedade de fontes.
· Variedade: Quanto mais dados e fontes, maior q complexidade e possibilidades que tem de gerar informação útil.
· Velocidade: Os dados devem fluir em uma velocidade útil para que a tomada de decisões seja efetivada.
· Veracidade: O quanto a informação é verdadeira.
· Valor: A informação deve ser certa para pessoas certas, sendo, portanto, uma informação útil.
QUESTÃO ERRADA: A mineração de dados se caracteriza especialmente pela busca de informações em grandes volumes de dados, tanto estruturados quanto não estruturados, alicerçados no conceito dos 4V’s: volume de mineração, variedade de algoritmos, velocidade de aprendizado e veracidade dos padrões.
Questão está relacionada ao Big Data que contém Cinco dimensões “V” (segundo Bergson Lopes Rêgo). Quem tem V é big Data e não data mining.
Volume
Quantidade de dados. Quanto maior o volume, maiores os esforços na gestão de dados.
Velocidade
Desafio de lidar com o tempo rápido de resposta que os novos dados são criados e os dados existentes, modificados.
Variedade
Implementações de dados que requerem tratamento de vários formatos e tipos, incluindo dados estruturados e não estruturados.
Veracidade
Consiste no grau de incerteza e inconsistência dos dados devido às ambiguidades, à baixa qualidade e à completeza dos dados. Representa a confiabilidade dos dados.
Valor
Retorno, financeiro ou não.