Mineração da web

Definição - O que significa Web Mining?

Web mining é o processo de usar técnicas e algoritmos de data mining para extrair informações diretamente da Web, extraindo-as de documentos e serviços da Web, conteúdo da Web, hiperlinks e logs de servidor. O objetivo da mineração da Web é procurar padrões nos dados da Web, coletando e analisando informações para obter insights sobre as tendências, a indústria e os usuários em geral.

Definirtec explica Web Mining

A mineração da Web é um ramo da mineração de dados que se concentra na World Wide Web como a fonte de dados primária, incluindo todos os seus componentes, desde o conteúdo da Web, os logs do servidor e tudo mais. O conteúdo dos dados extraídos da Web pode ser uma coleção de fatos que as páginas da Web devem conter e podem consistir em texto, dados estruturados como listas e tabelas e até mesmo imagens, vídeo e áudio.

Categorias de mineração na web:

  • Mineração de conteúdo da Web - Este é o processo de extração de informações úteis do conteúdo de páginas da Web e documentos da Web, que são principalmente arquivos de texto, imagens e áudio / vídeo. As técnicas usadas nesta disciplina foram fortemente extraídas do processamento de linguagem natural (PNL) e da recuperação de informações.
  • Mineração de estrutura da Web - É o processo de análise dos nós e da estrutura de conexão de um site por meio da teoria dos grafos. Duas coisas podem ser obtidas com isso: a estrutura de um site em termos de como ele está conectado a outros sites e a estrutura do documento do próprio site, em como cada página está conectada.
  • Mineração de uso da Web - Este é o processo de extração de padrões e informações de logs de servidor para obter insights sobre a atividade do usuário, incluindo de onde os usuários são, quantos clicaram em qual item no site e os tipos de atividades realizadas no site.