Pular para o conteúdo

Web Mining

Este artigo, feito por mim e colegas do curso de Mestrado em Ciência da Computação, não tem a finalidade de prover ninguém com informações avançadas sobre Web Mining e sim, mostrar algumas vantagens, escopo e resultados que podem ser obtidos, além de claro, motivar sua pesquisa sobre o assunto.
Quintino Izidio dos Santos Neto kitoneto
Hits: 31.957 Categoria: Banco de Dados Subcategoria: Miscelânea
  • Indicar
  • Impressora
  • Denunciar

Parte 2: Introdução

Mineração na Web mostra padrões de comportamento no uso da Web, para isso, são aplicadas técnicas de Data Mining no conteúdo Web. A análise pode ser feita sobre páginas visitadas, tempo gasto em cada uma, quais as mais freqüentadas, associações entre páginas e padrões transversos (páginas não ligadas diretamente por Hyperlinks, e sim por meio de outras páginas).

Estão sendo discutidas estratégias para analisar seqüências de páginas para definir comportamento de usuários. Identificar certos tipos de usuários, comparar padrões de compradores e não compradores, identificar diferenças entre usuários visitantes rápidos, usuários investigadores e usuários compradores. O conhecimento obtido com essa investigação pode servir para projetar páginas com o objetivo de maximizar a eficiência de contato com o cliente.

Web Mining é freqüentemente associado com "Recuperação de Informação", mas na verdade trata-se de um processo mais amplo, interdisciplinar, envolvendo técnicas de Recuperação de Informação, estatística, inteligência artificial e mineração de dados.

Em geral, as tarefas principais de Web Mining são as seguintes:
  • Busca de documentos: consiste em se encontrar sites Web contendo documentos especificados por palavras-chave. É o processo de se extrair dados a partir de fontes de textos disponíveis na Internet, tais como conteúdos de textos de documentos HTML obtidos removendo-se as tags HTML, textos extraídos de grupos de discussão, newsletters, etc. Esta tarefa envolve a utilização de técnicas de Recuperação de Informação.
  • Seleção e pré-processamento da informação: consiste em selecionar e pré-processar automaticamente informações obtidas na Internet. O pré-processamento envolve qualquer tipo de transformação da informação obtida na busca, como, por exemplo, corte de textos, transformação da representação da informação em outros formalismos.
  • Generalização: consiste em descobrir automaticamente padrões gerais em sites Web ou entre vários sites Web. Esta tarefa envolve a utilização de técnicas de inteligência artificial e de mineração de dados.
  • Análise: validação e interpretação dos padrões minerados.

   1. Web mining
   2. Introdução
   3. As categorias de Web Mining
   4. Conclusão
Nenhum artigo encontrado.

Automatizando a criação de uma base de conhecimento em Prolog para gerenciar os acessos a um site

Elasticsearch na saúde

MySQL + Amarok: dupla poderosa

Paginação de resultados com a classe ADODB

Conhecendo o xHarbour

#1 Comentário enviado por thelinux em 08/09/2006 - 19:57h
Nota 10 por estarem compartilhando informacoes.
#2 Comentário enviado por thelinux em 08/09/2006 - 19:58h
E facil da nota baixa e nao se identifica. Nota 10 para o trabalho de voces.
#3 Comentário enviado por removido em 09/09/2006 - 23:41h
Poxa thelinux, um pouco mais de calma. O kra expressou o que ele achou. A vantagem do software livre é justamente a liberdade de expressão. Tenho certeza que o autor não está preocupado com a nota aqui. O importante é compartilhar, se gostarem ou não, não importa.

Nada é tão bom ao ponto de todos gostarem e nem tão ruim ao ponto de ninguém gostar.

Quanto ao artigo, está ótimo. Mesmo não sendo voltado ao linux, foi muito interessante. Este é o primeiro artigo do autor. que já começou muito bem então espero que continue ativamente na comunidade.

[]'s
#4 Comentário enviado por thelinux em 11/09/2006 - 08:18h
Esta é minha opinião. A liberdade realmente é importante e realmente fico chateado quando pessoas dão nota sem se identificar nem justificar. Geralmente estas pessoas não contribuem em nada para o Linux.

fdettoni - sou um cara muito tranquilo.

Mas é isso.
#5 Comentário enviado por fmpfmp em 11/09/2006 - 10:14h
.
#6 Comentário enviado por carlocesar em 12/09/2006 - 09:34h
Parabéns pela iniciativa de compartilhar este tipo de assunto, que por sinal está muito bem explicado!

carlocesar
#7 Comentário enviado por jalexandre em 12/09/2006 - 11:16h
Massa esse artigo. Muito interessante esse tal de Web Mining :)
Parabéns.
#8 Comentário enviado por haduken em 21/05/2009 - 23:51h
excelente artigo sobre web mining, aborda de maneira muito prática o assunto! parabéns!

Contribuir com comentário

Entre na sua conta para comentar.