Pular para o conteúdo

Instalando e utilizando o Web Crawler OpenWebSpider

Este artigo ensina como instalar, configurar e utilizar o OpenWebSpider, um programa que tem por finalidade visitar sites, ler suas páginas e criar um índice de entradas para uma engine de busca.
andre uebe andreuebe
Hits: 12.733 Categoria: Linux Subcategoria: Software
  • Indicar
  • Impressora
  • Denunciar
O Viva o Linux depende da receita de anúncios para se manter. Ative os cookies aqui para nos patrocinar.
Não conseguimos carregar os anúncios. Se usa bloqueador, considere liberar o Viva o Linux para nos patrocinar.

Parte 2: Utilização

A utilização do OpenWebSpider consiste na informação de uma URL a ser indexada, seguida pela busca de alguma expressão chave que se deseje localizar na mesma.

Vamos ver como deve ser este procedimento.

Na aba "Worker", informe a URL, conforme mostrado na figura a seguir:
Linux: Instalando e utilizando o Web Crawler OpenWebSpider
Clique em "GO".

Automaticamente a aba "Workers" se abrirá, mostrando o progresso dos trabalhos de indexação da URL, como mostrado:
Linux: Instalando e utilizando o Web Crawler OpenWebSpider
Uma vez finalizada a indexação, basta ir à aba "Search" e inserir a expressão de busca.

O OpenWebSpider trará todas as expressões correspondentes indexadas no DB, como mostrado a seguir:
Linux: Instalando e utilizando o Web Crawler OpenWebSpider
O Viva o Linux depende da receita de anúncios para se manter. Ative os cookies aqui para nos patrocinar.
Não conseguimos carregar os anúncios. Se usa bloqueador, considere liberar o Viva o Linux para nos patrocinar.

Considerações

Existem diversos softwares de Web Crawler para mineração de dados, sendo que o OpenWebSpider é uma das opções de código aberto.

Uma listagem de possíveis alternativas pode ser obtida aqui:
O uso destes mecanismos de busca indexada têm várias finalidades úteis como, por exemplo, criar um motor de busca que sirva para buscar citações plagiadas em trabalhos acadêmicos.

Lembre-se sempre de citar as fontes das informações ao fazer um trabalho acadêmico e, se for utilizar as mesmas palavras, chamada citação direta, coloque-as entre aspas, informando autor e página. Deste modo, evitarás a situação de plágio que é tomar como suas as palavras de alguém.

Em caso de citação indireta em um trabalho acadêmico, escreva COM SUAS PALAVRAS, o pensamento apreendido, fazendo a devida citação das fontes. Isto NÃO É plágio.

Abraço a todos.

Referências


O Viva o Linux depende da receita de anúncios para se manter. Ative os cookies aqui para nos patrocinar.
Não conseguimos carregar os anúncios. Se usa bloqueador, considere liberar o Viva o Linux para nos patrocinar.
   1. O que é o OpenWebSpider
   2. Utilização

Configurando impressoras no programa do SERPRO / Emulador 3270

BrisCAD: Manipulando arquivos do Autocad (.dwg) no Linux

Fazendo o Palm/Treo Funcionar no Ubuntu/KUbuntu

Token de Certificação para Assinatura Digital OAB - Instalação no Ubuntu 14.04/15.04

Um breve histórico do EaD e o uso de AVAs baseados em SL

Introdução ao OpenLDAP com o JXplorer

GLPI - Implantação de Central de Serviços

Garantindo o funcionamento de serviços com o restartd

Finnix - Ótima distro para manutenção de sistemas

Servidor LAMP com PHP7 no Linux Mint 18 e no Ubuntu 16.04

Nenhum comentário foi encontrado.

Contribuir com comentário

Entre na sua conta para comentar.