Pular para o conteúdo

Descobrindo o PageRank de um site via linha de comando

Dica publicada em Perl / Internet
Fábio Berbert de Paula fabio
Hits: 8.190 Categoria: Perl Subcategoria: Internet
  • Indicar
  • Impressora
  • Denunciar
O Viva o Linux depende da receita de anúncios para se manter. Ative os cookies aqui para nos patrocinar.
Não conseguimos carregar os anúncios. Se usa bloqueador, considere liberar o Viva o Linux para nos patrocinar.

Descobrindo o PageRank de um site via linha de comando

Nesta rápida dica criaremos um simples Perl script para recuperar o PageRank de um site através de linha de comando.

Para quem não sabe o que é PageRank, eis um trecho de sua definição na Wikipédia:

O sistema PageRank é usado pelo motor de busca Google para ajudar a determinar a relevância ou importância de uma página. Foi desenvolvida pelos fundadores do Google, Larry Page e Sergey Brin enquanto cursavam a Universidade de Stanford em 1998.

O Google mantém uma lista de bilhões de páginas em ordem de importância, isto é, cada página tem sua importância na Internet como um todo; esse Banco de Páginas mantém desde a página mais importante do mundo até a menos importante. Essa importância se dá pelo número de votos que uma página recebe. Um voto é um link em qualquer lugar da Internet para aquela página. Votos de páginas mais importantes valem mais do que votos de páginas menos importantes.


Fonte: http://pt.wikipedia.org/wiki/PageRank

Para executar nosso script será necessário a instalação do módulo Perl WWW:Google::PageRank. Vamos instalá-lo via CPAN:

sudo perl -MCPAN -e shell

Na shell interativa comande:

cpan[1]> install WWW::Google::PageRank
cpan[1]> exit

De volta ao terminal, vamos verificar se a instalação do módulo foi executada com sucesso:

perl -MWWW::Google::PageRank -e 'print "ok\n"'

A saída deve ser um simples "ok".

Agora vamos ao script em si. Abra um editor de texto de sua preferência e crie um arquivo com o seguinte conteúdo:

#!/usr/bin/perl use WWW::Google::PageRank; my $pr = WWW::Google::PageRank->new; foreach my $site (@ARGV) { if ( $site !~ /^http/i ) { $site = "http://$site"; } print "$site tem pagerank " . scalar($pr->get($site)) . "\n"; }
O Viva o Linux depende da receita de anúncios para se manter. Ative os cookies aqui para nos patrocinar.
Não conseguimos carregar os anúncios. Se usa bloqueador, considere liberar o Viva o Linux para nos patrocinar.

Salve com um nome qualquer, aqui adotei pagerank.pl.

Dê permissão de execução:

chmod a+x pagerank.pl

E finalmente execute-o, passando a lista dos sites desejados como parâmetro:

./pagerank.pl www.vivaolinux.com.br
http://www.vivaolinux.com.br tem pagerank 6


Outro exemplo:

pagerank.pl www.vivaolinux.com.br br-linux.org www.doode.com.br under-linux.org dicas-l.com.br softwarelivre.org www.noticiaslinux.com.br
http://www.vivaolinux.com.br tem pagerank 6
http://br-linux.org tem pagerank 6
http://www.doode.com.br tem pagerank 5
http://under-linux.org tem pagerank 6
http://dicas-l.com.br tem pagerank 7
http://softwarelivre.org tem pagerank 7
http://www.noticiaslinux.com.br tem pagerank 6


É isso.

Um abraço.

O Viva o Linux depende da receita de anúncios para se manter. Ative os cookies aqui para nos patrocinar.
Não conseguimos carregar os anúncios. Se usa bloqueador, considere liberar o Viva o Linux para nos patrocinar.

Redirecionando saída de comando para arquivo com sudo

Novo portal Linux: Open SCRIPT

"Ctrl + a" para selecionar tudo no Vim

Como aumentar ou reduzir a velocidade de um vídeo via linha de comando

Logs coloridos com o grep

Dicas e macetes sobre o Firefox

Munin - estatísticas para servidores

Gerando estatísticas de acesso ao web server com awstats em arquivos html estáticos

Perl e jQuery

Checar se tal partição está montada pelo Nagios

#2 Comentário enviado por julio_hoffimann em 20/09/2011 - 18:27h
Legal Fábio!

Como sempre Perl se mostrando uma ótima linguagem para utilitários web. :-)

Abraço!

P.S.: Os comentários enviados por autores nos artigos estão funcionando. ;-)
#3 Comentário enviado por removido em 21/09/2011 - 11:41h
Bem legal !

Contribuir com comentário

Entre na sua conta para comentar.