Extrair texto de um site [RESOLVIDO]

1. Extrair texto de um site [RESOLVIDO]

Diogo
diogo_flash

(usa Ubuntu)

Enviado em 26/10/2011 - 17:40h

Olá pessoal,
estou tentando fazer um script para conseguir os textos de uma página da internet. Mas não estou conseguindo.
O texto que desejo extrair é da seguinte página:

http://www.planalto.gov.br/ccivil_03/Leis/LCP/Lcp80.htm

Desejo extrair o máximo de texto desta página. Tentei usar o wget da seguinte forma:

wget http://www.planalto.gov.br/ccivil_03/Leis/LCP/Lcp80.htm

Mas ao fazer isso, baixei o .htm desta página.

Agradeço desda já.


  


2. MELHOR RESPOSTA

Renato Carneiro Pacheco
renato_pacheco

(usa Debian)

Enviado em 26/10/2011 - 17:46h

Use o curl:


curl http://www.planalto.gov.br/ccivil_03/Leis/LCP/Lcp80.htm






Patrocínio

Site hospedado pelo provedor RedeHost.
Linux banner

Destaques

Artigos

Dicas

Tópicos

Top 10 do mês

Scripts