Vale lembrar que isso vai baixar apenas os arquivos linkados nas páginas do site. Arquivos sem referência alguma não são passíveis de visualização.
Se você estava baixando alguma coisa via linha de comando com um
# wget www.origem.dominio/arquivo
e, de repente, o download parou, é possível continuar com:
# wget -c www.origem.dominio/arquivo
É possível também criar uma lista de links em um arquivo e pedir pro wget usá-la como arquivo de entrada:
# wget -f file
Para forçar o arquivo de entrada a ser tratado como um arquivo HTML, use o -F:
# wget -fF file
Asim, você poderia criar uma lista de sites interessantes e baixá-los todos de uma vez, ou criar uma lista de arquivos a serem baixados (seqüencialmente) e fazer o mesmo com eles.
O wget costuma enviar muita saída de texto, quem o usa em scripts normalmente não deseja este inconveniente. Logo, o melhor seria usar o wget desta maneira:
# wget -nv [outras opções] [links]
Assim, o wget só envia para tela mensagens onde ele avisa que um dado arquivo foi baixado com sucesso.
Para colocar o wget no segundo plano, sem o "&", faça o seguinte:
# wget -b
Existem muitas outras coisas legais pra se fazer com o wget, basta ter paciência de ler os "man"s do Unix.
[3] Comentário enviado por escorpion em 06/07/2006 - 13:41h
Quero puxar uma pagina q e' em asp, so q queria que o wget puxasse como html, qual o comando?
Ja tentei #wget -r ".html" http://site.com.br/
e nao funcionou, baixou apenas o index
[4] Comentário enviado por sfohart em 10/07/2006 - 08:00h
Não precisa especificar o tipo da página, ele só baixa html... Seria um equivoco de segurança ele deixar baixar código php com senhas de acesso a banco de dados de um servidor qualquer...
[5] Comentário enviado por Raptor em 21/08/2006 - 23:09h
Existe alguma forma de especificar para que o wget baixe apenas imagens jpg de um determinado site? Não gostaria q ele fizesse o download de gif, bmp, etc.
[10] Comentário enviado por gutorj em 08/10/2008 - 10:50h
Estou tentando usar o wget para baixar arquivos de um site que pede autenticação na página. Estou usando os parametros --http-user e --http-passwd mas sem sucesso.