wget para baixar livro distribuído em vários diretórios?

1. wget para baixar livro distribuído em vários diretórios?

Elias Zoby
zoby

(usa Slackware)

Enviado em 17/12/2009 - 07:43h

Preciso baixar um livro que está distribuído em 3 diretórios.
http://homeoint.org/books/kentrep/index.htm é o índice para todas as páginas.
Neste ../kentrep/ fica fácil. O comando é
wget -r -A “.gif,.jpg,.htm” -k -np -nc -t5 http://homeoint.org/books/kentrep/index.htm

O problema é q há tb os diretórios ../kentrep1, ../kentrep2/ e ../kentrep3/ todos com muitas páginas, mas sem um index.htm. As páginas contidas nestes últimos são ligadas do primeiro (../kentrep/).
Por ex., em ../kentrep/kentgene.htm estão os links para ../kentrep3/kent1340.htm .

Quando eu dou o primeiro comando citado acima, não vêm as páginas de ../kentrep1, 2 e 3.

C/o eu poderia baixá-las?

De antemão, brigadão.


  


2. Re: wget para baixar livro distribuído em vários diretórios?

Perfil removido
removido

(usa Nenhuma)

Enviado em 17/12/2009 - 11:23h

nao sei como é a estrutura, mas poderia tentar:

wget -m -c http://homeoint.org/books/kentrep/

e deixar o pau torar...

avise se deu certo.


3. Re: wget para baixar livro distribuído em vários diretórios?

Perfil removido
removido

(usa Nenhuma)

Enviado em 17/12/2009 - 13:55h

nao entendi muito bem, mas quando queria baixar varios arquivos pelo wget fazia assim

wget -c "link" "link" "etc"


4. Re: wget para baixar livro distribuído em vários diretórios?

Elias Zoby
zoby

(usa Slackware)

Enviado em 17/12/2009 - 14:16h

Obrigado pelas tentativas. Mas não é bem assim.
-c é para continuar baixando algo q já havia descido parcialmente.
-m funcionaria **se tivesse um arquivo com a lista de todas as páginas do diretório". Mas foi justamente por falta disso a minha pergunta. Tentei por consideração ao colega q respondeu, não funcionou.

Sobre colocar "link" "link" ... Seria trabalho braçal mas daria certo, **se eu soubesse o nome de todos os arquivos no diretório**. São mais de 1000 páginas, sem um arquivo index.html . Portanto eu não sei o nome de cada arquivo nesses ../kentrep[1-3].

Vou reformular minha pergunta:
Como baixar um diretório da internet sem ter uma lista de todas as páginas desse diretório?



5. Re: wget para baixar livro distribuído em vários diretórios?

Perfil removido
removido

(usa Nenhuma)

Enviado em 17/12/2009 - 15:05h

se vc colocar a estrutura poderia-se ate fazer um script

tentei: wget -c -m http://homeoint.org/books/kentrep/index.htm

e começou baixar tudo, o q vc precisa pegar?


6. Re: wget para baixar livro distribuído em vários diretórios?

Elias Zoby
zoby

(usa Slackware)

Enviado em 17/12/2009 - 16:01h

Baixou um monte de páginas, não tudo. Ainda faltam cerca de 2/3 ou 3/4 do livro. Falta tudo q está nos diretórios kentrep1-3.

Note q veio um arquivo index.htm. Todas as páginas c/ link neste arquivo vieram. Vc deve ter baixado um arquivo c/ o seguinte endereço
www.homeoint.org/books/kentrep/kentgene.htm
Se abrir esse arquivo, *sem acesso à internet*, verá q nenhuma das páginas p/ as quais ele remete foram baixadas. Isso porque estão todas no diretório ../kentrep3 e só vieram as de kentrep/.

Veja se vieram arquivos c/ os seguintes nomes: kent1340.htm, kent1420.htm. Se vieram, acho q vc baixou tudo. Senão, é c/o eu já disse.






Patrocínio

Site hospedado pelo provedor RedeHost.
Linux banner

Destaques

Artigos

Dicas

Tópicos

Top 10 do mês

Scripts