Pular para o conteúdo

Convertendo arquivos PDF para TXT

Dica publicada em Linux / Miscelânea
edps edps
Hits: 32.773 Categoria: Linux Subcategoria: Miscelânea
  • Indicar
  • Impressora
  • Denunciar
O Viva o Linux depende da receita de anúncios para se manter. Ative os cookies aqui para nos patrocinar.
Não conseguimos carregar os anúncios. Se usa bloqueador, considere liberar o Viva o Linux para nos patrocinar.

Convertendo arquivos PDF para TXT

Uma pequena dica sobre como converter arquivos '.pdf' para '.txt'.

Recentemente, minha esposa e eu voltamos aos bancos escolares e boa parte do conteúdo disponibilizado pelos instrutores para leitura e/ou pesquisa, estão no formato '.pdf'.

Na maioria das vezes, acessíveis através do GoogleDocs (que por sinal, eu odeio!), nada como um bom link direto para baixar com o wget! (hehehe)

A ideia por trás da conversão dos '.pdf' para '.txt', visa primeiramente, a redução dos custos com a impressão de alguns destes materiais, visto que, com a conversão para texto puro, podemos editar/remover/inserir conteúdo, e somente depois imprimi-los - É uma boa ideia, ou não é?

* Sei também que usando o 'pdftk', dá para editar o arquivo '.pdf'.

Neste exemplo, o texto poderá ser acessado através do seguinte endereço: http://migre.me/8kbg4

E trata-se de um pequeno '.pdf' de 1MB e 60 páginas.

A conversão se dará através do comando pdftotext, disponível no pacote “poppler-utils” no Debian. Caso não o tenha instalado:

# apt-get update
# apt-get install poppler-utils


Propriedades do pacote no Synaptic:
O Viva o Linux depende da receita de anúncios para se manter. Ative os cookies aqui para nos patrocinar.
Não conseguimos carregar os anúncios. Se usa bloqueador, considere liberar o Viva o Linux para nos patrocinar.

- Conversão do '.pdf' para '.txt'

Use:

pdftotext arquivo.pdf novo-arquivo.txt
'.txt' visto com o Nano:
Em seguida, abri o LibreOffice Writer, colei o conteúdo do '.txt', salvei um novo arquivo com a extensão '.doc' e alterei a fonte para Arial 10.

Com isto, o novo arquivo (completo) ficou com somente 37 páginas.
Referência: http://linux.die.net - pdftotext

Dica publicada em meu Blog: http://gnu2all.blogspot.com.br

O Viva o Linux depende da receita de anúncios para se manter. Ative os cookies aqui para nos patrocinar.
Não conseguimos carregar os anúncios. Se usa bloqueador, considere liberar o Viva o Linux para nos patrocinar.

APT com cores e barra de progresso

SRWare Iron - Uma alternativa à dupla Chrome e Chromium

Archey, Bash Info Tool

Debian: modificando a forma como o APT instala pacotes

Escolhendo os melhores mirrors pro seu Arch Linux

Code Highlight

Teclas de atalhos para janelas no Vim

Fontes para Conky

Distro de música - Projeto Musix - Execute MIDI sem dor de cabeça

Iniciando uma segunda interface gráfica

#1 Comentário enviado por JJSantos em 24/05/2012 - 04:58h
Favoritado.
#2 Comentário enviado por removido em 27/05/2012 - 16:24h
Thanks brother!
#3 Comentário enviado por augustoschwartz em 20/06/2013 - 10:27h
Parabéns e obrigado pelo artigo.
Contribuiu bastante para meus trabalhos.

Contribuir com comentário

Entre na sua conta para comentar.