Pular para o conteúdo

Extraindo imagens de arquivos PDF no Ubuntu via linha de comando

Dica publicada em Linux / Comandos
Jonatas Augusto sedan75
Hits: 13.476 Categoria: Linux Subcategoria: Comandos
  • Indicar
  • Impressora
  • Denunciar
O Viva o Linux depende da receita de anúncios para se manter. Ative os cookies aqui para nos patrocinar.
Não conseguimos carregar os anúncios. Se usa bloqueador, considere liberar o Viva o Linux para nos patrocinar.

Extraindo imagens de arquivos PDF no Ubuntu via linha de comando

Baixei um visualizador de quadrinhos para meu PSP, mas infelizmente (ou felizmente, pelo motivo desta postagem), ele não oferece suporte para arquivos em PDF.

Então procurei um extrator de imagens de arquivos PDF e encontrei uma série de programas que modificavam, extraiam textos e visualizavam arquivos no formato PDF. Mas nenhum que oferecesse simplicidade na extração das imagens de dentro destes arquivos em PDF.

Alguns desses, como o PDF Editor e o GIMP, até oferecem a opção de extração de arquivo por arquivo, mas, imaginem extrair 70, 80... 100 páginas/imagens ou mais, e uma a uma, de um PDF!

Foi quando encontrei comentários sobre o pacote poppler-utils, cujo um dos comandos, tem por finalidade exportar arquivos PDF para HTML, consequentemente, extraindo individualmente todas as imagens num único passo!

Poppler-utils é um pacote padrão e muito provavelmente você já deve tê-lo instalado no sistema. Mas caso não tenha, usuários de Debian e derivados podem recorrer ao apt-get:

# apt-get install poppler-utils

Após a instalação deste pacote, basta criar um diretório qualquer, gravar seu arquivo PDF dentro, abrir um terminal dentro deste diretório e rodar o seguinte comando:

pdftohtml ARQUIVO.pdf QUALQUER_NOME.html

Pronto! O comando "desmontará" seu arquivo PDF em arquivos texto no formato HTML, extraindo todos as imagens pra dentro do diretório:
Linux: Ubuntu - Extraindo imagens de arquivos PDF, usando uma simples linha de comando
O Viva o Linux depende da receita de anúncios para se manter. Ative os cookies aqui para nos patrocinar.
Não conseguimos carregar os anúncios. Se usa bloqueador, considere liberar o Viva o Linux para nos patrocinar.
Além de, para o meu propósito em particular, ser uma ferramenta muito útil para recriar um documento utilizando as imagens de um arquivo em PDF.

Previamente publicado em meu blog:
O Viva o Linux depende da receita de anúncios para se manter. Ative os cookies aqui para nos patrocinar.
Não conseguimos carregar os anúncios. Se usa bloqueador, considere liberar o Viva o Linux para nos patrocinar.

Ubuntu 10.10 - Recebendo arquivos via Bluetooth

Wget - Baixando sites inteiros

Ubuntu - Alterando as Fontes do Terminal

Problema com MergeList [Resolvido]

Convertendo arquivo UTF-8 com BOM para UTF-8 sem BOM

Forçar montagem de partição NTFS Windows

Gentoo: eix

Exibindo linhas anteriores e posteriores à string pesquisada no Linux

#1 Comentário enviado por andreuebe em 10/11/2012 - 18:51h
Muito legal!

Valeu pela dica!
#2 Comentário enviado por julio_hoffimann em 10/11/2012 - 22:09h
Ótima dica Jonatas!

Abraço!
#3 Comentário enviado por titohigh em 29/11/2012 - 12:19h
Que programa fantástico!
Podia ter conhecido esse comando alguns anos atrás, ia me ajudar muito.

Contribuir com comentário

Entre na sua conta para comentar.