Ferramentas incríveis! Converta diversos tipos de arquivos com o xPDF e ffmpeg

Apresento ferramentas que fazem a conversão de arquivos de mídia e texto, tudo de forma simples, por linha de comando. Isso é possível através das diversas ferramentas do xpdf, xpdf-tools e ffmpeg. Desta forma é possível converter texto em pdf, pdf em html, flv em mpeg, entre outras coisas. Existem muita ferramentas simples e poderosas do GNU/Linux que passam desapercebidas.

[ Hits: 56.036 ]

Por: Marcus-RJ em 03/01/2007


Execução: pdftotext, pdfcrop, pdfcsplain



PDFTOTEXT

Converte um arquivo PDF em texto puro

Sintaxe:

pdftotex [opções] arquivo.pdf arquivo.txt
  • -ascii7 = converte para texto de 7bits ASCII.
  • -eucjp = converte texto em japonês para EUJ-JP
  • -f n = número da pagina a ser convertida
  • -l n = número da pagina a ser convertida
  • -latin2 = converte para texto com o conjunto de caracteres Latin 2 (ISO-8859-2)
  • -latin5 = converte para texto com o conjunto de caracteres Latin 2 (ISO-8859-9)
  • -q = não exibe mensagem de erro
  • -raw = elimina todo tipo de formatação do texto, inclusive colunas
  • -upw senha = senha de usuário para o arquivo PDF
  • -v = versão do comando

PDFCROP

Transforma um documento pdf em um novo documento formatado. Útil para quem usa a formatação padrão adotada por esse programa.

Sintaxe:

pdfcrop [opções] arquivo.txt

As opções usadas nesse comando são, em parte, descritas nos comandos anteriores, mais informações" pdfcrop -help". Assim como em todos os programas, o parâmetro "opções" não é obrigatório.

PDFCSPLAIN e suas variantes (tex, latex, initex, virtex)

Transforma arquivos de texto ou tex, em documentos .dvi.

Sintaxe:

pdfcsplain [opções] arquivo.txt

Será criado em seguida o arquivo.dvi, muitas das opções usadas nesse programa são iguais as do anteriores. Mais informações "pdfcrop -help". Uma sugestão de leitor de dvi é o próprio xDvi. Tentei usar o Kdvi, mas no Mandriva 2007 não funcionou bem.

Página anterior     Próxima página

Páginas do artigo
   1. Introdução
   2. Descrição
   3. Instalação
   4. Execução. Pdftotex, pdftoppm, pdftops
   5. Execução: pdftotext, pdfcrop, pdfcsplain
   6. Execução: pdffonts, pdftohtml, pdfinfo, pdfopt
   7. Execução: ffmpeg
   8. Considerações finais
Outros artigos deste autor

VirtualBox 2.1.0: Rede no VirtualBox agora é fácil!

XEN - Instalação e configuração no Debian Etch

Leitura recomendada

VirtualBox com phpvirtualbox

Instalando o VMWare no Slackware

Análise do Syllable, mais um interresante sistema operacional livre

Processos no Linux

Instalar o Gitea no Ubuntu

  
Comentários
[1] Comentário enviado por andreuebe em 04/01/2007 - 12:44h

Marcus

Obrigado por compartilhar conosco estas pérolas. Principalmente em relação ao ffmpeg.

Você saberia de algum programa que converta 3gp (formato de video do celular nokia) para avi?

Abs

Andre

[2] Comentário enviado por marcus-rj em 13/01/2007 - 22:05h

Obrigado pelo comentário!! Poxa cara, infelizmente nao vou poder te ajudar. Caso consiga algo, eu posto aqui.

[3] Comentário enviado por darkstarfire em 22/01/2007 - 00:07h

olá andré uebe...
o ffmpeg faz isso bem facinho

[4] Comentário enviado por viniciuspgomes em 26/03/2007 - 15:37h

Boa tarde Marcus,
Estou com o seguinte problema: Tenho vários arquivos em minha máquina (.doc, .xls. htm, .tct, etc).
Preciso criar um script onde transformo estes arquivos em pdfsem perda alguma. Já fiz vários testes, mas até agora não vi nenhuma ferramenta eficaz para isso.
Será que você pode me ajudar?
Qualquer coisa meu e-mail é viniciuspgomes@gmail.com
Fico no aguardo.
Obrigado.

[5] Comentário enviado por lane.sou em 08/04/2007 - 00:12h

Olá,
c sabe dizer se eu posso pegar o código html que o pdftohtml gera e se, na conversão, ele mantém a formatação do pdf? Tipo, se uma palavra ta em negrito no pdf, então no código fonte html tem as tags correspondentes?

Vc saberia ainda onde eu posso pegar o código (source code) desses programas? =X

por favor, se souber meu e-mail é lane.sou@gmail.com

Agradecida ^^

[6] Comentário enviado por lane.sou em 08/04/2007 - 00:37h

Eu outra vez,

baixei o pdftohtml mas quando eu rodo o programa dá uns erros do tipo:

bad font

creio que falta instalar alguma coisa - ou instalar o programa direito, sei lá.

Vc saberia me dizer como faço para instalar o pdftohtml no Ubuntu?

[7] Comentário enviado por marcus-rj em 08/04/2007 - 07:30h

Se o documento vai manter exatamente a fonte? vai depender de um pouco de sorte, mas geralmente ele mantém sim!

O link para obter o fonte do programa, eh no http://sourceforge.net. Segue o link direto do pdftohtml, inclusive para versao windows!
http://sourceforge.net/project/showfiles.php?group_id=45839

Espero ter ajudado!

[8] Comentário enviado por juliaojunior em 01/10/2007 - 16:23h

muito bom mesmo.


Contribuir com comentário




Patrocínio

Site hospedado pelo provedor RedeHost.
Linux banner

Destaques

Artigos

Dicas

Tópicos

Top 10 do mês

Scripts