Apresento ferramentas que fazem a conversão de arquivos de mídia e texto, tudo de forma simples, por linha de comando. Isso é possível através das diversas ferramentas do xpdf, xpdf-tools e ffmpeg. Desta forma é possível converter texto em pdf, pdf em html, flv em mpeg, entre outras coisas. Existem muita ferramentas simples e poderosas do GNU/Linux que passam desapercebidas.
Antes de mostrar a instalação dos pacotes, um pouco sobre a descrição de cada um deles. Todo o processo deste artigo foi feito no Mandriva Linux Free 2007, porém creio que possa ser feito sem problemas em outras distribuições, precisando apenas usar os comandos adequados.
Testei a mesma instalação no Slackware 11 e funcionou direito, porém não consegui o pdftohtml, achei o pacote pdftohtml.tgz, porém a instalação não funcionou muito bem. Também não consegui via slapt-get. Mas acredito que com um pouco de insistência e paciência esse problema possa ser resolvido. Qualquer coisa, é só dar a dica na seção comentário.
Descrição dos programas:
Pacotes xpdf e xpdf-tools:
pdf2dsc - conversor de pdf para documentos postscript (level 2)
pdf2ps - conversor de pdf para documentos postscript (level 2)
pdfcrop - transforma um documento pdf em um novo documento formatado
pdfcsplain - transforma arquivos em formato texto ou tex, em documentos .dvi
pdfetex - converte arquivos texto ou tex para pdf.
pdffonts - exibe informações detalhadas sobre fontes de arquivo pdf
pdfinfo - exibe informações sobre arquivo pdf
pdfopt - otimizador de arquivo pdf
pdftex - converte arquivo tex ou texto para formato pdf.
pdftohtml - converte arquivos pdf em html
pdftoppm - converte arquivos pdf em ppm (Pixmap)
pdftops - conversor de pdf para documentos postscript
pdftotext - converte arquivo pdf para formato texto
[4] Comentário enviado por viniciuspgomes em 26/03/2007 - 15:37h
Boa tarde Marcus,
Estou com o seguinte problema: Tenho vários arquivos em minha máquina (.doc, .xls. htm, .tct, etc).
Preciso criar um script onde transformo estes arquivos em pdfsem perda alguma. Já fiz vários testes, mas até agora não vi nenhuma ferramenta eficaz para isso.
Será que você pode me ajudar?
Qualquer coisa meu e-mail é viniciuspgomes@gmail.com
Fico no aguardo.
Obrigado.
[5] Comentário enviado por lane.sou em 08/04/2007 - 00:12h
Olá,
c sabe dizer se eu posso pegar o código html que o pdftohtml gera e se, na conversão, ele mantém a formatação do pdf? Tipo, se uma palavra ta em negrito no pdf, então no código fonte html tem as tags correspondentes?
Vc saberia ainda onde eu posso pegar o código (source code) desses programas? =X
por favor, se souber meu e-mail é lane.sou@gmail.com
[7] Comentário enviado por marcus-rj em 08/04/2007 - 07:30h
Se o documento vai manter exatamente a fonte? vai depender de um pouco de sorte, mas geralmente ele mantém sim!
O link para obter o fonte do programa, eh no http://sourceforge.net. Segue o link direto do pdftohtml, inclusive para versao windows! http://sourceforge.net/project/showfiles.php?group_id=45839