Apresento ferramentas que fazem a conversão de arquivos de mídia e texto, tudo de forma simples, por linha de comando. Isso é possível através das diversas ferramentas do xpdf, xpdf-tools e ffmpeg. Desta forma é possível converter texto em pdf, pdf em html, flv em mpeg, entre outras coisas. Existem muita ferramentas simples e poderosas do GNU/Linux que passam desapercebidas.
-latin2 = converte para texto com o conjunto de caracteres Latin 2 (ISO-8859-2)
-latin5 = converte para texto com o conjunto de caracteres Latin 2 (ISO-8859-9)
-q = não exibe mensagem de erro
-raw = elimina todo tipo de formatação do texto, inclusive colunas
-upw senha = senha de usuário para o arquivo PDF
-v = versão do comando
PDFCROP
Transforma um documento pdf em um novo documento formatado. Útil para quem usa a formatação padrão adotada por esse programa.
Sintaxe:
pdfcrop [opções] arquivo.txt
As opções usadas nesse comando são, em parte, descritas nos comandos anteriores, mais informações" pdfcrop -help". Assim como em todos os programas, o parâmetro "opções" não é obrigatório.
PDFCSPLAIN e suas variantes (tex, latex, initex, virtex)
Transforma arquivos de texto ou tex, em documentos .dvi.
Sintaxe:
pdfcsplain [opções] arquivo.txt
Será criado em seguida o arquivo.dvi, muitas das opções usadas nesse programa são iguais as do anteriores. Mais informações "pdfcrop -help". Uma sugestão de leitor de dvi é o próprio xDvi. Tentei usar o Kdvi, mas no Mandriva 2007 não funcionou bem.
[4] Comentário enviado por viniciuspgomes em 26/03/2007 - 15:37h
Boa tarde Marcus,
Estou com o seguinte problema: Tenho vários arquivos em minha máquina (.doc, .xls. htm, .tct, etc).
Preciso criar um script onde transformo estes arquivos em pdfsem perda alguma. Já fiz vários testes, mas até agora não vi nenhuma ferramenta eficaz para isso.
Será que você pode me ajudar?
Qualquer coisa meu e-mail é viniciuspgomes@gmail.com
Fico no aguardo.
Obrigado.
[5] Comentário enviado por lane.sou em 08/04/2007 - 00:12h
Olá,
c sabe dizer se eu posso pegar o código html que o pdftohtml gera e se, na conversão, ele mantém a formatação do pdf? Tipo, se uma palavra ta em negrito no pdf, então no código fonte html tem as tags correspondentes?
Vc saberia ainda onde eu posso pegar o código (source code) desses programas? =X
por favor, se souber meu e-mail é lane.sou@gmail.com
[7] Comentário enviado por marcus-rj em 08/04/2007 - 07:30h
Se o documento vai manter exatamente a fonte? vai depender de um pouco de sorte, mas geralmente ele mantém sim!
O link para obter o fonte do programa, eh no http://sourceforge.net. Segue o link direto do pdftohtml, inclusive para versao windows! http://sourceforge.net/project/showfiles.php?group_id=45839