Pular para o conteúdo

Convertendo arquivos .doc para .txt via linha de comando

Dica publicada em Linux / Comandos
Fábio Berbert de Paula fabio
Hits: 21.450 Categoria: Linux Subcategoria: Comandos
  • Indicar
  • Impressora
  • Denunciar
O Viva o Linux depende da receita de anúncios para se manter. Ative os cookies aqui para nos patrocinar.
Não conseguimos carregar os anúncios. Se usa bloqueador, considere liberar o Viva o Linux para nos patrocinar.

Convertendo arquivos .doc para .txt via linha de comando

Essa semana pintou uma dúvida na sessão de Perguntas & Respostas do site sobre como converter um .doc para .html através de linha de comando. Bom, a solução é simples, para isso precisaremos de dois pacotes instalados em sua distribuição:
  • catdoc: converte .doc para texto;
  • txt2html: converte texto para HTML.

No Debian você os instala a partir do comando:

# apt-get install catdoc txt2html

Ou se preferir:
http://www.gnu.org/directory/All_Packages_in_Directory/catdoc.html
http://distro.ibiblio.org/.../sources/txt2html/2.21/

Agora basta digitar o seguinte comando:

$ catdoc arquivo.doc | txt2html

Legal né? Se quiser salvar a saída:

$ catdoc arquivo.doc | txt2html > arquivo.txt

[]'s

O Viva o Linux depende da receita de anúncios para se manter. Ative os cookies aqui para nos patrocinar.
Não conseguimos carregar os anúncios. Se usa bloqueador, considere liberar o Viva o Linux para nos patrocinar.
O Viva o Linux depende da receita de anúncios para se manter. Ative os cookies aqui para nos patrocinar.
Não conseguimos carregar os anúncios. Se usa bloqueador, considere liberar o Viva o Linux para nos patrocinar.

Como recompilar um vídeo/áudio aumentando ou diminuindo seu volume original

Obtendo a soma do tamanho os arquivos listados com "du"

Vim - configuração de acordo com o tipo de arquivo

Catálogo de efeitos de texto para Gimp

Erro: "W: Possible missing firmware... for module" [Resolvido]

Google Authenticator no terminal Linux

O comando tree - listar diretórios em formato árvore

Verificando interrupções livres e ocupadas na sua máquina

Travando/bloqueando arquivos e diretórios no GNU/Linux

Alterar data e hora que um arquivo foi criado

#1 Comentário enviado por fernandus em 07/05/2004 - 09:57h
eu não posso simplesmente fazer :
#mv texto.doc texto.txt ?

a dúvida que eu tenho é como mudar a extensão de centenas de arquivos como eu faria em MS-DOS... rename ou ren...
#2 Comentário enviado por fabio em 07/05/2004 - 10:11h
Não, renomear é uma coisa, converter formatos é outra. Pra renomear seus .doc pra .txt você pode digitar esse simples comando:

for X in *.doc; do TMP=`echo $X | sed 's/doc$/txt/'`; mv $X $TMP; done

[]'s
#3 Comentário enviado por ygorth em 09/05/2004 - 13:15h
nem tao simples assim (:

boa dica!
#4 Comentário enviado por thudojorge em 07/03/2008 - 13:58h
e para ler ficheiros pdf na linha de comandos? qual e a aplicacao?

Contribuir com comentário

Entre na sua conta para comentar.