spock211
(usa Debian)
Enviado em 22/10/2019 - 22:28h
Boa noite pessoal !
Sou iniciante em shell script e tenho vários arquivos pdfs (mais de 1000) em uma pasta, só que o nome de cada arquivo não condiz com o conteúdo deles. O nome de cada um segue um padrão: "1_A_Fundamental_I_VA.pdf"
"1_A_Fundamental_I_VA(1).pdf"
"5_A_Fundamental_I_VA(2).pdf"
e por aí vai....
Dentro de cada arquivo pdf existe um campo chamado: 'Descrição: Teste de matemática 2' ou qualquer outro título semelhante a este.
Eu queria titular cada arquivo com essa descrição que existe dentro de cada arquivo. Tive a ideia de converter o pdf em txt com o pdftotext e depois extrair esse campo "Descrição" com o cat. Mas não consigo bolar um comando que concatene a conversão, a extração e depois a renomeação de cada arquivo correspondente.
Tentei o seguinte:
#!/bin/bash
#Converte todos os arquivos pdf da pasta em txt
for file in *.pdf; do pdftotext "$file" "$file.txt"; done
#Lista a descrição da atividade e a atribui a uma variável "$desc"
desc$=(cat '6_A_Fundamental_II_VA.pdf.txt' | sed -n '3 p' | cut -c14-45) >> novos.txt
Alguém teria uma ideia para eu colocar em prática o poderoso shell script ? Existe uma forma de automatizar o script para que o campo "descrição" em cada arquivo txt seja extraído e guardado ou atribuído a uma variável e depois o arquivo pdf original seja renomeado com essa "descrição" ? Dessa forma cada arquivo pdf terá o título dessa "descrição".
Só consegui arranhar a superfície até agora.