mgfacioli
(usa Ubuntu)
Enviado em 27/08/2020 - 22:31h
Olá, pessoal...
Estou lendo um livro Lisp no formato pdf e queria extrair somente as linhas de codigo para um arquivo .txt ou .lisp, para não ter que ficar digitando todos comandos no interpretador de comando. Todas linhas de código no Lisp começam e terminam com um parenteses, por exemplo, para somar 2 numeros: (+ 2 3).
Usei no terminal o comando
$ pdfgrep -n -e "\(" Lisp.pdf > Lisp.lisp
, sendo que o parametro -e é a expressão regular que busca todas linhas que começam com parenteses.
Funcionou beleza, consegui capturar todas as linhas de código, mas o interpretador do Lisp (emacs-slime) dá erro quando tento executá-las. Digitei no terminal
$ file -i Lisp.lisp
, já supondo que seria algum problema de codificação, ele retorna
Lisp.lisp: application/octet-stream; charset=binary
.
O seja, tá gerando um arquivo binário e o que eu preciso seria UTF-8 ou similar.
Alguem tem alguma idéia de como fazer isso?