luisrcs
(usa Linux Mint)
Enviado em 28/10/2012 - 18:26h
Instale o Gimp, o tesseract e o tesseract-ocr-por.
1 - escanei a imagem em 600dpi em modo cores;
2 - abra a imagem no Gimp;
3 - vá no menu imagem -> modo, selecione Tons de cinza;
4 - vá no menu cores -> Brilho e Contraste, em brilho coloque -60 e em contrate, coloque 127;
5 - vá no menu filtros -> Desfocar -> Desfocagem gaussiana, e clique em ok;
6 - vá no menu filtros -> Realçar -> Aguçar, em Acuidade coloque no máximo e clique em ok;
7 - exporte a imagem com as modificações para um arquivo com extensão .jpg;
8 - abra um terminal e digite
$ tesseract imagem.jpg texto -l por
onde imagem.jpg é o nome da imagem escaneada e texto é a saída, que terá extensão .txt.
Sou professor e esses são os passos base para uma boa conversão de imagem para texto.