tesseract - Reconhecimento de caracteres em imagens
Olá, pessoal do VOL.
Minha dica de hoje é sobre um software que utilizei para o reconhecimento de caracteres. Estou falando do tesseract.
Inicialmente meu projeto tinha por objetivo o reconhecimento de placas veiculares, para um simples controle interno no estacionamento da minha empresa.
Utilizando um software chamado fswebcam, consegui capturar imagens a partir do terminal. Assim posicionei duas câmeras nas vagas do meu estacionamento, capturando uma foto da placa de cada veículo estacionado.
Com o tesseract consegui transformar as imagens em caracteres para o armazenamento em banco MySQL.
Com isso, alimentei meu banco de dados com as placas dos veículos, hora de chegada e hora de saída de cada carro.
Instalando o tesseract (em distribuições baseadas no Debian):
# apt-get install tesseract-ocr
Convertendo imagem "teste.jpg" para texto:
No diretório da imagem a ser convertida, digite o comando abaixo:
# tesseract teste.jpg -psm 8 resultado
O comando acima reconhece os caracteres na imagem e com parâmetro "-psm 8", os dados da imagem são tratados em uma única palavra.
O resultado será armazenado no arquivo "resultado", como informado no comando acima.
# cat resultado
MMM-0058
Prontinho, os caracteres da imagem já estão disponíveis em texto.
[3] Comentário enviado por correiabrux em 28/02/2013 - 20:13h
Boa noite Paulo.
Sobre as imagens, configurei as câmeras ip para captura em preto e branco, sem a necessidade de cortes na imagem.
Em meu caso, o posicionamento da câmera ajudou, pois consegui um bom foco nas placas.
Durante os testes, percebi que em alguns casos o software não reconhecia os caracteres, por isso adaptei meu projeto para utilizar um software chamado motion.
Esse software captura imagens com suporte a detecção de movimentos.
Dessa maneira, quando um veículo se aproxima, o motion detecta um movimento e começa a fazer capturas, tirando um total de 30 fotos aproximadamente.
Depois das 30 fotos consecutivas, coloco o tesseract para funcionar, fazendo tentativas de conversão dos caracteres de cada foto.
Em meu script o tesseract interrompe as tentativas quando consegue converter uma imagem no formato que determinei "XXX-0000".
[4] Comentário enviado por adriano_sousa em 28/06/2013 - 09:51h
Olá galera,
Estou cursando técnico em informática na etec e meu tcc é sobre o controle de acesso de veículos.
Fui orientado a utilizar a tecnologia ocr para converter as imagens em caracteres das placas do veículos.
Gostaria de saber se alguém pode me ajudar para a utilização da aplicação acima citada.