Exmaill - Extrator de Emails

Publicado por Murilo R. Esplugues 24/02/2005 (última atualização em 15/07/2011)

[ Hits: 17.358 ]

Homepage: http://www.helpday.blogspot.com/

Download exmail.py

Download 1304887710.exmail.py (versão 2)




Pequeno script que extrai endereços de email de um arquivo contendo texto diverso. Quidk and Dirty!

  



Versões atualizadas deste script

Versão 2 - Enviado por djasdijai em 08/05/2011

Changelog: Corrigi alguns bugs que deu no ubuntu 11.04
e ao exibir mensgens de erro pula uma linha

Download 1304887710.exmail.py


Esconder código-fonte

#!/usr/bin/env python

# Autor: Murilo R. Esplugues
# Data:  23/02/2005
# Nome do arquivo: exmail.py
# Descricao do programa: Extrai email de arquivos de texto
# (qq palavra com @)
# Python Vrs: Python 2.4.* - e vrs anteriores
# Contato: murilo_esplugues@yahoo.com.br
# Categorias: Script - Python - ModoTexto

# Uso: exmail.py arquivo_com_emails.txt > emails.txt
# -*- coding: iso8859-1 -*-

import sys
import string as s


NoFile = "Nome de arquivo nao especificado"        
NoRead = "Nao foi possível ler"

if len(sys.argv) < 2:
    sys.stderr.write(NoFile)
else:
   file = sys.argv[1]
   try:
       input = open(file, 'r')
   except IOError:
       sys.stderr.write(NoRead, "'%s'\n" % file)
       sys.exit()
       
   lines = input.readlines()
   lines.sort()
   for line in lines:
       if "@" in line:
           for data in s.split(line):
               if "@" in data:
                   print  s.lower(data)

Scripts recomendados

Gerando PDF de imagens

Manipulação de arquivos CSV - OO

Exemplo de armazenamento de registros em arquivo

Serialização em Python usando pickle

Dividir um grupo de arquivos em vários CDs Ou DVDs


  

Comentários
[1] Comentário enviado por Feko em 15/07/2011 - 09:37h

Muito bacana, simples e funcional =)
Talvez seja uma boa idéia usar expressões regulares (Com a bênção do Aurélio) para fazer estas procuras. Não que seja a melhor solução, mas uma alternativa =)


#!/usr/bin/env python
import re,sys
remail=re.compile('([_.0-9a-z-]+@[0-9a-z-]+.[a-z]{2,6})')
txt=open(sys.argv[1]).read()
print remail.findall(txt)


Abraços!

[2] Comentário enviado por extratorfox em 15/02/2012 - 10:56h

Viva ai pessoal
Tambem trabalho com desenvolvimento mas em delphi e desenvolvemos aqui na empresa uma ferramenta para extração de email direto da web usando keyword diretamente no google
com possobilidade de coneçoes com proxy´s e tb ligação ao mysql ! sei que o assunto nao e windows mas queriamos ue visitassem nossa pagina e dessem o vosso feedback !
www.extratordeemail.com
Valeu ai a todos
Abraço
Romnho

[3] Comentário enviado por m4cgbr em 12/05/2012 - 15:19h

Excelente, parabéns pela iniciativa.

Super simples. Para quem inicialmente teve uma mensagem de rro como:
ph@macgyver /temp $ ./exmail.py lista.txt > ./emails.txt
File "./exmail.py", line 20
SyntaxError: Non-ASCII character '\xc3' in file ./exmail.py on line 20, but no encoding declared; see http://www.python.org/peps/pep-0263.html for details

Apenas remova o acento ou recorra a outros caminhos referente a codificação ISO, UTF, etc.

Que seja útil para usuários mais leigos.

Abs


Contribuir com comentário




Patrocínio

Site hospedado pelo provedor RedeHost.
Linux banner

Destaques

Artigos

Dicas

Tópicos

Top 10 do mês

Scripts