Exmaill - Extrator de Emails
Pequeno script que extrai endereços de email de um arquivo contendo texto diverso. Quidk and Dirty!
Descrição
Pequeno script que extrai endereços de email de um arquivo contendo texto diverso. Quidk and Dirty!
Versões atualizadas deste script
#!/usr/bin/env python # Autor: Murilo R. Esplugues # Data: 23/02/2005 # Nome do arquivo: exmail.py # Descricao do programa: Extrai email de arquivos de texto # (qq palavra com @) # Python Vrs: Python 2.4.* - e vrs anteriores # Contato: murilo_esplugues@yahoo.com.br # Categorias: Script - Python - ModoTexto # Uso: exmail.py arquivo_com_emails.txt > emails.txt # -*- coding: iso8859-1 -*- import sys import string as s NoFile = "Nome de arquivo nao especificado" NoRead = "Nao foi possível ler" if len(sys.argv) < 2: sys.stderr.write(NoFile) else: file = sys.argv[1] try: input = open(file, 'r') except IOError: sys.stderr.write(NoRead, "'%s'\n" % file) sys.exit() lines = input.readlines() lines.sort() for line in lines: if "@" in line: for data in s.split(line): if "@" in data: print s.lower(data)
Talvez seja uma boa idéia usar expressões regulares (Com a bênção do Aurélio) para fazer estas procuras. Não que seja a melhor solução, mas uma alternativa =)
#!/usr/bin/env python
import re,sys
remail=re.compile('([_.0-9a-z-]+@[0-9a-z-]+.[a-z]{2,6})')
txt=open(sys.argv[1]).read()
print remail.findall(txt)
Abraços!