Pular para o conteúdo

Exmaill - Extrator de Emails

Pequeno script que extrai endereços de email de um arquivo contendo texto diverso. Quidk and Dirty!
Murilo R. Esplugues mre
Hits: 17.953 Categoria: Python Subcategoria: Manipulação de arquivos
  • Download
  • Nova versão
  • Indicar
  • Denunciar
O Viva o Linux depende da receita de anúncios para se manter. Ative os cookies aqui para nos patrocinar.
Não conseguimos carregar os anúncios. Se usa bloqueador, considere liberar o Viva o Linux para nos patrocinar.

Descrição

Pequeno script que extrai endereços de email de um arquivo contendo texto diverso. Quidk and Dirty!
Download exmail.py Enviar nova versão
O Viva o Linux depende da receita de anúncios para se manter. Ative os cookies aqui para nos patrocinar.
Não conseguimos carregar os anúncios. Se usa bloqueador, considere liberar o Viva o Linux para nos patrocinar.

Versões atualizadas deste script

Esconder código-fonte

#!/usr/bin/env python

# Autor: Murilo R. Esplugues
# Data:  23/02/2005
# Nome do arquivo: exmail.py
# Descricao do programa: Extrai email de arquivos de texto
# (qq palavra com @)
# Python Vrs: Python 2.4.* - e vrs anteriores
# Contato: murilo_esplugues@yahoo.com.br
# Categorias: Script - Python - ModoTexto

# Uso: exmail.py arquivo_com_emails.txt > emails.txt
# -*- coding: iso8859-1 -*-

import sys
import string as s


NoFile = "Nome de arquivo nao especificado"        
NoRead = "Nao foi possível ler"

if len(sys.argv) < 2:
    sys.stderr.write(NoFile)
else:
   file = sys.argv[1]
   try:
       input = open(file, 'r')
   except IOError:
       sys.stderr.write(NoRead, "'%s'\n" % file)
       sys.exit()
       
   lines = input.readlines()
   lines.sort()
   for line in lines:
       if "@" in line:
           for data in s.split(line):
               if "@" in data:
                   print  s.lower(data)
O Viva o Linux depende da receita de anúncios para se manter. Ative os cookies aqui para nos patrocinar.
Não conseguimos carregar os anúncios. Se usa bloqueador, considere liberar o Viva o Linux para nos patrocinar.

Converte valor de Bytes 2 Kbyte 2 Mbyte

Manipulando arquivos com Pickle

Agenda PasPy

backup all files

Checagem e remoção de arquivos

#1 Comentário enviado por Feko em 15/07/2011 - 09:37h
Muito bacana, simples e funcional =)
Talvez seja uma boa idéia usar expressões regulares (Com a bênção do Aurélio) para fazer estas procuras. Não que seja a melhor solução, mas uma alternativa =)


#!/usr/bin/env python
import re,sys
remail=re.compile('([_.0-9a-z-]+@[0-9a-z-]+.[a-z]{2,6})')
txt=open(sys.argv[1]).read()
print remail.findall(txt)


Abraços!
#2 Comentário enviado por extratorfox em 15/02/2012 - 10:56h
Viva ai pessoal
Tambem trabalho com desenvolvimento mas em delphi e desenvolvemos aqui na empresa uma ferramenta para extração de email direto da web usando keyword diretamente no google
com possobilidade de coneçoes com proxy´s e tb ligação ao mysql ! sei que o assunto nao e windows mas queriamos ue visitassem nossa pagina e dessem o vosso feedback !
www.extratordeemail.com
Valeu ai a todos
Abraço
Romnho
#3 Comentário enviado por m4cgbr em 12/05/2012 - 15:19h
Excelente, parabéns pela iniciativa.

Super simples. Para quem inicialmente teve uma mensagem de rro como:
ph@macgyver /temp $ ./exmail.py lista.txt > ./emails.txt
File "./exmail.py", line 20
SyntaxError: Non-ASCII character '\xc3' in file ./exmail.py on line 20, but no encoding declared; see http://www.python.org/peps/pep-0263.html for details

Apenas remova o acento ou recorra a outros caminhos referente a codificação ISO, UTF, etc.

Que seja útil para usuários mais leigos.

Abs

Contribuir com comentário

Entre na sua conta para comentar.