Unescape de caracteres especiais ISO-8859-1

Publicado por Mayron Cachina 11/01/2008

[ Hits: 6.597 ]

Homepage: http://mayroncachina.net

Download IsotoUtf.py




Conversão de caracteres ISO-8859-1 em UTF-8.

  



Esconder código-fonte

#! /usr/bin/env python
# -*- coding: iso-8859-15 -*-
'''
Script para unescape de caracteres especiais ISO-8859-1
Autor: Mayron Cachina
Contato: mayroncachina@gmail.com
Site: http://cachina.wordpress.com
'''
import htmlentitydefs
import re
import cgi

#Informações
origem = raw_input("Local do arquivo do arquivo original: ")
fim = raw_input("Local do arquivo final: ")
pattern = re.compile("&(\w+?);")
def descape_entity(m, defs=htmlentitydefs.entitydefs):
   # callback: translate one entity to its ISO Latin value
   try:
      return defs[m.group(1)]
   except KeyError:
      return m.group(0) # use as is

def descape(string):
   return pattern.sub(descape_entity, string)

#Abre os arquivos para manipulação de dados
f = open(origem)
w = open(fim,'w')

#Operações
try:
   novo = descape(f.read())
   w.write(novo)
finally:
   f.close()
   w.close()
print "Finalizado!!!"

Scripts recomendados

Gerador de páginas .html

Adicione a opção Redimensionar e rotacionar imagens ao Nautilus

Jogo da Velha com IA (Inteligencia Artificial)

Par ou ímpar no Python

Diferença de dias entre datas


  

Comentários

Nenhum comentário foi encontrado.


Contribuir com comentário




Patrocínio

Site hospedado pelo provedor RedeHost.
Linux banner

Destaques

Artigos

Dicas

Tópicos

Top 10 do mês

Scripts