Substituindo Caracteres invàlidos

1. Substituindo Caracteres invàlidos

Raphael Coutinho da Silva
rcoutosilva

(usa Outra)

Enviado em 19/11/2013 - 17:06h

Boa tarde pessoal


Estou batendo cabeça no seguinte problema. Nosso clientes envio um .xml de cadastros para que seja carregado em nossa base de dados através de um processo de etl.

Ocorre que começou a dar erro na extração desses dados, o log acusava um caracter inválido no xml. Ao olhar o log do processo o mesmo dava erro de sintaxe de xml e indicava a linha e coluna a qual o problema se encontrava.

Parece que quando a cliente foi efetuar o cadastro, em vez de ela digitar o Shift + b no campo do nome, ela pressionou Ctrl.

Como consigo trazer isso com o sed, grep e/ou find. Estava buscando

grep ^B arquivo.xml mas não me retorna nada apesar dele estar lá.


Alguém dá um help por favor.


Abç





  


2. Re: Substituindo Caracteres invàlidos

Alexandre Gonçalves Monteiro da Silva
alexandregms

(usa Ubuntu)

Enviado em 22/11/2013 - 11:53h

O comando:


grep ^B arquivo.xml


Irá retornar as palavras que iniciam com a letra B no arquivo.xml.

Poste um trecho do arquivo e explique o que vc quer na saída.


3. Re: Substituindo Caracteres invàlidos

Raphael Coutinho da Silva
rcoutosilva

(usa Outra)

Enviado em 22/11/2013 - 12:20h

No arquivo está assim.

cliente_nome="Fulana []reda"

Como posso caçar e eliminar esse caracter maldito. Sei cque a palavra correta é Breda,. Então queria substituí-lo por B.

Abs


4. Re: Substituindo Caracteres invàlidos

André Canhadas
andrecanhadas

(usa Debian)

Enviado em 22/11/2013 - 12:46h

rcoutosilva escreveu:

No arquivo está assim.

cliente_nome="Fulana []reda"

Como posso caçar e eliminar esse caracter maldito. Sei cque a palavra correta é Breda,. Então queria substituí-lo por B.

Abs


Faça um backup e teste assim:

grep -rl [] arquivo.xml | xargs sed -i s/[]/B/g > novo.xml







Patrocínio

Site hospedado pelo provedor RedeHost.
Linux banner

Destaques

Artigos

Dicas

Tópicos

Top 10 do mês

Scripts