tlaloc
(usa Gentoo)
Enviado em 29/12/2010 - 21:26h
Prezados,
quero contar, num texto bastante grande, quantas vezes foi usada uma expressão.
Porém, é um diálogo. Que segue mais ou menos este esquema:
Ata de 5 de Abril
Pessoa 1: blablabla
blabla
bla
Pessoa 2: bla
Pessoa 3: blabla
Ata de 6 de Abril
Pessoa 1: blablabla
blabla
bla
Pessoa 2: bla
Pessoa 3: blabla
(só para explicar a estrutura do texto)
Quero contar quantas vezes a Pessoa 1 utilizou uma dada expressão.
Pensei em fazer o seguinte:
Remover os "Atas de..."
Adicionar um caratere delimitador qualquer ao final de cada frase de cada pessoa
Fazer um grep por um padrão (a expressão que quero) dentro de cada frase que iniciar com Pessoa 1 E terminar com o caractere delimitador (por exemplo, €).
Remover os "Atas de..." é simples...
grep -v -i ^"Atas de" arquivo1 > arquivo2
Só que não estou sabendo como fazer para inserir os caracteres antes de Pessoa.
Quero um comando que insira um caractere ANTES, toda vez que encontrar a expressão Pessoa, assim:
€ Pessoa 1: blablabla
blabla
bla
€ Pessoa 2: bla
€ Pessoa 3: blabla
Depois, vou utilizar o mesmo comando para que ele insira uma nova linha depois de cada €, ficando assim:
€
Pessoa 1: blablabla
blabla
bla
€
Pessoa 2: bla
€
Pessoa 3: blabla
Porque assim, no final, eu consigo delimitar meu grep para frase que comecem com Pessoa e terminem com €.
Alguém pode me ajudar com o comando que não estou conseguindo saber qual utilizar?
Ah, e se houver forma mais elegante de fazer isto, seria muito bem vinda a sugestão.