Remover tags HTML com SED
Dica publicada em Shell Script / Expressões Regulares
Remover tags HTML com SED
Remover tags HTML usando o sed é, como diriam os mais sofisticados, "piece of cake!". Uma tag HTML tem o seguinte formato:
<abrir tag></fechar tag>
ou
<tag com argumentos />
note que independente da tag ser de abertura ou fechamento, ela sempre começa com < e termina com >. Então vamos à nossa expressão regular:
echo '<a href="#">Link aqui</a><br/>' | sed 's/<[^>]*>//g'
Link aqui
Onde:
Simples assim!
<abrir tag></fechar tag>
ou
<tag com argumentos />
note que independente da tag ser de abertura ou fechamento, ela sempre começa com < e termina com >. Então vamos à nossa expressão regular:
echo '<a href="#">Link aqui</a><br/>' | sed 's/<[^>]*>//g'
Link aqui
Onde:
- /<[^>]*>/ = começa com <, tudo o que não é > e termina com >
- //g = substitua todas as ocorrências do padrão acima por nada
Simples assim!
Essas instruções com sed estão cada vez melhores.
___________________________________
Conhecimento não se Leva para o Túmulo.