Pular para o conteúdo

Remover tags HTML com SED

Dica publicada em Shell Script / Expressões Regulares
Fábio Berbert de Paula fabio
Hits: 4.801 Categoria: Shell Script Subcategoria: Expressões Regulares
  • Indicar
  • Impressora
  • Denunciar

Remover tags HTML com SED

Remover tags HTML usando o sed é, como diriam os mais sofisticados, "piece of cake!". Uma tag HTML tem o seguinte formato:



ou



note que independente da tag ser de abertura ou fechamento, ela sempre começa com < e termina com >. Então vamos à nossa expressão regular:

echo 'Link aqui
' | sed 's/<[^>]*>//g'

Link aqui

Onde:
  • /<[^>]*>/ = começa com <, tudo o que não é > e termina com >
  • //g = substitua todas as ocorrências do padrão acima por nada

Simples assim!

Convertendo texto em arte ASCII com Vim + Figlet

SED - texto para maiúsculas, minúsculas, pascal case e camel case

Gmail - Como evitar que emails do VOL sejam bloqueados

Renomear arquivos ou diretórios iniciados por "-"

Substituindo o sleep por um belo cronômetro regressivo

Baixando todos os arquivos de uma URL com o wget

Como remover parêntesis dos nomes de arquivos

Obtendo a cotação do Bitcoin com SED

Leitor de arquivos ePub

Múltiplas expressões no SED

#1 Comentário enviado por maurixnovatrento em 14/06/2020 - 21:09h

Essas instruções com sed estão cada vez melhores.

___________________________________
Conhecimento não se Leva para o Túmulo.

Contribuir com comentário

Entre na sua conta para comentar.