Extrair texto ... Delimitador " ( aspas duplas )

1. Extrair texto ... Delimitador " ( aspas duplas )

Mauriciodez
Mauriciodez

(usa Debian)

Enviado em 02/08/2017 - 20:07h

pessoas .. tenho um html com uma pancada de texto ... com o 'grep' já defini a linha que quero, agora não estou conseguindo filtrar o conteudo que está entre aspas duplas. tentei com o CUT e com o AWK e nenhum deu lucro, só consegui fazer usando o 'sed antes para substituir as aspas por outro caracter que no caso eu usei '|'.

usei a página do virtualbox como exempo ... com o grep eu extraí o conteúdo

</li><li>Debian 8 ("Jessie") <a class="ext-link" href="http://download.virtualbox.org/virtualbox/5.1.26/virtualbox-5.1_5.1.26-117224~Debian~jessie_i386.deb"><span class="icon"> </span>i386</a> | <a class="ext-link" href="http://download.virtualbox.org/virtualbox/5.1.26/virtualbox-5.1_5.1.26-117224~Debian~jessie_amd64.de..."><span class="icon"> </span>AMD64</a>
According to your distribution, replace 'yakkety' by 'xenial', 'vivid', 'utopic', 'trusty', 'raring', 'quantal', 'precise', 'lucid', 'jessie', 'wheezy', or 'squeeze'.


agora preciso extrair >>>
http://download.virtualbox.org/virtualbox/5.1.26/virtualbox-5.1_5.1.26-117224~Debian~jessie_i386.deb
e
http://download.virtualbox.org/virtualbox/5.1.26/virtualbox-5.1_5.1.26-117224~Debian~jessie_amd64.de....

Como fazer ???



  


2. Re: Extrair texto ... Delimitador

Mauriciodez
Mauriciodez

(usa Debian)

Enviado em 02/08/2017 - 20:35h

um avanço ... consegui extrair os texto com o AWK ... coloquei a aspas dupla ( delimitador ) entre aspas simples
awk -F'"' '{print $1}' arquivo 


só q o cidadão insiste em retornar o texto + 1 linha em branco ... tem jeito de ajeitar no próprio AWK ou tenho q fazer mais um pipe com um 'head' ou 'sed' para excluir a linha em branco ?

outra questão ... na situação de buscar duas colunas, o proprio AWK consegue me retornar a parada em duas linhas ou tenho que tratar isso com outro comando ???

por enquanto eu estou fazendo assim
mauricio@phantom ~ $ grep jessie arquivo | awk -F'"' '{print $6,$12}' | sed 's/ /\n/g' | head -2
http://download.virtualbox.org/virtualbox/5.1.26/virtualbox-5.1_5.1.26-117224~Debian~jessie_i386.deb
http://download.virtualbox.org/virtualbox/5.1.26/virtualbox-5.1_5.1.26-117224~Debian~jessie_amd64.de...
mauricio@phantom ~ $



------------------------------------------| Linux User #621728 |-----------------------------------------

" Nem sempre é amigo aquele que te tira do buraco !!! ( Saddam Hussein )"

------------------------------------------| Linux User #621728 |-----------------------------------------



3. Re: Extrair texto ... Delimitador " ( aspas duplas )

Marcelo Oliver
msoliver

(usa Debian)

Enviado em 02/08/2017 - 20:45h

Mauriciodez escreveu:

pessoas .. tenho um html com uma pancada de texto ... com o 'grep' já defini a linha que quero, agora não estou conseguindo filtrar o conteudo que está entre aspas duplas. tentei com o CUT e com o AWK e nenhum deu lucro, só consegui fazer usando o 'sed antes para substituir as aspas por outro caracter que no caso eu usei '|'.

usei a página do virtualbox como exempo ... com o grep eu extraí o conteúdo

</li><li>Debian 8 ("Jessie") <a class="ext-link" href="http://download.virtualbox.org/virtualbox/5.1.26/virtualbox-5.1_5.1.26-117224~Debian~jessie_i386.deb"><span class="icon"> </span>i386</a> | <a class="ext-link" href="http://download.virtualbox.org/virtualbox/5.1.26/virtualbox-5.1_5.1.26-117224~Debian~jessie_amd64.de..."><span class="icon"> </span>AMD64</a>
According to your distribution, replace 'yakkety' by 'xenial', 'vivid', 'utopic', 'trusty', 'raring', 'quantal', 'precise', 'lucid', 'jessie', 'wheezy', or 'squeeze'.


agora preciso extrair >>>
http://download.virtualbox.org/virtualbox/5.1.26/virtualbox-5.1_5.1.26-117224~Debian~jessie_i386.deb
e
http://download.virtualbox.org/virtualbox/5.1.26/virtualbox-5.1_5.1.26-117224~Debian~jessie_amd64.de....

Como fazer ???



Mauricio, boa noite.
Segue:
sed 's/ /\n/g' SeuArquivo |sed -n '/^href/p'|grep -o '\".*\"'
"http://download.virtualbox.org/virtualbox/5.1.26/virtualbox-5.1_5.1.26-117224~Debian~jessie_i386.deb"
"http://download.virtualbox.org/virtualbox/5.1.26/virtualbox-5.1_5.1.26-117224~Debian~jessie_amd64.de..."

cat SeuArquivo
</li><li>Debian 8 ("Jessie") <a class="ext-link" href="http://download.virtualbox.org/virtualbox/5.1.26/virtualbox-5.1_5.1.26-117224~Debian~jessie_i386.deb"><span class="icon"> </span>i386</a> | <a class="ext-link" href="http://download.virtualbox.org/virtualbox/5.1.26/virtualbox-5.1_5.1.26-117224~Debian~jessie_amd64.de..."><span class="icon"> </span>AMD64</a>
According to your distribution, replace 'yakkety' by 'xenial', 'vivid', 'utopic', 'trusty', 'raring', 'quantal', 'precise', 'lucid', 'jessie', 'wheezy', or 'squeeze'.

Att.:
Marcelo Oliver






Patrocínio

Site hospedado pelo provedor RedeHost.
Linux banner

Destaques

Artigos

Dicas

Tópicos

Top 10 do mês

Scripts