Enviado em 22/05/2016 - 12:44h
moliver, aparentemente é para dar certo mesmo, mas esta dizendo que a expressão do sed esta irregular, deve ser algum erro bobo que não estou percebendo, alguma sintaxe errada
while IFS=$'\n' read -r sitesproprios;do
lynx -justify -nolist -nomargins -nonumbers -dump "$siteproprio" > "$siteproprio".txt #REALIZA O DUMP DO CONTEUDO DO SITE
cat $siteproprio.txt | sed -i 's/[^[:alpha:] [:digit:] ]//g' > $siteproprio1.txt #DEIXA ALFA NUMERICOS
cat $siteproprio1.txt | sed -i 's/\([a-z]\)/\L&/g' > $siteproprio2.txt # TRANSFORMA TUDO EM MINUSCULA
cat $siteproprio2.txt | sed -i 's/^$/d' > $siteproprio3.txt #REMOVE CARACTERES EM BRANCO
cat $siteproprio3.txt | sed -i 's/[^[:punct:]//g' > $siteproprio4.txt #REMOVE SINAIS DE PONTUAÇÃO
#-------- SALVANDO A BASE .arff --------#
echo -e "@relation conteudoimproprios\n@attribute palavras {própria,impropria}
@attribute text String\n\n\n@data\npropria, $(cat "$siteproprio4".txt)" >> BaseDados.arff
done<sitesproprios.txt
Outra dúvida: eu consigo fazer todos esses comandos em um unico arquivo utilizando pipe? ( | ) > $unicoarquivo.txt
Resultado da saída do comando
sed: nenhum arquivo de entrada
sed: nenhum arquivo de entrada
sed: -e expressão #1, caractere 6: comando `s' não terminado
sed: -e expressão #1, caractere 16: comando `s' não terminado
sed: nenhum arquivo de entrada
sed: nenhum arquivo de entrada
sed: -e expressão #1, caractere 6: comando `s' não terminado
sed: -e expressão #1, caractere 16: comando `s' não terminado
------------------
(program exited with code: 0)
Press return to continue
Desde já, agradeço a todos que estão contribuindo.
while IFS=$'\n' read -r sitesproprios;do
lynx -justify -nolist -nomargins -nonumbers -dump "$siteproprio" > "$siteproprio".txt #REALIZA O DUMP DO CONTEUDO DO SITE
cat $siteproprio.txt | sed -i 's/[^[:alpha:] [:digit:] ]//g' > $siteproprio1.txt #DEIXA ALFA NUMERICOS
cat $siteproprio1.txt | sed -i 's/\([a-z]\)/\L&/g' > $siteproprio2.txt # TRANSFORMA TUDO EM MINUSCULA
cat $siteproprio2.txt | sed -i 's/^$/d' > $siteproprio3.txt #REMOVE CARACTERES EM BRANCO
cat $siteproprio3.txt | sed -i 's/[^[:punct:]//g' > $siteproprio4.txt #REMOVE SINAIS DE PONTUAÇÃO
#-------- SALVANDO A BASE .arff --------#
echo -e "@relation conteudoimproprios\n@attribute palavras {própria,impropria}
@attribute text String\n\n\n@data\npropria, $(cat "$siteproprio4".txt)" >> BaseDados.arff
done<sitesproprios.txt
Outra dúvida: eu consigo fazer todos esses comandos em um unico arquivo utilizando pipe? ( | ) > $unicoarquivo.txt
Resultado da saída do comando
sed: nenhum arquivo de entrada
sed: nenhum arquivo de entrada
sed: -e expressão #1, caractere 6: comando `s' não terminado
sed: -e expressão #1, caractere 16: comando `s' não terminado
sed: nenhum arquivo de entrada
sed: nenhum arquivo de entrada
sed: -e expressão #1, caractere 6: comando `s' não terminado
sed: -e expressão #1, caractere 16: comando `s' não terminado
------------------
(program exited with code: 0)
Press return to continue