Removendo linhas duplicadas não-consecutivas

Publicado por Sandro Marcell em 20/10/2009

[ Hits: 16.770 ]

Blog: http://sanmarcell.wordpress.com

1 0

Denuncie Favoritos Indicar Impressora

Removendo linhas duplicadas não-consecutivas

Geralmente utilizo o comando sort para remover linhas duplicadas de um arquivo:

sort -o output -u input

O problema era que em alguns casos as linhas não poderiam ser ordenadas, mas o sort (obviamente!) as ordenava. Então acabei resolvendo o meu problema assim:

perl -ne '$i{"$_"}++ || print' < input > output

O mesmo pode ser obtido via awk:

awk '!i[$0]++' < input > output

Ou:

awk '!($0 in i) {i[$0] ; print}' < input > output

Sendo "input" o arquivo de entrada e "output" o de saída.

Falou! ;)

Outras dicas deste autor

AWK - Validando endereços IPv4

js-bwm: monitorando seu link de internet em tempo real

sed - Removendo caracteres acentuados

Man pages coloridas

Utilizando funções matemáticas no zsh

Leitura recomendada

Awk - Uma poderosa ferramenta de análise

Digitar comandos no terminal em várias linhas

Alterando recursivamente permissão de arquivos e pastas

Comentários

[1] Comentário enviado por ferrarezux em 29/10/2012 - 12:37h

Valeu cara! Me ajudou demais aqui.

Patrocínio

Site hospedado pelo provedor RedeHost.

Destaques

Links importantes de usuários do vol (5)

Criei um app de escrita acadêmica para brasileiros! (4)

Artigos

File Browser: Crie sua Nuvem Pessoal Privada

A produção de áudio e vídeo no Linux e as distribuições dedicadas a esse fim

Criptografando sua Home com Gocryptfs para tristeza do meliante

A Involução do Linux e as Lambanças Desnecessárias desde o seu Lançamento

O Journal no Linux para a guarda e consulta de logs do sistema

Dicas

Assistindo IPTV no Linux com Fred TV e Lista Free TV

Impressora Tomate MDK-007 no Ubuntu (ou qualquer distro Linux)

Acelerando a compilação de pacotes no Arch Linux (AUR) usando todos os núcleos do processador

Ocultando asteriscos ao digitar senha no Ubuntu

Ativar pacotes amd64v3 no Ubuntu

Tópicos

VoidBR - Void Linux adaptado ao Brasil. (6)

Vídeo sobre o papel de parede (0)

Teclado sem conseguir usar o acento crase (2)

Warsaw no Ubuntu/Kubuntu 26.04, alguiém conseguiu? [RESOLVIDO] (2)

Continuando meus tópicos anteriores (13)

Top 10 do mês

Xerxes
1° lugar - 157.219 pts
Fábio Berbert de Paula
2° lugar - 82.171 pts
Alberto Federman Neto.
3° lugar - 45.582 pts
Buckminster
4° lugar - 41.092 pts
Alessandro de Oliveira Faria (A.K.A. CABELO)
5° lugar - 39.399 pts
edps
6° lugar - 34.550 pts
Mauricio Ferrari (LinuxProativo)
7° lugar - 25.805 pts
Sidnei Serra
8° lugar - 25.083 pts
Andre (pinduvoz)
9° lugar - 24.158 pts
Daniel Lara Souza
10° lugar - 23.417 pts

Scripts

[Shell Script] gerenciar_warsaw.sh

[Shell Script] atualizar_kernel.sh

[Shell Script] Flatctl

[Shell Script] yad-clamav

[Shell Script] imageDownloader