Removendo linhas duplicadas não-consecutivas

Publicado por Sandro Marcell em 20/10/2009

[ Hits: 16.782 ]

Blog: http://sanmarcell.wordpress.com

1 0

Denuncie Favoritos Indicar Impressora

Removendo linhas duplicadas não-consecutivas

Geralmente utilizo o comando sort para remover linhas duplicadas de um arquivo:

sort -o output -u input

O problema era que em alguns casos as linhas não poderiam ser ordenadas, mas o sort (obviamente!) as ordenava. Então acabei resolvendo o meu problema assim:

perl -ne '$i{"$_"}++ || print' < input > output

O mesmo pode ser obtido via awk:

awk '!i[$0]++' < input > output

Ou:

awk '!($0 in i) {i[$0] ; print}' < input > output

Sendo "input" o arquivo de entrada e "output" o de saída.

Falou! ;)

Outras dicas deste autor

Fluxbox: Wallpapers diferentes em cada área de trabalho

sed - Removendo caracteres acentuados

Adicionando Extensões em Arquivos

rm - remover vários arquivos excetuando alguns

php-meter: Medidor que mostra o consumo de banda no link de internet

Leitura recomendada

SED - inserindo uma palavra abaixo de outra palavra específica

Como remover permissão de vários arquivos

Desmontando dispositivos ocupados (busy)

Ícones com cadeado no Linux

Slackware & HD SATA

Comentários

[1] Comentário enviado por ferrarezux em 29/10/2012 - 12:37h

Valeu cara! Me ajudou demais aqui.

Patrocínio

Site hospedado pelo provedor RedeHost.

Destaques

O VOL está de despedida! (6)

Links importantes de usuários do vol (6)

Criei um app de escrita acadêmica para brasileiros! (4)

Artigos

File Browser: Crie sua Nuvem Pessoal Privada

A produção de áudio e vídeo no Linux e as distribuições dedicadas a esse fim

Criptografando sua Home com Gocryptfs para tristeza do meliante

A Involução do Linux e as Lambanças Desnecessárias desde o seu Lançamento

O Journal no Linux para a guarda e consulta de logs do sistema

Dicas

Gerenciamento de Vídeo Híbrido (Intel/NVIDIA) via nvidia-prime no Ubuntu e derivados

Assistindo IPTV no Linux com Fred TV e Lista Free TV

Impressora Tomate MDK-007 no Ubuntu (ou qualquer distro Linux)

Acelerando a compilação de pacotes no Arch Linux (AUR) usando todos os núcleos do processador

Ocultando asteriscos ao digitar senha no Ubuntu

Tópicos

Depois não querem que eu fale sobre as baseadas... (5)

Tive um problema ao abrir minha partição Btrfs. Como posso resolver is... (0)

O computador não reconhece a câmera (3)

O VOL está de despedida! (6)

Links importantes de usuários do vol (6)

Top 10 do mês

Xerxes
1° lugar - 160.578 pts
Fábio Berbert de Paula
2° lugar - 80.317 pts
Alberto Federman Neto.
3° lugar - 44.519 pts
Alessandro de Oliveira Faria (A.K.A. CABELO)
4° lugar - 38.760 pts
Buckminster
5° lugar - 38.691 pts
edps
6° lugar - 34.297 pts
Mauricio Ferrari (LinuxProativo)
7° lugar - 25.200 pts
Andre (pinduvoz)
8° lugar - 25.750 pts
Sidnei Serra
9° lugar - 24.424 pts
Juliao Junior
10° lugar - 23.783 pts

Scripts

[Shell Script] gerenciar_warsaw.sh

[Shell Script] atualizar_kernel.sh

[Shell Script] Flatctl

[Shell Script] yad-clamav

[Shell Script] imageDownloader