Removendo linhas duplicadas não-consecutivas

Publicado por Sandro Marcell em 20/10/2009

[ Hits: 16.362 ]

Blog: http://sanmarcell.wordpress.com

1 0

Denuncie Favoritos Indicar Impressora

Removendo linhas duplicadas não-consecutivas

Geralmente utilizo o comando sort para remover linhas duplicadas de um arquivo:

sort -o output -u input

O problema era que em alguns casos as linhas não poderiam ser ordenadas, mas o sort (obviamente!) as ordenava. Então acabei resolvendo o meu problema assim:

perl -ne '$i{"$_"}++ || print' < input > output

O mesmo pode ser obtido via awk:

awk '!i[$0]++' < input > output

Ou:

awk '!($0 in i) {i[$0] ; print}' < input > output

Sendo "input" o arquivo de entrada e "output" o de saída.

Falou! ;)

Outras dicas deste autor

Vim: Autocompletar com TAB

Detectando conflitos de IP

Ordenando uma lista de IPs (IPv4) com o sort

Copiando arquivos com caracteres especiais

Vim: fechamento automático de pares de caracteres

Leitura recomendada

Aplicando permissões em arquivos

Redirecionando saída de comando para arquivo com sudo

80 comandos para o pinguim (parte 4)

Reduzindo o tamanho de arquivos PDF

Como remover PPAs definitivamente

Comentários

[1] Comentário enviado por ferrarezux em 29/10/2012 - 12:37h

Valeu cara! Me ajudou demais aqui.

Patrocínio

Site hospedado pelo provedor RedeHost.

Destaques

Agora temos uma assistente virtual no fórum!!! (252)

Artigos

Comparação entre os escalonadores BFQ e MQ-Deadline (acesso a disco) no Arch e Debian

Conciliando o uso da ZRAM e SWAP em disco na sua máquina

Servidor de Backup com Ubuntu Server 24.04 LTS, RAID e Duplicati (Dell PowerEdge T420)

Visualizar câmeras IP ONVIF no Linux sem necessidade de instalar aplicativos

Atualizar Debian Online de uma Versão para outra

Dicas

Overclocking Permanente para Drastic no Miyoo Mini Plus

Problemas de chaves (/usr/share/keyrings) no Debian

Converter os repositórios Debian para o novo formato com as chaves

Instalando Spotify no Debian 13

Realizar overclock no Miyoo Mini (plus ou normal)

Tópicos

ETH1:2 não responde ao meu IP da rede (1)

[Noticias] Fork do Xorg (6)

Minha indignação (16)

Google Crhome não abre desde que eu atualizei pelo "program... (14)

como instalar todas as dependencias, para jogar no bottles o jogo mu d... (1)

Top 10 do mês

Xerxes
1° lugar - 58.711 pts
Fábio Berbert de Paula
2° lugar - 33.841 pts
Buckminster
3° lugar - 18.682 pts
Mauricio Ferrari
4° lugar - 12.880 pts
Sidnei Serra
5° lugar - 11.612 pts
Alberto Federman Neto.
6° lugar - 11.010 pts
Daniel Lara Souza
7° lugar - 10.672 pts
edps
8° lugar - 10.189 pts
Diego Mendes Rodrigues
9° lugar - 9.514 pts
Andre (pinduvoz)
10° lugar - 9.026 pts

Scripts

[Shell Script] Script ligar-scrolllock

[Shell Script] Como ver/ouvir vídeo/áudio via Terminal de modo prático

[Shell Script] Criar Script para apagar determinados arquivos

[Shell Script] inSANE - Script para usar Scanner

[Shell Script] Instalador do emulador de joystick Xbox para joystick generico para PC, PS2, PS3 (Debian e Derivados