Eliminando arquivos duplicados (quase!) automaticamente
Dica publicada em Linux / Sistema de Arquivos
Eliminando arquivos duplicados (quase!) automaticamente
Tenho em meu desktop cerca de 80GB de dados e aumentando continuamente.
Na maioria são impressões PDF de páginas que são interessantes, livros (gosto demais de ler), as mensagens do bispo, ISOs do Linux e fotos.
Problema que eu andei mudando dados de partição, copia daqui, apaga dali, muda pasta, cria pasta, nova ordem, nova desordem, as coisas viram bagunça.
E nessa bagunça, comecei a ver que dupliquei muita coisa. E comecei a ficar amoado tentando eliminar um a um. Até que tive a ideia de googlar atrás de melhor solução. Achei: chama-se fdupes.
Pra instalar, o bom e velho:
# apt-get install fdupes
Depois no terminal:
fdupes -r -S -d .
Estas opções fazem o seguinte:
O que faz esse programa: ele analisa usando as opções e compara se tais e quais arquivos tem a mesma chave md5sum, tamanho etc e com a opção "-d" oferece a opção de apagar, em um prompt, bastando responder o número correspondente ao arquivo que se deseja manter no PC ou "all" para não apagar nada. O chato de manter todos é ter que escrever "all" o tempo todo...
P.S.. Cuidado para não confundir as coisas e perder dados acidentalmente!!!
Na maioria são impressões PDF de páginas que são interessantes, livros (gosto demais de ler), as mensagens do bispo, ISOs do Linux e fotos.
Problema que eu andei mudando dados de partição, copia daqui, apaga dali, muda pasta, cria pasta, nova ordem, nova desordem, as coisas viram bagunça.
E nessa bagunça, comecei a ver que dupliquei muita coisa. E comecei a ficar amoado tentando eliminar um a um. Até que tive a ideia de googlar atrás de melhor solução. Achei: chama-se fdupes.
Pra instalar, o bom e velho:
# apt-get install fdupes
Depois no terminal:
fdupes -r -S -d .
Estas opções fazem o seguinte:
- -r : analisa diretório recursivamente
- -S : mostra o tamanho dos arquivos (meio besta, ms gosto de ver esses dados)
- -d : apresenta um prompt para deleção
- "." : é o diretório que se deseja analisar. Eu rodo ele em $HOME e nas pastas de becape.
O que faz esse programa: ele analisa usando as opções e compara se tais e quais arquivos tem a mesma chave md5sum, tamanho etc e com a opção "-d" oferece a opção de apagar, em um prompt, bastando responder o número correspondente ao arquivo que se deseja manter no PC ou "all" para não apagar nada. O chato de manter todos é ter que escrever "all" o tempo todo...
P.S.. Cuidado para não confundir as coisas e perder dados acidentalmente!!!
Recomendo o FSLint também. Essa é uma das funções mas criando hardlinks para os duplicados.
Há um patch para o fdupes criar hardlinks ao invés de remover as duplicatas. Mas creio que ainda não foi incorporado.