mlgrassi
(usa Debian)
Enviado em 29/11/2017 - 17:47h
Prezados, necessito de uma ajuda para a implementação de um script de batimento de arquivos que NECESSARIAMENTE deve ser em shell.
O cenário é o seguinte. Tendo um arquivo chamado Arquivo_Original.txt, o qual contém informações que serão carregadas/processadas. Este arquivo permanece imutável sempre.
Quando o Arquivo_Original.txt é carregado, será gerado um novo arquivo denominado Arquivo_Processados.txt que conterá os dados que foram processados com sucesso.
Porém, sempre haverá registros que não serão processados e cairão em erro ou exceção, assim sendo precisarei gerar manualmente um arquivo denominado Arquivo_Nao_Processados.txt o qual deverá conter todos os registros que não estão contidos
no Arquivo_Processados.txt, ou seja, preciso montar um script que leia Arquivo_Original.txt e Arquivo_Processados.txt, e retorne todos os registros que estão no arquivo original, porém que não estejam no arquivo de processados.
Exemplo:
Arquivo_Original.txt
0
1
2
3
4
5
6
7
8
9
Arquivo_Processados.txt
3
5
7
8
O script precisará retornar Arquivo_Nao_Processados.txt
0
1
2
4
6
9
OBS1. O comando diff não ajuda em nada neste caso.
OBS2. O algoritmo tem de ser eficiente pois os arquivos que serão processados contém milhões de linhas cada 1.