Download de Arquivos com Verificação do Hash SHA 256

Existem diversas ocasiões em que precisamos realizar o download de diversos arquivos que possuem tamanhos expressivos, em nossas redes, sem gerar uma queda na velocidade de internet dos colaboradores e dos clientes. Neste artigo, mostro um script em Python que pode ser agendado durante o período noturno, visando o download de arquivos, além da verificação do Hash SHA 256 de cada arquivo baixado.

[ Hits: 5.827 ]

Por: Diego Mendes Rodrigues em 10/11/2020 | Blog: https://www.linkedin.com/in/diegomendesrodrigues/


Introdução



Existem diversas ocasiões em que precisamos realizar o download de diversos arquivos que possuem tamanhos expressivos, em nossas redes, como alguns exemplos:
  • Download de diversas ISOs de distribuições Linux;
  • Download de diversas ISOs da Microsoft;
  • Backup completo de servidores;
  • Restauração de backups;
  • Download de imagens de satélite;
  • Dentre outras.

Estas atividades podem ser agendadas, em servidores Linux ou servidores Windows, para serem realizadas fora do horário comercial, ou durante o final de semana, não ocasionando lentidão na rede para os colaboradores, nem para os clientes. Existem softwares que podem realizar esse tipo de atividade, embora eu tenha criado um script em Python com essa finalidade.

No script apresentado abaixo, devemos enviar as seguintes informações para cada download de arquivo:
  • URL: endereço completo na internet onde o arquivo está publicado, por exemplo: https://releases.ubuntu.com/20.10/ubuntu-20.10-desktop-amd64.iso
  • Nome do arquivo: nome em que o arquivo ficará no sistema operacional, por exemplo: ubuntu-20.10-desktop-amd64.iso
  • Local de armazenamento: pasta onde o arquivo será armazenado, por exemplo: D:\Instaladores\
  • Hash de verificação: SHA 256 ou MD5, fornecido pelo website onde o arquivo está publicado, para podermos verificar se o arquivo foi descarregado corretamente

No script disponível abaixo, realizei o download de uma imagem do Debian e uma do Ubuntu, utilizando as seguintes configurações:

arquivos = [['http://ftp.nl.debian.org/debian/dists/buster/main/installer-amd64/current/images/netboot/mini.iso',
                 'mini.iso',
                 'D:\Instaladores\',
                 '1deb3d465ead230e7a94390c1aea053945d37df84bd05125bd66cd998f5369b1'],
                ['https://releases.ubuntu.com/20.10/ubuntu-20.10-desktop-amd64.iso',
                 'ubuntu-20.10-desktop-amd64.iso',
                 'D:\Instaladores\',
                 '3ef833828009fb69d5c584f3701d6946f89fa304757b7947e792f9491caa270e']]


Obtive o seguinte retorno ao executar esse script:

Download do arquivo mini.iso
Hash SHA 256 OK - 1deb3d465ead230e7a94390c1aea053945d37df84bd05125bd66cd998f5369b1 = 1deb3d465ead230e7a94390c1aea053945d37df84bd05125bd66cd998f5369b1
-=-
Download do arquivo ubuntu-20.10-desktop-amd64.iso
Hash SHA 256 OK - 3ef833828009fb69d5c584f3701d6946f89fa304757b7947e792f9491caa270e = 3ef833828009fb69d5c584f3701d6946f89fa304757b7947e792f9491caa270e
-=-

Linux: Download de arquivos da internet com a verificação do hash SHA 256
Segue abaixo o script em Python 3.9 para realizar o download de arquivos da internet:

"""
Download de arquivos da internet com a verificação do hash SHA 256 ou do MD5
-
Diego Mendes Rodrigues
"""
import hashlib
import urllib.request
import shutil

def calcular_md5(caminho_do_arquivo=''):
    """Calcular o hash MD5 de um arquivo
    :param caminho_do_arquivo: Caminho completo do arquivo
    :return: hash MD5
    """
    # Validar os inputs da função
    if len(caminho_do_arquivo) <= 0:
        print('Informe o parâmetro de forma correta')
        exit(1)

    with open(caminho_do_arquivo, "rb") as f:
        bytes_recebidos = f.read()  # read entire file as bytes
        readable_hash = hashlib.md5(bytes_recebidos).hexdigest()
        return readable_hash

def calcular_sha256(caminho_do_arquivo=''):
    """Calcular o hash SHA 256 de um arquivo
    :param caminho_do_arquivo: Caminho completo do arquivo
    :return: hash SHA 256
    """
    # Validar os inputs da função
    if len(caminho_do_arquivo) <= 0:
        print('Informe o parâmetro de forma correta')
        exit(1)

    with open(caminho_do_arquivo, "rb") as f:
        bytes_recebidos = f.read()  # read entire file as bytes
        readable_hash = hashlib.sha256(bytes_recebidos).hexdigest()
        return readable_hash

def download_do_arquivo(url_do_arquivo='', pasta_onde_salvar=''):
    """Realizar o download de um arquivo que está em uma URL
    :param url_do_arquivo: URL onde o arquivo está na internet
    :param pasta_onde_salvar: Pasta onde o arquivo será armazenado no computador
    :return: True no caso de sucesso, ou seja, download completo, ou False caso contrário
    """
    # Validar os inputs da função
    if len(url_do_arquivo) <= 0:
        print('Informe o parâmetro de forma correta')
        return False

    if len(pasta_onde_salvar) <= 0:
        pasta_onde_salvar = './'

    file_name = url_do_arquivo.split('/')

    # Download do arquivo salvando ele localmente com o nome especificado em `file_name`
    with urllib.request.urlopen(url_do_arquivo) as response, open(pasta_onde_salvar + file_name, 'wb') as out_file:
        shutil.copyfileobj(response, out_file)
    return True

def validar_hash(hash1='', hash2='', sha256=True):
    """Verificar se os 2 hashs são idênticos
    :param hash1: Hash 1 que será verificado
    :param hash2: Hash 2 que será verificado
    :param sha256: True caso o hash seja SHA 256, False caso seja um MD5
    :return: True caso os hashs sejam idênticos, False caso contrário
    """
    # Validar os inputs da função
    if len(hash1) != len(hash2):
        print('Informe os parâmetros de hash da forma correta')
        exit(1)
    if not isinstance(sha256, bool):
        print('Informe o parâmetro sha256 da forma correta, sendo um booleano')
        exit(1)

    mensagem_hash = 'SHA 256'
    if not sha256:
        mensagem_hash = 'MD5'

    if hash1 == hash2:
        print(f'Hash {mensagem_hash} OK - {hash1} = {hash2}')
        return True
    else:
        print(f'Hash {mensagem_hash} INCORRETO - {hash1} != {hash2}')
        return False

def main():
    """Função principal da aplicação que realiza o download de arquivos da internet
    """
    arquivos = [['http://ftp.nl.debian.org/debian/dists/buster/main/installer-amd64/current/images/netboot/mini.iso',
                 'mini.iso',
                 'D:\Instaladores\',
                 '1deb3d465ead230e7a94390c1aea053945d37df84bd05125bd66cd998f5369b1'],
                ['https://releases.ubuntu.com/20.10/ubuntu-20.10-desktop-amd64.iso',
                 'ubuntu-20.10-desktop-amd64.iso',
                 'D:\Instaladores\',
                 '3ef833828009fb69d5c584f3701d6946f89fa304757b7947e792f9491caa270e']]

    for arquivo in arquivos:
        print(f'Download do arquivo {arquivo}')
        download_do_arquivo(arquivo, arquivo)
        hash_sha256 = calcular_sha256(arquivo + arquivo)
        validar_hash(hash_sha256, arquivo)
        print('-=-')

if __name__ == '__main__':
    main()
 

Conclusão

Este script é um exemplo que pode ser utilizado de diversas maneiras diferentes, em estações de trabalho Windows ou servidores Linux.

E você, utiliza algum script para realizar o download de arquivos na internet?

   

Páginas do artigo
   1. Introdução
Outros artigos deste autor

Fail2ban no Debian - Instalação e Configuração

Nmap - Comandos úteis para um administrador de sistemas Linux

Ubuntu Linux 20.04.1 LTS

Usando o cURL - Client URL

Comando du - encontrando as maiores pastas e arquivos no Linux

Leitura recomendada

Scikit Learn: Projetando o futuro de suas APIs e aplicativos usando machine learning

RapidScan - Multi-Tool WEB Vulnerability Scanner

Trabalhando com permutações em ordem lexicográfica crescente

Python: automatizando a extração de informações na web com expressões regulares

Desenvolvendo aplicações GUI simples em Python & Glade (PyGTK) com banco de dados SQLite

  
Comentários
[1] Comentário enviado por maurixnovatrento em 10/11/2020 - 12:37h


Belo artigo.

___________________________________________________________
[code]Conhecimento não se Leva para o Túmulo.
https://github.com/MauricioFerrari-NovaTrento [/code]

[2] Comentário enviado por diegomrodrigues em 16/11/2020 - 08:56h


[1] Comentário enviado por mauricio123 em 10/11/2020 - 12:37h


Belo artigo.

___________________________________________________________
[code]Conhecimento não se Leva para o Túmulo.
https://github.com/MauricioFerrari-NovaTrento [/code]


Obrigado!


Contribuir com comentário




Patrocínio

Site hospedado pelo provedor RedeHost.
Linux banner

Destaques

Artigos

Dicas

Tópicos

Top 10 do mês

Scripts