Computação Distribuída com TORQUE Resource Manager - Parte 2
A intenção deste artigo, é fornecer uma visão geral para submissão e controle de trabalhos na estrutura do PBS/TORQUE.
[ Hits: 14.862 ]
Por: Juno Kim em 21/10/2013 | Blog: http://www.kim.eti.br
Diretiva Interpretador Shell Interpretador PBS # Comentário Comentário #PBS Comentário Diretiva #PBS Comentário ComentárioA tabela a seguir, apresenta um resumo de algumas diretivas comumente usadas no PBS TORQUE. Para mais informações, por favor, consulte o manual TORQUE.
------------------------------------------------------------------------------ Diretiva Exemplo Descrição N #PBS N testjob Nome do JOB usado no PBS TORQUE M #PBS M user@domain Envia um e-mail de notificação m #PBS m e Envia um e-mail quando termina o JOB e #PBS e Cria um arquivo de erro o #PBS o ~/out Redireciona a saída para $HOME/out q #PBS q all.q Especifica a fila exemplo: all.q d #PBS d /home/testuser Determina o diretório de trabalho l #PBS l walltime=00:30:00 resource request, i.e. 30 minutes run time l #PBS l nodes=2:ppn=2 request two CPUs on two nodes each --------------------------------------------------------------------------------
Queue Memory CPU Time Walltime Node Run Que Lm State ------------ ------ -------- -------- ---- --- --- -- ----- default -- -- -- -- 0 0 -- E R special -- -- -- -- 0 0 -- E R --- --- 0 0Em seguida, envie o seu trabalho, por exemplo, diretamente para a fila "special". Após o envio bem-sucedido, PBS TORQUE responde à identificação do trabalho com o JOB ID.
95.masterPara exibir o status do(s) trabalho(s) executado(s), use o comando qstat. Note, enquanto qstat mostra todas as tarefas atualmente submetidas ao cluster.
Job id Name User Time Use S Queue ----------------- ------------- ----------- ---- --- - ----- 95.master testjob.sh testuser 0 R special# qstat -u testuser
testuser: Req'd Elap Job ID Username Queue Jobname SessID NDS TSK Memory Time S Time ------------ -------- -------- ----------- ------ ----- --- ------ ----- - ----- 93.master testuse batch test2.sh 16452 1 -- -- 01:00 C 01:41 95.master testuse special testjob.sh 17564 1 -- -- 01:00 C 00:01
jobname.e#{JOBID} jobname.o#{JOBID}Os arquivos de saída, em resumo, contém a saída de suas aplicações, mas quando existe algum erro, é importante analisar o mesmo.
Configurando o proftpd com autenticação de usuário pelo passwd
Computação Distribuída com TORQUE Resource Manager
Docker + Cluster DRBD + SQL Server - Database as a Service Utilizando Volumes Replicados
Google AdSense vs Layout de websites
Viva o Linux Training: seja um moderador do VOL
Como contribuir para projetos abertos no GitHub
Nenhum comentário foi encontrado.
Enviar mensagem ao usuário trabalhando com as opções do php.ini
Meu Fork do Plugin de Integração do CVS para o KDevelop
Compartilhando a tela do Computador no Celular via Deskreen
Como Configurar um Túnel SSH Reverso para Acessar Sua Máquina Local a Partir de uma Máquina Remota
Configuração para desligamento automatizado de Computadores em um Ambiente Comercial
Compartilhamento de Rede com samba em modo Público/Anônimo de forma simples, rápido e fácil
Cups: Mapear/listar todas as impressoras de outro Servidor CUPS de forma rápida e fácil
Criando uma VPC na AWS via CLI
Tem como instalar o gerenciador AMD Adrenalin no Ubuntu 24.04? (6)