fabio
(usa Debian)
Enviado em 29/06/2015 - 16:40h
Hoje às 5h recebi um alerta de load alto do servidor, na mesma hora levantei pra conferir. Em caso de load alto meu celular beepa, criei o alerta usando o Tasker + SSh plugin.
Ao tentar efetuar login remoto via SSH, o servidor travava na hora de abrir o shell. Aparentemente alguns serviços estavam funcionando. A máquina respondia à ping normalmente, o web server retornava arquivos estáticos etc.
Como não consegui acesso remoto, comecei a tentar executar comandos direto via ssh. Pra minha surpresa o comando uptime retornava sempre o mesmo load e horário do travamento (gravei o vídeo às 9h, notem os horários sempre às 5h). O comando w idem. O comando "ps aux" retornava sempre os mesmo processos.
Tentei reiniciar os serviços e posteriormente o servidor via comando remoto e nada.
O provedor fez um hard reset na máquina e tudo voltou a funcionar normalmente. Nenhuma anomalia nos logs, nada. Estou até agora sem entender o motivo do travamento de hoje. Provavelmente fora um pico de energia, é a explicação mais aceitável que tenho até o momento.
Ficamos tanto tempo fora porque o suporte demorou a reiniciar a máquina, e quando o fez, a deixou offline. Mas tudo foi resolvido de boa.