Otimizando seu web server com Apache2 + Lighttpd

Solução que fez com que o desempenho (velocidade de resposta) do servidor web do Viva o Linux aumentasse em até 8 vezes. O Apache2 possui módulos indispensáveis para servir páginas dinâmicas, enquanto o Lighttpd é imbatível quando se trata de páginas estáticas. Então, por quê não combinar os dois?

[ Hits: 103.079 ]

Por: Fábio Berbert de Paula em 03/09/2009 | Blog: https://fabio.automatizando.dev


Controle de cache no cliente: tags expires e etag



Explorar o cache do cliente é uma das chaves para a otimização em sites de grande volume de acesso. Voltando ao exemplo da home do VOL, a mesma possui 27 elementos, sendo 1 dinâmico e 26 estáticos.

Sem nenhuma otimização de configuração, toda vez que um cliente (browser) visitar o site, todos os 27 elementos serão baixados e cada download originará uma conexão direta com o servidor web, o que consome recursos de software e também largura de banda, visto que o download sempre precisa ser realizado novamente, mesmo você sendo visitante reincidente.

Como é sabido, todo browser possui um espaço reservado para cache de páginas de internet e esse cache é diretamente controlado pelas tags de controle de cache informadas pelo site visitado. Sendo assim, por quê não aproveitar o recurso de cache local dos clientes para diminuir a quantidade de acessos ao seu servidor?

Expires

Para explorar tal recurso devemos configurar 2 itens no servidor web. O primeiro é a tag "Expires", que informa ao browser que determinado arquivo é válido por algum período de tempo. A configuração padrão na maioria dos servidores web é de 1 dia, o que considero insuficiente. Com 1 dia de validez, um visitante assíduo de seu site baixará os arquivos estáticos do mesmo 30 vezes por mês. Se você considerar que sua logotipo não muda menos que 1 vez por ano, fazê-lo baixar o mesmo arquivo todos os dias é um baita desperdício.

A configuração que considero ideal para cache de arquivos estáticos é de 1 ano. Mas aí você me pergunta:

"- Se o browser do usuário vai ficar 1 ano usando minha logotipo cacheada em seu disco local, se eu atualizar minha logo, como a mesma atualizará no cache do cliente?"

A solução é simples. Se você atualizar sua logotipo, que no caso se chama logotipo01.png, renomeie o arquivo para logotipo02.png. O primeiro arquivo está em cache, mas o segundo não. Esta solução requer este tipo de sincronia com o webmaster, porém o custo x benefício é grande. Muita banda e recurso economizado para pouco trabalho renomeando arquivos que quase nunca mudam.

Para você entender melhor o conceito da tag Expires, vamos a um exemplo prático, onde baixaremos um arquivo usando o protocolo HTTP na unha:

$ telnet www.vivaolinux.com.br 80
Trying 76.74.248.57...
Connected to vivaolinux.com.br.
Escape character is '^]'.
GET /publico/cache.txt HTTP/1.0
Host: www.vivaolinux.com.br
<Digite enter para gerar uma linha em branco aqui>

HTTP/1.1 200 OK
Date: Thu, 03 Sep 2009 10:01:07 GMT
Server: Apache
Last-Modified: Thu, 03 Sep 2009 09:49:01 GMT
Accept-Ranges: bytes
Content-Length: 43
Expires: Fri, 03 Sep 2010 10:03:24 GMT
Vary: Accept-Encoding
Connection: close
Content-Type: text/plain; charset=ISO-8859-1

Olá, agora este arquivo está no seu cache!
Connection closed by foreign host.

Simulamos, via telnet, a conexão que um browser faz quando é digitada a URL http://www.vivaolinux.com.br/publico/cache.txt. Neste caso os campos Date, Server, Last-Modified, Accept-Ranges, Content-Length, Expires, Vary, Connection e Content-Type correspondem à informações trocadas entre o browser e o servidor, não sendo visíveis na tela do usuário.

No exemplo acima a tag "Expires" informa ao browser que o arquivo cache.txt é válido, por 1 ano, no caso até 3 de setembro de 2010. Sendo assim o browser guarda este arquivo em cache por 1 ano.

Etag

Etag foi uma tag criada para ser a sucessora do Expires. Em breves palavras, ela cria uma assinatura para cada arquivo oferecido pelo servidor ao cliente e esta serve para controle de cache, sobrepondo as informações oferecidas pelo Expires. O Etag não define uma data futura para o vencimento do cache do arquivo, ao invés disso ele faz o servidor web, de tempos em tempos, gerar uma nova assinatura para o arquivo para comparar com a assinatura armazenada pelo browser do cliente.

Resumindo, Etag não colou, mas vem habilitado na configuração padrão da maioria dos servidores web disponíveis. Cabe ao administrador do sistema DESABILITAR o uso de Etag no servidor.

No decorrer do artigo veremos como configurar o Expires e o Etag tanto no Lighttpd quanto no Apache.

Página anterior     Próxima página

Páginas do artigo
   1. Considerações iniciais
   2. Apache2 vs Lighttpd
   3. Controle de cache no cliente: tags expires e etag
   4. Instalando e configurando o Lighttpd
   5. Integrando Apache2 com Lighttpd
   6. Testando a configuração
   7. Resultados e conclusão
Outros artigos deste autor

Se preparando para obter certificação LPI

Como usar o ChatGPT para melhorar a educação dos seus filhos

HOWTO: Como se tornar moderador do Viva o Linux

Como criar VIEWS no MySQL

O que é e como funciona um ataque de força bruta

Leitura recomendada

Deixando o Gnome bonitão em qualquer distribuição

Instalando o Msn-Proxy no Mandriva 2008/2009

Restaurando o LILO com o Slackware 9.1 (HOWTO)

Fedora Core 1 :: Firewall e update

ROX-Files: Ícones para gerenciadores de janelas que não suportam ícones

  
Comentários
[1] Comentário enviado por elgio em 03/09/2009 - 12:00h

Muito bom Fábio.

O legal desta tua solução é a comprovação de que as vezes não basta esta ou aquela solução. Em alguns casos se usa AMBAS. O melhor das duas. Muito bom.

[2] Comentário enviado por marcelomortificy em 03/09/2009 - 12:11h

Muito bom!!!!


Parabéns Fábio.

[3] Comentário enviado por marcelomendes em 03/09/2009 - 12:15h

Muito bom Fábio, parabéns!

[4] Comentário enviado por TheHawk em 03/09/2009 - 13:13h

Geralmente não comento muito aqui no VOL..... mas essa aqui eu fiz questão de deixar o comentario.... tá de parabens.... muito boa solução, otimizou bem o negocio.... trabalho com provedor wireless e aqui estou usando o ThunderCache, quando estava usando o apache para servidor os arquivos para o thunder estava tendo uma lentidão terrivel.... depois de mudar o servidor web parea o lighttpd foi dá agua para o vinho, extremamente rapido e leve.... o light é otimo...... mais uma vez parabens pela solução, até mais.

[5] Comentário enviado por cesar em 03/09/2009 - 13:45h

Boa!

[]'s

[6] Comentário enviado por cleberjsantos em 03/09/2009 - 13:59h

Opa Fábio,

Boa.... ;) E então, eu estava testando o Light também, mas me deparei com alguns problemas, talvez por ainda não o conhecer diretamente claro! Mas a idéia era basicamente abandonar o Apache e partir para a combinação Lighttpd + Varnish, hoje uso Apache + Varnish, no qual já dá um adianto tremendo, então imagina o Light + Varnish ;)

Bem, vou documentar minha experiência, e com base nela fazer um How-to aqui também, neste caso estou falando de usar Zope/Plone com Light + Varnish, se depois desejar podemos trocar figurinhas quanto a otimizações ;)

Cleber J Santos
www.cleberjsantos.com.br

[7] Comentário enviado por foguinho.peruca em 03/09/2009 - 18:09h

Olá!

Boa solução! Vou tentar implementar uma semalhante, porém eu o uso a combinação do tomcat (para o java) + apache (redirecionamento na rede). acho que vou dividir a carga do tomcat com o lighttpd e ver no que da... ^^''

Jeff

[8] Comentário enviado por removido em 03/09/2009 - 21:03h

Parabéns chefito.... Será que seu trabalho vai ganhar uma camiseta redbul ?????
rs...rs...rs...rs...

[9] Comentário enviado por isaque_alves em 03/09/2009 - 23:09h

Cara, essa solução é perfeita...
vo testar assim que chegar em casa no meu servidor de testes e demonstações...
valeu por compartilhar o conhecimento!!
E é isso!!

Viva o Software Livre!!!
Viva o Linux!!

[10] Comentário enviado por maran em 04/09/2009 - 12:30h

Show!

[11] Comentário enviado por junior em 04/09/2009 - 15:55h

Já dizia o poeta: Fodástico!

[12] Comentário enviado por pinduvoz em 04/09/2009 - 21:30h

O site realmente ganhou agilidade.

Parabéns!

[13] Comentário enviado por pedro-filho em 06/09/2009 - 02:56h

tem como configurar o expires no squid ?????

obrigado....

[14] Comentário enviado por reideer em 07/09/2009 - 21:40h

Boa noite.
Eu já testei esta solução a algum tempo, porém precisava de virtualhosts e mais algumas coisas, no final das contas se tornou inviável.

Gostaria de Saber se o Vol utiliza algum sistema de Cache, e qual?

[15] Comentário enviado por franciscosouza em 09/09/2009 - 08:16h

Sensacional, parabéns pelo artigo! ;D

[16] Comentário enviado por removido em 09/09/2009 - 20:31h

Boa noite.

Fábio, você poderia corrigir o exemplo de integração do Apache com Lighttpd na 'Versão para impressora'. O exemplo de configuração para integrar os dois Web Server é exibido da seguinte forma:

<img src="http://img.vivaolinux.com.br/imagens/logotipo01.png">
Para:
<img src="http://img.vivaolinux.com.br/imagens/logotipo01.png">

Deveria ser:

<img src="/imagens/logotipo01.png">
Para:
<img src="http://img.vivaolinux.com.br/imagens/logotipo01.png">



[17] Comentário enviado por guilhermecunha em 10/09/2009 - 08:43h

Muito legal, concerteza me lembrarei deste artigo quando administrar um site com muitos acessos...

Abraço!

Guilherme Cunha
http://www.guilhermecunha.com.br

[18] Comentário enviado por removido em 20/11/2009 - 15:59h

Fabio,

Estou com a seguinte situação e gostaria de uma opinião sua.

o hardware é o seguinte.

DELL 1950

2 processadores quadcore e 8gb de RAM
2 discos SAS em RAID 1

o sistema que esta hospedado nele é TOMCAT e POSTGRES 8.3. O Load average dele é de uma média de 3.5 a 4, tenho uma média de 250 conexões simultãneas e acho que esta ficando cada vez mais lento.

Tentei uma solução de proxy reverso com o apache mais a aplicação fica com problemas no jsession, ai vem a minha pergunta se eu colocasse o lighttpd na frente junto com o apache para separar o conteudo statico melhoraria????

abraços

Filipe Mendonça

[19] Comentário enviado por removido em 20/11/2009 - 20:25h

Ótimo artigo Fábio.
Intressante essa implementação para o site.

[]'s

[20] Comentário enviado por fabio em 21/11/2009 - 22:26h

Olá Filipe,

No caso você não precisaria do Apache, apenas o Lighttpd com Tomcat.

Alguma processo está pesando demais aí, essa máquina não pode ter 3/4 de load com apenas 250 acessos simultâneos.

PS: O Tomcat por natureza é lento e consome muito hardware, pelo menos era assim quando o utilizei a 4 ou 5 anos atrás, não sei como é agora.

Um abraço.

[21] Comentário enviado por Holmes em 16/12/2009 - 22:08h

muito interessante, vlw, Placebo..............gostei das informações...........

[22] Comentário enviado por ferreirajr630 em 26/01/2010 - 09:14h

Paraben otimo mas otimo mesmo esse artigo esparo que venha mas artigos na mesma categoria de melhoria de navegação

[23] Comentário enviado por dolivervl em 09/03/2010 - 20:05h

Muito bom mesmo, Parabéns !!!

[24] Comentário enviado por elderjmp em 30/08/2010 - 00:12h

Fábio,

Parabéns pelo artigo, muito bom.

Pq usar o mod_proxy do Apache para direcionar as requisições de conteúdo estático ao invés de requisitar diretamente ao Lighttpd, passando o caminho na porta 81, no arquivo index.php (<img src="http://img.vivaolinux.com.br:81/imagens/logotipo01.png">)?

E usando o Debian aqui, ocorreu o erro "client denied by server configuration: proxy:http://...". O mod_proxy só funcionou depois de habilitar no arquivo /etc/apache2/mods-available/proxy.conf a diretiva "Allow from all" (Default é "Deny for all"). Algum problema em permitir para todos?

Abraço

[25] Comentário enviado por fabio em 30/08/2010 - 00:34h

Olá Elder,

Passar o caminho diretamente no código-fonte ao invés de usar o mod_proxy é viável quando seu site é composto por apenas alguns arquivos, mas no caso do VOL, ele possui milhares de links, então é mais fácil alterar somente o apache.conf a centenas de arquivos.

O allow from all é tranquilo de usar, mas sugiro que dê um options -indexes para evitar que possam acessar a lista de arquivos dos diretórios.

[]'s

[26] Comentário enviado por julianjedi em 16/09/2010 - 13:02h

Nossa .. muito bom mesmo fabio, quando li no excerpt do artigo pensei ateh q vc ia fazer um monte de remendo ... mas ficou muito simples de entender e os resultados foram sensacionais ... com certeza é uma grande contribuição para a comunidade...

Já dizia o poeta: Fodástico![1]

[27] Comentário enviado por dolivervl em 08/10/2010 - 23:57h

Fábio uma coisa que quero saber de vc é o seguinte, compactação com o apache, já usou ? qual sua opnião sobre isso? Uso no proxy onde trabalho e reduziou e muito o consumo de banda e não aumento consideravelmente o uso de CPU do servidor proxy.

[28] Comentário enviado por removido em 09/11/2010 - 08:35h

Sabia que o IIS da o mesmo problema e que é ainda pior que no apache?

[29] Comentário enviado por qxada07 em 24/03/2011 - 09:13h

Um artigo muito bom... Parabéns.....

Sempre achei o Apache muuuuito ferrado porém estes 2 integrados não tem para ninguém....

[30] Comentário enviado por SmasherBomb em 10/04/2011 - 13:43h

Parabéns...artigo muito bom !!

[31] Comentário enviado por fabgcruz em 15/04/2011 - 09:15h

Muito bacana o artigo .... maravilha !

[32] Comentário enviado por ederrb em 06/05/2011 - 11:17h

Fábio(e quem mais puder ajudar), tenho exatamente essa máquina: Intel Xeon E3110 Woldfale (2 cores x 3.0 GHz), 8GB Ram e 1,5TB de disco. Nessa maquina rodo um servidor de armazenamento de áudio(tal como o 4shared) sendo que com algumas implementações a mais e alguns diferenciais(vide www.suamusica.com.br ). Na hora do pico chega a ter mais de 200 downloads simultaneos. Estes downloads são feitos através de readfile() no php(principalmente para que os visitantes não tenham conhecimento sobre o caminho dos arquivos p/ download). Isso deixa a máquina arrastando-se, já cheguei a registrar load de 95 e a solução que vi foi reiniciar o httpd acarretando na perda de todas as conexões, caso eu não restarte o httpd a maquina trava geral. Ouvi dizer que o lighthttpd tem uma extensão X-LIGHTTPD-send-file que dispensaria o uso de readfile(), assim o php nao faria o trabalho de "soltar o download na tela" e pelo que vejo nos processos é justamente ele quem está consumindo todo o hardware da maquina. Pela sua experiência, seria viável instalar o lighthttpd com essa configuração passada por você + essa extensão? Tentei usar a extensão na minha configuração atual com apache mas nao obtive êxito. Desculpe-me pelo texto demasiado longo, vi aqui uma oportunidade de resolver este problema que vem persistindo há quase um mes. Agradeço desde já ! Abraços.

[33] Comentário enviado por samuelspsd em 16/01/2012 - 17:24h

Eu teria algumas dúvidas em relação a este artigo, ainda está aberto para discussão? Obrigado.


Contribuir com comentário




Patrocínio

Site hospedado pelo provedor RedeHost.
Linux banner

Destaques

Artigos

Dicas

Tópicos

Top 10 do mês

Scripts