A
World Wide Web (Rede de Alcance Mundial) é uma rede que interliga milhares de milhões de computadores em todo o mundo, pode ser considerado como um "repositório global", TANEMBAUM (2003) define a World Wide Web da seguinte forma: "A World Wide Web é uma estrutura arquitetônica que permite o acesso a documentos vinculados espalhados por milhões de máquinas na Internet".
Portanto a internet é uma poderosa ferramenta de comunicação e oferece uma imensa e variada quantidade de informações dos mais diversos assuntos. Também é utilizada para a transferência de dados podendo trabalhar com tipos de arquivos como: documentos, imagens, áudio, vídeo entre outros.
Para (TANEMBAUM, 2003), a web é vista pelo usuário como uma coleção global de documentos, esses documentos geralmente são chamados de páginas Web ou apenas páginas. Cada página pode conter vínculos, mais conhecidos como links para outras páginas, quando o usuário clica em um desses links é levado para a próxima página, esta ideia da fazer uma página apontar para outra é conhecida como hipertexto, segundo (TANEMBAUM , 2003), esse conceito foi criado por um professor do MIT (Massachusetts Institute of Technology), Vannevar Bush, em 1945, bem antes da criação da internet.
Com o surgimento da internet apareceram vários protocolos que regulamentavam as transferências de dados na rede, para regularizar a situação é padronizar o MIT e a CERN (Organisation Européenne pour la Recherche Nucléaire) assinaram um acordo chamado de W3C (World Wide Web Consortium), que rege normas para a padronização da internet, e ainda segundo (TANEMBAUM, 2003) uma destas normas é a utilização do protocolo HTTP (Hypertext Transfer Protocol) como padrão para navegação por páginas de hipertexto.
O protocolo HTTP
O HTTP - Protocolo de transferência de Hipertexto (Hypertext Transfer Protocol) é um protocolo da camada de aplicação da internet, segundo (KUROSE, 2006) o HTTP está dividido em duas partes, o programa cliente e o programa servidor, os dois programas são executados em máquinas diferentes, conversam um com o outro por meio de mensagens HTTP. O HTTP define a estrutura destas mensagens e o modo como são trocadas entre o cliente e o servidor.
As páginas web são constituídas por documentos ou arquivos da vários formatos como comentado acima, essas páginas são construídas com HTML (HyperText Markup Language, que significa Linguagem de Marcação de Hipertexto) é a linguagem padrão para a programação de páginas web, a página construída em linguagem HTML é interpretada por um browser ou navegador, que em HTTP é considerado como cliente. As páginas ou textos HTML também são considerados como documentos pelo protocolo HTTP, essas definições são explicadas melhor por (KUROSE, 2006) quando o autor fala sobre páginas web:
Uma página web (também denominada documento) é construída de objetos. Um objeto é simplesmente um arquivo - tal como um arquivo HTML, uma imagem JPEG, uma imagem GIF, um Applet Java, um clipe de áudio e assim por diante - que se pode acessar com um único URL. A maioria das páginas web é construída de um arquivo-base HTML e diversos objetos referenciados. Por exemplo, se uma página web contiver um texto HTML e cinco imagens JPEG, então ela terá seis objetos:
arquivo-base HTML e mais cinco imagens. (...)
Páginas web se encontram em um servidor web, onde podem estar várias outras páginas. O cliente ou usuário acessa essa página através de um navegador que interpreta o código HTML e constrói a página a ser visualizada por ele. Uma explicação mais simplificada do funcionamento seria a seguinte: o cliente faz uma requisição de uma página ao servidor através do protocolo HTTP e o servidor responde ao cliente com à página solicitada, como pode ser vista na figura 01.
Figura 01 - Comunicação Cliente servidor. Fonte: KUROSE, 2006