Intoduccion a Las Tecnologias Web

18
Programación Web Instituto Tecnológico de la Laguna 1 / 18 Raymundo Jove Pérez UNIDAD 1 Introducción a las Tecnologías Web 1 Perspectiva Histórica de Internet Internet es la red de computadores más grande del mundo. Su misión principal es ofrecer acceso a inimaginables cantidades de información almacenada en esos computadores conectados a ella y que están repartidos por todo el planeta. No es un error pensar en Internet como en dos entes: por un lado, el conjunto de sistemas informáticos que hacen posible la existencia de esta red mundial, y, por otro, la información residente en esos sistemas. Cada vez que alguien publica una información en Internet (un sitio web, por ejemplo) o conecta un nuevo computador, realmente está contribuyendo al crecimiento de la Red. Nadie conoce exactamente el tamaño de Internet, ya que es un conjunto de redes de computadores más pequeñas que funcionan de forma independiente, sin un único lugar donde se centralicen todas las conexiones. Es como un gran "monstruo sin cabeza, pero con infinidad de patas". Internet fue concebida por el ejército de los Estados Unidos como un sistema de comunicaciones seguro que funcionara en caso de ataque. La Red comenzó a funcionar a finales de la década de los sesenta como un proyecto de investigación de la Agencia de proyectos de investigación avanzados (ARPA) y recibió el nombre de ARPAnet. Más tarde, ARPA pasó a denominarse DARPA (Agencia de proyectos de investigación avanzados para la defensa). La primera red ARPAnet contaba con cuatro computadores y fue diseñada para demostrar que era factible la construcción de redes compuestas por computadores separados geográficamente. Los militares buscaban una forma de construir redes tolerantes a fallos, de manera que ARPAnet se diseñó para que permitiera la transmisión de información entre computadores utilizando un sistema flexible y robusto. En 1972, ARPAnet era pública y, por entonces, 50 universidades estaban conectadas a esa red, muchas de las cuales trabajaban en proyectos de tecnología militar. La mayor preocupación de los militares es la fiabilidad de los computadores. Si una red militar sólo tiene una conexión y algo destruye esa conexión, la comunicación ya no es posible y el resultado sería trágico para los soldados que dependieran de la información de esos computadores. ARPAnet era capaz de soportar la pérdida de conexión, pues fue ideada como un esquema con diversas rutas entre los computadores conectados, de forma que un computador podía enviar información a otro a través de cualquier ruta dis- ponible y no únicamente a través de una preestablecida. Con el transcurso del tiempo, cada vez eran más las universidades e institutos de investigación que se conectaban a ARPAnet que, en consecuencia, derivó hacia una red que sólo manipulaba información relacionada con proyectos de investigación. El gobier- no norteamericano creó una segunda red con fines únicamente militares, MILnet. En la década de los ochenta, la Fundación Nacional de Ciencia creó NFSnet, que enlazaba media docena de supercomputadores a velocidades muy altas. En 1991 se combinaron las redes MILnet y NFSnet. Internet es una combinación de ARPAnet, MILnet, NSI (NASA Science Internet) y NFSnet, siendo todas ellas la espina dorsal que mantiene la unidad de Internet. Internet

description

Intoduccion a Las Tecnologias Web

Transcript of Intoduccion a Las Tecnologias Web

Page 1: Intoduccion a Las Tecnologias Web

Programación Web

Instituto Tecnológico de la Laguna

1 / 18

Raymundo Jove Pérez

UNIDAD 1 Introducción a las Tecnologías Web 1 Perspectiva Histórica de Internet

Internet es la red de computadores más grande del mundo. Su misión principal es

ofrecer acceso a inimaginables cantidades de información almacenada en esos

computadores conectados a ella y que están repartidos por todo el planeta. No es un

error pensar en Internet como en dos entes: por un lado, el conjunto de sistemas

informáticos que hacen posible la existencia de esta red mundial, y, por otro, la

información residente en esos sistemas. Cada vez que alguien publica una información

en Internet (un sitio web, por ejemplo) o conecta un nuevo computador, realmente está

contribuyendo al crecimiento de la Red.

Nadie conoce exactamente el tamaño de Internet, ya que es un conjunto de redes de

computadores más pequeñas que funcionan de forma independiente, sin un único lugar

donde se centralicen todas las conexiones. Es como un gran "monstruo sin cabeza, pero

con infinidad de patas".

Internet fue concebida por el ejército de los Estados Unidos como un sistema de

comunicaciones seguro que funcionara en caso de ataque. La Red comenzó a funcionar

a finales de la década de los sesenta como un proyecto de investigación de la Agencia

de proyectos de investigación avanzados (ARPA) y recibió el nombre de ARPAnet.

Más tarde, ARPA pasó a denominarse DARPA (Agencia de proyectos de investigación

avanzados para la defensa). La primera red ARPAnet contaba con cuatro computadores

y fue diseñada para demostrar que era factible la construcción de redes compuestas por

computadores separados geográficamente. Los militares buscaban una forma de

construir redes tolerantes a fallos, de manera que ARPAnet se diseñó para que

permitiera la transmisión de información entre computadores utilizando un sistema

flexible y robusto. En 1972, ARPAnet era pública y, por entonces, 50 universidades

estaban conectadas a esa red, muchas de las cuales trabajaban en proyectos de

tecnología militar.

La mayor preocupación de los militares es la fiabilidad de los computadores. Si una red

militar sólo tiene una conexión y algo destruye esa conexión, la comunicación ya no es

posible y el resultado sería trágico para los soldados que dependieran de la información

de esos computadores. ARPAnet era capaz de soportar la pérdida de conexión, pues fue

ideada como un esquema con diversas rutas entre los computadores conectados, de

forma que un computador podía enviar información a otro a través de cualquier ruta dis-

ponible y no únicamente a través de una preestablecida.

Con el transcurso del tiempo, cada vez eran más las universidades e institutos de

investigación que se conectaban a ARPAnet que, en consecuencia, derivó hacia una red

que sólo manipulaba información relacionada con proyectos de investigación. El gobier-

no norteamericano creó una segunda red con fines únicamente militares, MILnet. En la

década de los ochenta, la Fundación Nacional de Ciencia creó NFSnet, que enlazaba

media docena de supercomputadores a velocidades muy altas. En 1991 se combinaron

las redes MILnet y NFSnet.

Internet es una combinación de ARPAnet, MILnet, NSI (NASA Science Internet) y

NFSnet, siendo todas ellas la espina dorsal que mantiene la unidad de Internet. Internet

Page 2: Intoduccion a Las Tecnologias Web

Programación Web

Instituto Tecnológico de la Laguna

2 / 18

Raymundo Jove Pérez

ha ido evolucionando con los años, y lo que en principio sólo estaba disponible para el

ejército y las universidades, se fue abriendo a empresas y, posteriormente, a todos los

demás usuarios. Internet ya no sólo es "algo" que sirve de entretenimiento, sino que

cada vez tiene más importancia como "centro de negocios" y ofrece muchos servicios,

algunos más conocidos que otros. Entre los más importantes podemos citar el correo

electrónico (e-mail), los grupos de noticias, Ftp y los chats.

Servicios de Internet

a) El correo electrónico

El correo electrónico es uno de los servicios más antiguos de Internet y data de prin-

cipios de la década de 1970, aunque nadie se pone de acuerdo sobre la fecha del primer

mensaje. En la actualidad, el correo electrónico sigue basándose en el mismo concepto:

el usuario de un computador escribe un mensaje de texto y lo envía al usuario de otro

computador. El mensaje circula por un laberinto de computadores conectados entre sí

hasta llegar a su destino. Para remitir y recibir este tipo de mensajes se utilizan unas

aplicaciones conocidas con el nombre genérico de lectores de correo electrónico.

Outlook Express es uno de los más conocidos

Además de los mensajes de texto convencionales, el correo electrónico actual permite

adjuntar otros tipos de archivos (imágenes, por ejemplo) o cifrar los mensajes para que

sólo pueda leerlos la persona a quien se envían.

b) Grupos de noticias (UseNet)

UseNet es un servicio algo parecido al correo electrónico, pero con la diferencia que en

lugar de enviar los mensajes a una sola persona, se envían a un lugar común, donde

muchos usuarios pueden verlos y responder a ellos. UseNet apareció en 1979, cuando

era un servicio que conectaba entre sí los computadores de la Universidad de Carolina

del Norte. En la actualidad, UseNet es un servicio muy difundido de Internet, con miles

de apartados (temas) a los que los usuarios pueden enviar mensajes y respuestas: los

temas van desde la informática y la técnica, pasando por discusiones sobre asuntos

sociales, religiosos y políticos, hasta la música, la literatura y el cine.

c) FTP

Las siglas FTP (Protocolo de transferencia de archivos, File Transfer Protocol) se

refieren tanto a un servicio de Internet como a una utilidad UNIX (que más tarde fue

también una utilidad de Windows 95). El servicio FTP de Internet está formado por una

serie de servidores que guardan y distribuyen los archivos. Muchos sitios FTP

pertenecen a fabricantes de hardware y software, que los utilizan para distribuir sus

productos y las correspondientes actualizaciones.

También hay sitios FTP que pertenecen a universidades e instituciones científicas; por

medio de ellos, estas instituciones hacen llegar utilidades shareware (software que se

prueba antes de comprar; si el programa le resulta de utilidad, debe abonar lo que su

Page 3: Intoduccion a Las Tecnologias Web

Programación Web

Instituto Tecnológico de la Laguna

3 / 18

Raymundo Jove Pérez

creador tenga estipulado) a una amplia variedad de usuarios.

d) Chat (charla)

IRC (Conversación transmitida por Internet, Internet Re/ay Chat) es otro servicio

extraordinariamente popular de Internet. Se trata de un sistema que permite a los usua-

rios reunirse en torno a un elemento común, en este caso un servidor IRC, y entablar

una conversación o charla. Pero no se trata de una conversación oral, sino que se escribe

en el computador lo que se desea decir.

No busque en las IRC unas conversaciones de muy alto nivel, pues en ellas no inter-

vienen normalmente especialistas universitarios ni ingenieros espaciales. Una gran can-

tidad de estos grupos de charla (llamados salones o canales) se ocupan de temas

populares o para adultos. Pero cuando aparece alguna noticia que atrae la atención

pública, se pueden encontrar varios grupos de noticias donde la gente se dedica a reírse

del asunto en cuestión.

Otros conceptos A continuación se explican otros conceptos con los que es conveniente estar familia-

rizados.

a) Navegador

Es la aplicación que permite al usuario descargar y visualizar páginas web de cualquier

servidor web del mundo. Como habrá supuesto, este acceso se realiza a través de

Internet. Normalmente, el sistema operativo incorpora una de estas aplicaciones, aunque

de Internet se pueden descargar navegadores de terceros. No pasa nada por tener

instalado más de un navegador.

b) ISP

ISP es el acrónimo de la expresión inglesa Internet Service Provider, Proveedor de

servicios de Internet. Es una empresa dedicada a conectar a Internet la línea telefónica o

el cable correspondiente del usuario. Por tanto, es la empresa dedicada a proveer acceso

o conexión a Internet a empresas y particulares.

c) Página web

Una página web es un documento publicado en la WWW. Normalmente, estas páginas

están escritas en lenguaje HTML. Son estas páginas las que aprenderá a crear. Una

página web es una parte constitutiva de un sitio web y puede estar enlazada a otras

páginas web mediante vínculos. Normalmente, su contenido está basado en texto e

imágenes, aunque cada vez es más común el uso de otros recursos adicionales, como

animaciones, sonidos y vídeos. Por tanto, las páginas web son auténticos documentos

multimedia.

Page 4: Intoduccion a Las Tecnologias Web

Programación Web

Instituto Tecnológico de la Laguna

4 / 18

Raymundo Jove Pérez

En resumen, una página web es cualquier documento de información accesible a través

de la WWW, con una dirección única en Internet (URL).

d) Sitio web

Un sitio web (o simplemente sitio) es un conjunto de páginas web accesibles a través de

Internet, convenientemente enlazadas y con una finalidad concreta. Un sitio web está

identificado por una dirección (URL) única, que es la dirección de la página principal o

home page. Navegando por la Web es posible encontrarse con distintos tipos de sitios

web.

Los sitios web más sencillos son los compuestos por una sola página, en la que se habla

de algo muy concreto. En el siguiente nivel encontramos los sitios web de la gran

mayoría (empresas y particulares), compuestos por varias páginas. Actualmente, de este

tipo de sitio web destacan con luz propia los dedicados al comercio electrónico y los de

la banca online.

Los sitios de comercio electrónico son auténticos catálogos en los que una empresa o

distribuidora ofrece sus productos. El usuario elige lo que le interesa y lo añade a un

"carrito de la compra virtual". Una vez finalizada la compra, el usuario revisa el carrito

y procede a pagar, normalmente con tarjeta de crédito.

Más que nunca, ahora sí podemos decir eso de "tener el banco en casa". La gran

mayoría de bancos, por no decir todos, disponen de un sitio web en el que se ofrecen

casi todos los servicios bancarios a sus clientes. El cliente no tiene más que identificarse

convenientemente y proceder a realizar sus operaciones (transferencias, compra y venta

de valores, consulta de saldos, etc.). Todas estas operaciones han de ser validadas

mediante una firma electrónica, también única de cada cliente. Por seguridad, es

conveniente modificar la clave de acceso y la firma digital cada cierto tiempo.

En los primeros años de Internet los sitios web más utilizados eran los buscadores, o

motores de búsqueda, que, con el tiempo, se han convertido en portales. En un principio

eran herramientas web que permitían buscar documentos que contenían una

determinada palabra o frase. El resultado era un listado de direcciones web corres-

pondientes a los sitios web donde aparecían esa palabra o frase. El usuario no tenía más

que hacer click en los enlaces propuestos en el listado para acceder a los sitios web en

cuestión.

Muchos sitios web que fueron creados como buscadores han evolucionado hasta con-

vertirse en Portales, puntos de entrada a la Web que ofrecen acceso rápido y sencillo a

infinidad de servicios. Existen portales de ámbito general (por ejemplo Yahoo!, MSN,

Lycos o Altavista) y también dedicados a un tema específico (medicina, astrología,

modelismo, deportes, etc.). Todos ellos tienen algo en común: una herramienta de

búsqueda que permite buscar por toda la Web (los de ámbito general) o por los sitios

web relacionados con el tema del portal.

Los portales de consumidor o ámbito general ofrecen buscadores, servicios de correo

electrónico, salas para "chatear", titulares de prensa y otros muchos servicios. El usuario

Page 5: Intoduccion a Las Tecnologias Web

Programación Web

Instituto Tecnológico de la Laguna

5 / 18

Raymundo Jove Pérez

puede personalizar muchos de estos portales para que, al conectarse a ellos, se muestre

la información que más le interesa.

Podríamos hablar mucho más sobre los portales y sus tipos, pero con esto es suficiente

para los que nos ocupan.

Optimización de un sitio web

Hay varios elementos de un sitio web que pueden ser optimizados. Al optimizar, un

buen diseñador web intentará encontrar el equilibrio apropiado entre estos

componentes, desde el punto de vista del diseño y del objetivo del sitio.

Entre los elementos que se deben considerar para la optimización están la accesibilidad,

usabilidad, visibilidad por el motor de búsqueda y la velocidad total de descarga de la

página.

A algunas personas puede resultarles extraño el poner accesibilidad y usabilidad como

algo que deba ser optimizado; sin embargo, Internet es un asunto global. La web estalló

en Norteamérica, y muchos otros países se quedaron atrás y todavía están intentando

alanzar el mismo nivel.

Las ideas de usabilidad y accesibilidad llegarán a ser importantes a una escala global en

algún momento, pero de momento hay muchos países donde aún se están aprendiendo

cosas sobre diseño web que durante años se han utilizado en Norteamérica. Así pues,

aunque los sitios más recientes pueden contener un diseño bien pensado respecto a su

accesibilidad y usabilidad (asumiendo que el diseñador pueda mostrar al cliente que

estas cualidades tienen ventajas), otros muchos sitios existentes necesitarán ser

adaptados u 'optimizados' si no rediseñados completamente.

2. Protocolos de Internet

En el ámbito de una red de computadores, un protocolo es un conjunto de reglas

formales que permiten la comunicación entre dos nodos de la red de forma no ambigua.

Esto mismo se puede extrapolar a Internet, teniendo en cuenta que no es más que una

"red de redes".

2.1 Protocolos TCP/IP

TCP!IP (Protocolo de control de transporte/protocolo Internet, Transmission Control

Protocolllnternet Protocol) es el conjunto de protocolos que se encuentran en el núcleo

de Internet. TCP/IP nació como un experimento de sistema para conectar distintos tipos

de redes y sistemas informáticos. Las especificaciones TCP/IP fueron publicadas con

estándares abiertos que no eran propiedad de ninguna compañía, lo que favoreció que

TCP/IP se convirtiera en el "lenguaje" de Internet, permitiendo la comunicación entre

redes y equipos de casi cualquier tipo. Estos protocolos suelen ser invisibles a los usua-

rios y definen básicamente dos cosas: el modo en que se transfiere la información entre

Page 6: Intoduccion a Las Tecnologias Web

Programación Web

Instituto Tecnológico de la Laguna

6 / 18

Raymundo Jove Pérez

dos computadores (es la tarea del protocolo TCP) y la identificación de los dispositivos

de una red mediante una dirección única (tarea del protocolo IP).

El protocolo TCP es el encargado del transporte. Al enviar un mensaje por Internet,

dicho mensaje se divide en paquetes. Cada paquete dispone de la información necesaria

para viajar desde su punto de origen hasta su destino por rutas diferentes.

Independientemente de la ruta seguida, y sin entrar en detalles sobre los dispositivos

implicados, los paquetes llegan a su destino donde son reensamblados para componer el

mensaje original. Este modelo de envío de mensajes por paquetes es muy flexible y

robusto, pues aunque haya "rutas" de la red fuera de servicio, los paquetes siempre

podrán ser "enrutados" por otras rutas y, antes o después, llegar a su destino.

El segundo protocolo de este conjunto, IP, define el denominado sistema de direccio-

namiento de Internet, según el cual todo "nodo" de la Red tiene asignada una dirección

IP única, compuesta por cuatro números separados por puntos, como, por ejemplo:

123.23.168.12. Todos los paquetes del mismo mensaje incluyen las mismas direcciones

IP de los computadores emisor y receptor.

2.2 Protocolo http.

Definición de http

HTTP de HyperText Transfer Protocol (Protocolo de transferencia de hipertexto) es

el método más común de intercambio de información en la world wide web, el método

mediante el cual se transfieren las páginas web a un ordenador.

Aunque entender el modo en que funciona HTTP no es estrictamente necesario para

desarrollar aplicaciones Web, algunas nociones sobre lo que esconden esas siglas puede

ayudar a desarrollarlas con más facilidad y confianza.

HTTP es un protocolo del nivel de aplicación para sistemas de información multimedia

distribuidos. Es un protocolo no orientado a estado que puede ser utilizado para más

propósitos que para manejar ficheros HTML.

Entre las propiedades de HTTP se pueden destacar las siguientes:

Un esquema de direccionamiento comprensible.

Utiliza el Universal Resource Identifier (URI) para localizar sitios (URL) o

nombres (URN) sobre los que hay que aplicar un método. La forma general de

un URL es servicio://host/fichero.ext .

Arquitectura Cliente-Servidor.

HTTP se asienta en el paradigma solicitud/respuesta. La comunicación se

asienta sobre TCP/IP. El puerto por defecto es el 80, pero se pueden utilizar

otros.

Es un protocolo sin conexión y sin estado.

Después de que el servidor ha respondido la petición del cliente, se rompe la

conexión entre ambos. Además no se guarda memoria del contexto de la

conexión para siguientes conexiones.

Page 7: Intoduccion a Las Tecnologias Web

Programación Web

Instituto Tecnológico de la Laguna

7 / 18

Raymundo Jove Pérez

Está abierto a nuevos tipos de datos.

HTTP utiliza tipos MIME (Multipart Internet Mail Extension) para la

determinación del tipo de los datos que transporta. Cuando un servidor HTTP

transmite información de vuelta a un cliente, incluye una cabecera que le indica

al cliente sobre los tipos de datos que componen el documento. De la gestión de

esos datos se encargan las utilidades que tenga el cliente (visor de imágenes, de

vídeo, etc.)

Una transacción HTTP está compuesta por una cabecera, y opcionalmente, por una línea

en blanco seguida de los datos. En la cabecera se especifica tanto la acción solicitada en

el servidor, como los tipos de datos devueltos o un código de estado.

2.2.1 Métodos de Petición http.

La primera línea de una petición contiene los comandos HTTP, conocidos como

métodos. Existen varios, pero los más conocidos y utilizados son tres: GET, HEAD y

POST.

El método GET se utiliza para recuperar información identificada por un URI por parte

de los navegadores. Si el URI se refiere a un proceso generador de datos como un

programa CGI, en lugar de él, se devuelven los datos generados por el programa. El

método GET también se puede utilizar para pasar una pequeña cantidad de información

al servidor en forma de pares atributo-valor añadidos al final del URI detrás de un

símbolo de interrogación, ?.

GET /cgi/saludar.pl?nombre=pepe&[email protected] HTTP/1.0

La longitud de la petición GET está limitada por el espacio libre en los buffers de

entrada. Por lo que para mandar una gran cantidad de información al servidor ha de

utilizarse el método POST.

El método HEAD es idéntico al GET excepto que el servidor no devolverá el cuerpo del

mensaje en la respuesta a un método HEAD. Esto es útil para obtener información sobre

las entidades implicadas en la petición sin que tengan que transferirse. Sirve para

comprobar si los enlaces son válidos o para saber cuando fue la última modificación de

la entidad solicitada.

El método POST se refiere normalmente a la invocación de procesos que generan datos

que serán devueltos como respuesta a la petición. Además se utiliza para aportar datos

de entrada a esos programas. En este caso los pares atributo-valor son incluidos en el

cuerpo de la petición separados por ampersand.

POST /cgi/saludar.pl HTTP/1.0

Accept: */*

nombre=pepe&[email protected]

De este modo el método POST no sufre de las limitaciones de espacio y puede enviar

mucha más información al servidor.

Page 8: Intoduccion a Las Tecnologias Web

Programación Web

Instituto Tecnológico de la Laguna

8 / 18

Raymundo Jove Pérez

2.2.2 Los Cookies

Los cookies representan mecanismos que permiten al servidor almacenar en el cliente

información relativa a la transacción. Así, cuando el servidor responde a una petición

del cliente, inserta una información que se conservará en el cliente. Esta información es

una descripción relativa a un conjunto de direcciones URL. En adelante, será insertada

por el cliente en una petición que referencie estas direcciones URL y se denomina un

cookie.

Este mecanismo, muy simple, proporciona una herramienta potente para numerosas

aplicaciones gestionadas por el Web.

Un cliente no puede memorizar más de 300 cookies. El tamaño máximo de cada cookie

es de 4000 bytes. Además, el cliente no puede memorizar más de 20 cookies por

servidor.

Las cookies se utilizan para memorizar las propiedades relativas a un recurso específico.

Estas propiedades se pueden definir de dos maneras:

1. Mediante una llamada la Servidor HTTP.

En este caso, un cookie es iniciado por el servidor insertando la directiva Set-Cookie

en la cabecera de la respuesta HTTP. Esto se generaliza mediante un script CGI con la

siguiente sintaxis:

Set-Cookie: Nombre=Valor; expires=Fecha; path=Camino;

domain=Nombre_ámbito; secure

2. Utilizando JavaScript.

También puede definirse mediante la propiedad cookie del objeto document. Esto

permite la definición local de propiedades de un cookie sin intervención del servidor

WWW. Así, la gestión y la memorización de los cookies las lleva a cabo el cliente.

2.3 URL

En algunos párrafos anteriores hemos hablado de los URL (Localizador uniforme de

recursos). Un URL es la dirección de Internet que se emplea para acceder a una página

web, un servidor web o cualquier otro dispositivo existente en la Red. Al URL también

se le conoce como dirección de Internet o dirección web. Para abreviar, y cuando la

conversación es sobre Internet, es normal utilizar simplemente la palabra "dirección".

Un URL típico puede tener el siguiente aspecto:

http://www.pearsoneducacion.com/musica/novedad.html

Los hay mucho más complejos, pero vamos a centramos en éste porque se parece a la

mayoría. En primer lugar nos encontramos con http:, que es el nombre del protocolo

(Hypertext Transfer Protocol, Protocolo de transferencia de hipertexto). HTIP es el pro-

tocolo de la Web que se utiliza en cada transacción y representa el sistema mediante el

Page 9: Intoduccion a Las Tecnologias Web

Programación Web

Instituto Tecnológico de la Laguna

9 / 18

Raymundo Jove Pérez

cual se envían las peticiones de acceder a una página web y la respuesta de esa página,

remitiéndose la información que luego se verá en pantalla. Por tanto, este protocolo es el

sistema que permite el intercambio de información en la Web.

Las dos barras inclinadas ( // ) actúan como un separador. Todo lo que hay entre ellas y

la siguiente barra (en este caso, www.pearsoneducacion.com) es el nombre del dominio.

En la sección "Dominio" de este mismo capítulo tiene una explicación algo más

detallada de lo que es un dominio. La cadena www, o lo que vaya a continuación de las

dos barras inclinadas, es el nombre del servidor web. La mayoría utiliza actualmente

www porque es fácil de recordar. La extensión .com es lo que se conoce como dominio

de nivel superior, y determina el tipo de dominio. En un tercio de los URL más

comunes, la palabra entre WWW. y .com es lo que normalmente se conoce como nom-

bre de dominio; los administradores se refieren a él como dominio de segundo nivel. Es

la parte que usted compra, si quiere registrar, por ejemplo, el nombre de su empresa. Si,

por ejemplo, su empresa se llama "Bartulitos S.A.", le interesa comprar el dominio

"bartulitos" de modo que al publicar su sitio web, la dirección del mismo sería

www.bartulitos.com. Al tener registrado este dominio, también dispondría de cuentas de

correo electrónico con el mismo dominio, por ejemplo: [email protected] o

[email protected]. Todo esto contribuye a ofrecer una apariencia corporativa más

firme.

En el URL de ejemplo, la cadena Imusical indica el nivel de directorios dentro del

servidor web, que, después de todo, es un computador como el nuestro. Si al crear el

sitio web, organiza las páginas web que lo constituyen en varias carpetas, esa

organización por carpetas debe mantenerse en el servidor web donde se almacena el

sitio web, o no funcionará. En el capítulo dedicado a la publicación del sitio web lo verá

más claramente y lo entenderá mejor.

Si el URL termina con un nombre de archivo, como sucede en el ejemplo, significa que

novedad.html es el documento que está solicitando o viendo en el navegador. Si el

URL termina en una barra, significa que quiere obtener el archivo predeterminado de

ese directorio. En la mayoría de los casos, http:/www.pearsoneducacion.com/index.html

y http://www.pearsoneducacion.com/son el mismo archivo. En resumen un URL esta

dado por la cadena: servicio://host/archivo.ext

2.4 La World Wide Web

La World Wide Web (que significa Gran red mundial o, también, Red de alcance mun-

dial, y a la que se suele denominar simplemente la Web [red en inglés] o WWW) es el

servicio más popular de Internet, sin lugar a dudas. Por tanto, no debe confundir Internet

con la Web, aunque para muchos es lo mismo. Tim Berners-Lee, investigador del

CERN, fue el creador de la Web, fué creada en 1989 en un instituto de investigación de

Suiza , la web se basa en buscadores y el protocolo de transporte de hipertexto

(hypertext transport protocol (http)). La mayoría de los documentos de la web se crean

utilizando lenguaje HTML (hypertext markup language), comenzó a funcionar en 1992.

En octubre de 1993 ya habían aparecido más de 200 servidores de la Web, y en junio de

1995 su cantidad ascendía a más de 6,5 millones. Esta cifra no para de crecer y en la

actualidad se puede medir en varias decenas de millones.

Page 10: Intoduccion a Las Tecnologias Web

Programación Web

Instituto Tecnológico de la Laguna

10 / 18

Raymundo Jove Pérez

Parte del interés que encierra la Web se debe a que es el único servicio multimedia de

Internet. En sus comienzos, la Web era un sistema exclusivamente textual (no había

gráficos), como sucedía con los programas de correo electrónico. En la actualidad, la

Web es una mezcolanza de textos, gráficos, sonidos, animaciones y realidad virtual. En

resumen, la Web es un sistema de información distribuido, basado en hipertexto, cuya

función es buscar y acceder a documentos a través de Internet.

La clase de información que puede encontrar en los sitios web es ilimitada. En su mayor

parte se trata de banalidades, pero las empresas comerciales se han apuntado a la Web a

miles, convirtiéndola en el cibermercado de finales del siglo XX y comienzos del XXI.

Es en este ámbito de Internet donde publicará su sitio web, donde lo dará a conocer a

millones de potenciales usuarios.

A modo de anécdota, para algunos la WWW es la World Wide Wait (la larga espera).

Web o la web, la red o www de World Wide Web, es básicamente un medio de

comunicación de texto, gráficos y otros objetos multimedia a través de Internet, es decir,

la web es un sistema de hipertexto que utiliza Internet como su mecanismo de transporte

o desde otro punto de vista, una forma gráfica de explorar Internet.

Es importante saber que web o www no son sinónimo de Internet, la web es un

subconjunto de Internet que consiste en páginas a las que se puede acceder usando un

navegador. Internet es la red de redes donde reside toda la información. Tanto el correo

electrónico, como FTPs, juegos, etc. son parte de Internet, pero no de la Web.

Para buscar hipertexto se utilizan programas llamados buscadores web que recuperan

trozos de información (llamados documentos o páginas web) de los servidores web y

muestran en la pantalla del ordenador de la persona que está buscando la información

gráfica, textual o video e incluso audio.

Después se pueden seguir enlaces o hyperlinks en cada página a otros documentos o

incluso devolver información al servidor para interactuar con él. Al acto de seguir un

enlace tras otro a veces se le llama navegar en Internet.

La web se ha convertido en un medio muy popular de publicar información en Internet,

y con el desarrollo del protocolo de transferencia segura (secured server protocol

(https)), la web es ahora un medio de comercio electrónico donde los consumidores

pueden escoger sus productos on-line y realizar sus compras utilizando la información

2.4.1 Arquitectura www.

La idea fundamental es que los navegadores, browsers, presentan documentos escritos

en HTML que han obtenido de un servidor Web. Estos documentos HTML

habitualmente presentan información de forma estática, sin más posibilidad de

interacción con ellos.

El modo de crear los documentos HTML ha variado a lo largo de la corta vida de las

tecnologías Web pasando desde las primeras páginas escritas en HTML almacenadas en

Page 11: Intoduccion a Las Tecnologias Web

Programación Web

Instituto Tecnológico de la Laguna

11 / 18

Raymundo Jove Pérez

un fichero en el servidor Web hasta aquellas que se generan al vuelo como respuesta a

una acción del cliente y cuyo contenido varía según las circunstancias.

Además, el modo de generar páginas dinámicas ha evolucionado, desde la utilización

del CGI ,Common Gateway Interface, hasta los servlets pasando por tecnologías tipo

JavaServer Pages. Todas estas tecnologías se encuadran dentro de aquellas conocidas

como Server Side, ya que se ejecutan en el servidor web.

Otro aspecto que completa (¿complica?) el panorama son las inclusiones del lado del

cliente, Client Side, que se refieren a las posibilidades de que las páginas lleven

incrustado código que se ejecuta en el cliente, como por ejemplo JavaScript y

programas Java.

El esquema general de la situación se puede ver en la Figura, donde se muestran cada

tipo de tecnología involucrada en la generación e interacción de documentos Web.

Figura: Esquema general de las tecnologías Web.

Antes de entrar en detalle, presentaremos las características del World Wide Web y del

protocolo que lo sustenta, el HTTP.

3. Códigos de Respuesta del Servidor

El servidor HTTP responde con un código que informa sobre el estado de la

transacción. Los códigos se agrupan según las siguientes categorías:

Rango Significado

100-199 Informativo

200-299 Éxito en la resolución de la petición

300-399 Petición redirigida, necesarias más acciones

400-499 Petición incompleta

500-599 Errores en el servidor

Page 12: Intoduccion a Las Tecnologias Web

Programación Web

Instituto Tecnológico de la Laguna

12 / 18

Raymundo Jove Pérez

4. Dominio

Explicado en términos muy sencillos, un dominio es como un alias que permitirá a

cualquier usuario de la Web localizar nuestra página o sitio web. También se utiliza con

el correo electrónico. Internamente, los servidores web utilizan una serie de cuatro

números separados por puntos (IP) para comunicarse entre sí. El nombre de dominio es

el "alias" que sustituye a esos números, porque siempre es más fácil recordar un nombre

que una serie de números. Por ejemplo, es mucho más fácil recordar el dominio

bartulitos.com que una serie de números parecida a 60.129.172.56, que es la dirección

IP.

El aspecto más importante de un dominio es su unicidad; es decir, es completamente

imposible que dos personas, empresas u organizaciones tengan el mismo nombre de

dominio simultáneamente. De este modo, el dominio se convierte en una auténtica señal

de identidad en la Web, en una parte imprescindible de la identidad corporativa de

muchas empresas e instituciones. De hecho, muchas de las empresas de nueva creación,

deciden sus nombres en función de si los nombres de dominio correspondientes están o

no disponibles.

Existen dos tipos de dominio:

Dominios genéricos. Son los dominios internacionales o globales y son los dominios

básicos en Internet. La Tabla 1.1 recopila los dominios genéricos.

Tabla 1.1

4.1 Los Dominios Genéricos más comunes

Dominio Descripción

.com Inicialmente estaba reservado a empresas de tipo comercial, pero ese

concepto original ha degenerado y ahora se utiliza para casi cualquier tipo de

sitio web. Es el dominio más difundido.

.org Este dominio estaba reservado inicialmente a organizaciones sin ánimo de

lucro, instituciones y fundaciones. También ha degenerado y actualmente es

una alternativa más al dominio .com.

.net Al principio estaba reservado para empresas relacionadas con Internet.

Actualmente, también se ha convertido en otra alternativa al dominio .com.

.edu Los dominios con esta terminación se utilizan con fines educativos.

.biz Esta terminación estaba reservada inicialmente para los sitios web

destinados a realizar negocios por la Web. Actualmente ha perdido este

objetivo es un dominio de conveniencia.

.into Estos dominios se reservan a sitios web cuyo cometido primordial es la

difusión o publicación de contenidos informativos.

Tabla # 1

Page 13: Intoduccion a Las Tecnologias Web

Programación Web

Instituto Tecnológico de la Laguna

13 / 18

Raymundo Jove Pérez

4.2 Los Dominios Territoriales.

Dominios territoriales. También se conocen como dominios geográficos y son

mantenidos por cada país. Estos dominios los utilizan las organizaciones y empresas

que se establecen en Internet que desean mantener la identidad de su marca unida a un

país en particular. Por ejemplo, muchas de las grandes empresas y organizaciones

españolas utilizan la terminación .es, que es el dominio correspondiente a España. Al

igual que el de España, el resto de los dominios territoriales están compuestos por dos

letras. Por regla general, los dominios territoriales están sujetos a una normativa más

estricta que los genéricos. En la Tabla 1.2 se enumeran los dominios territoriales más

conocidos.

Tabla 1.2

Dominios territoriales más comunes

.au Australia

.ea Canadá

.eh Suiza

.en China

.de Alemania

.dk Dinamarca

.es España

.ti Finlandia

.tr Francia

.ie Irlanda

.in India

.it Italia

.jp Japón

.kr Corea del sur

.mx México

.my Malasia

.nl Holanda

.no Noruega

.nz Nueva Zelanda

.se Suecia

.sg Singapur

.tw Taiwan

.uk Reino Unido

.us Estados Unidos

.za Sudáfrica

Page 14: Intoduccion a Las Tecnologias Web

Programación Web

Instituto Tecnológico de la Laguna

14 / 18

Raymundo Jove Pérez

Cuando el dominio expira, las autoridades competentes, de las que no hablaremos

porque no hace falta, establecen un periodo de gracia durante el cual, la persona, entidad

o empresa que registró el dominio puede renovarlo al mismo precio y en el mismo ISP.

Durante este tiempo, el dominio no se podrá transferir a otro registrador, de modo que la

persona o empresa que efectuó el registro, podrá recuperar su dominio si olvidó

renovarlo por un despiste. Ahora bien, finalizado el periodo de gracia, los dominios no

renovados entran en otro estado conocido como redemption period (periodo de

redención) que sólo está disponible para los dominios .com, .net y .org.

Existe un sitio en Internet, http://www.whois.com/, en el que se mantiene una base de

datos de todos los dominios del mundo. De hecho, puede acceder a esta dirección y, en

la parte superior derecha de la página, puede introducir el nombre de un dominio y

comprobar si existe.

La información del sistema de nombres de dominio está distribuida en diferentes

servidores en el mundo. Existe una estructura jerárquica en la que cada servidor es

responsable de conocer el nombre de dominio que administra y en caso de buscar una

información que desconoce, debe dirigirse a la cabeza de la jerarquía para iniciar la

búsqueda de la respuesta.

Dicha cabeza son los llamados servidores raíz (root-servers) y son 13, la mayoría de

ellos están en E.U. y se identifican por letras (de la A a la M), en México existe una

copia del root-server F, el cual fue colocado por NIC México en coordinación con ISC

(Internet Systems Consortium).

A continuación te presentamos el funcionamiento del Sistema de Nombres de

Dominio:

Page 15: Intoduccion a Las Tecnologias Web

Programación Web

Instituto Tecnológico de la Laguna

15 / 18

Raymundo Jove Pérez

Esta estructura es similar al sistema de archivos de UNIX y Windows, sólo que se

escriben de derecha a izquierda.

En este caso, para encontrar el host www.negocio.com.mx, tendríamos que ir al inicio

de nuestra estructura (nodo raíz)

Del nodo raíz, bajaríamos al primer nivel que está conformado por los diferentes

nombres de dominio territoriales o ccTLDs por sus siglas en inglés (country code Top

Level Domain) así como nombres de dominios genéricos (Generic Top Level Domain).

Posterior a nuestro primer nivel, seguiríamos con las clasificaciones de cada NIC, en

este caso para México serían .com.mx, .net.mx, .org.mx, .edu.mx, .gob.mx

Dentro de la clasificación de com.mx, encontramos nuestro dominio (negocio.com.mx).

Y finalmente, los hosts que están dentro del dominio negocio.com.mx

Un cliente pregunta por un

dominio .MX

(www.negocio.com.mx)

Esta respuesta tiene que ser

contestada por el servidor de

nombres de la red a la que

pertenece el cliente que pregunta.

Un cliente pregunta por un

dominio .MX

(www.negocio.com.mx)

Esta respuesta tiene que ser

contestada por el servidor de

nombres de la red a la que

pertenece el cliente que pregunta

Como primera instancia, el

servidor de la red local, deberá

preguntar a los servidores raíz por

el dominio que está buscando

(negocio.com.mx).

Page 16: Intoduccion a Las Tecnologias Web

Programación Web

Instituto Tecnológico de la Laguna

16 / 18

Raymundo Jove Pérez

Estos servidores conocen la información

de los diferentes NICs (ccTLDs) en el

mundo, así como de los dominios

genéricos (gTLDs), por lo que le indican

al servidor de la red local, dónde puede

encontrar más información de los

dominios bajo .MX y lo dirigen con los

servidores de NIC México.

Estos servidores conocen la información

de los diferentes NICs (ccTLDs) en el

mundo, así como de los dominios

genéricos (gTLDs), por lo que le indican

al servidor de la red local, dónde puede

encontrar más información de los

dominios bajo .MX y lo dirigen con los

servidores de NIC México.

En la información que se recaba, se tiene

que el dominio negocio.com.mx tiene

como servidores registrados

ns1.negocio.com.mx y

ns2.negocio.com.mx

Page 17: Intoduccion a Las Tecnologias Web

Programación Web

Instituto Tecnológico de la Laguna

17 / 18

Raymundo Jove Pérez

Estos servidores conocen la información

referente al dominio negocio.com.mx, por

lo que dan la respuesta a la pregunta de

dónde encontrar www.negocio.com.mx

Cabe mencionar que quien realizó todo el

proceso de la búsqueda fue el servidor de

la red local.

Ya con la respuesta de dónde localizar a

www.negocio.com.mx, el servidor le

proporciona esta respuesta a su cliente

Con la información de dónde localizar a

www.negocio.com.mx, nuestro cliente

(quien solicitó esta información), puede

tener una comunicación directa con el host

para solicitar algún servicio, que en este

caso, es el servicio de web.

Page 18: Intoduccion a Las Tecnologias Web

Programación Web

Instituto Tecnológico de la Laguna

18 / 18

Raymundo Jove Pérez

Con esto, se termina el proceso de

resolución de un nombre de dominio.

5. Definición de SGML

SGML son las siglas de "Standard Generalized Markup Language" o "Lenguaje de

Marcación Generalizado". Consiste en un sistema para la organización y etiquetado de

documentos. La Organización Internacional de Estándares (ISO) ha normalizado este

lenguaje en 1986.

El lenguaje SGML sirve para especificar las reglas de etiquetado de documentos y no

impone en sí ningún conjunto de etiquetas en especial.

El lenguaje HTML esta definido en términos del SGML. XML es un nuevo estándar

con una funcionalidad similar a la del SGML aunque más sencillo, y de creación

posterior.

La industria de la publicación de documentos constituye uno de los principales usuarios

del lenguaje SGML. Empleando este lenguaje, se crean y mantienen documentos que

luego son llevados a otros formatos finales como HTML, Postscript, RTF, etc.