Intoduccion a Las Tecnologias Web
-
Upload
diego-alcantara-egoavil -
Category
Documents
-
view
7 -
download
3
description
Transcript of Intoduccion a Las Tecnologias Web
Programación Web
Instituto Tecnológico de la Laguna
1 / 18
Raymundo Jove Pérez
UNIDAD 1 Introducción a las Tecnologías Web 1 Perspectiva Histórica de Internet
Internet es la red de computadores más grande del mundo. Su misión principal es
ofrecer acceso a inimaginables cantidades de información almacenada en esos
computadores conectados a ella y que están repartidos por todo el planeta. No es un
error pensar en Internet como en dos entes: por un lado, el conjunto de sistemas
informáticos que hacen posible la existencia de esta red mundial, y, por otro, la
información residente en esos sistemas. Cada vez que alguien publica una información
en Internet (un sitio web, por ejemplo) o conecta un nuevo computador, realmente está
contribuyendo al crecimiento de la Red.
Nadie conoce exactamente el tamaño de Internet, ya que es un conjunto de redes de
computadores más pequeñas que funcionan de forma independiente, sin un único lugar
donde se centralicen todas las conexiones. Es como un gran "monstruo sin cabeza, pero
con infinidad de patas".
Internet fue concebida por el ejército de los Estados Unidos como un sistema de
comunicaciones seguro que funcionara en caso de ataque. La Red comenzó a funcionar
a finales de la década de los sesenta como un proyecto de investigación de la Agencia
de proyectos de investigación avanzados (ARPA) y recibió el nombre de ARPAnet.
Más tarde, ARPA pasó a denominarse DARPA (Agencia de proyectos de investigación
avanzados para la defensa). La primera red ARPAnet contaba con cuatro computadores
y fue diseñada para demostrar que era factible la construcción de redes compuestas por
computadores separados geográficamente. Los militares buscaban una forma de
construir redes tolerantes a fallos, de manera que ARPAnet se diseñó para que
permitiera la transmisión de información entre computadores utilizando un sistema
flexible y robusto. En 1972, ARPAnet era pública y, por entonces, 50 universidades
estaban conectadas a esa red, muchas de las cuales trabajaban en proyectos de
tecnología militar.
La mayor preocupación de los militares es la fiabilidad de los computadores. Si una red
militar sólo tiene una conexión y algo destruye esa conexión, la comunicación ya no es
posible y el resultado sería trágico para los soldados que dependieran de la información
de esos computadores. ARPAnet era capaz de soportar la pérdida de conexión, pues fue
ideada como un esquema con diversas rutas entre los computadores conectados, de
forma que un computador podía enviar información a otro a través de cualquier ruta dis-
ponible y no únicamente a través de una preestablecida.
Con el transcurso del tiempo, cada vez eran más las universidades e institutos de
investigación que se conectaban a ARPAnet que, en consecuencia, derivó hacia una red
que sólo manipulaba información relacionada con proyectos de investigación. El gobier-
no norteamericano creó una segunda red con fines únicamente militares, MILnet. En la
década de los ochenta, la Fundación Nacional de Ciencia creó NFSnet, que enlazaba
media docena de supercomputadores a velocidades muy altas. En 1991 se combinaron
las redes MILnet y NFSnet.
Internet es una combinación de ARPAnet, MILnet, NSI (NASA Science Internet) y
NFSnet, siendo todas ellas la espina dorsal que mantiene la unidad de Internet. Internet
Programación Web
Instituto Tecnológico de la Laguna
2 / 18
Raymundo Jove Pérez
ha ido evolucionando con los años, y lo que en principio sólo estaba disponible para el
ejército y las universidades, se fue abriendo a empresas y, posteriormente, a todos los
demás usuarios. Internet ya no sólo es "algo" que sirve de entretenimiento, sino que
cada vez tiene más importancia como "centro de negocios" y ofrece muchos servicios,
algunos más conocidos que otros. Entre los más importantes podemos citar el correo
electrónico (e-mail), los grupos de noticias, Ftp y los chats.
Servicios de Internet
a) El correo electrónico
El correo electrónico es uno de los servicios más antiguos de Internet y data de prin-
cipios de la década de 1970, aunque nadie se pone de acuerdo sobre la fecha del primer
mensaje. En la actualidad, el correo electrónico sigue basándose en el mismo concepto:
el usuario de un computador escribe un mensaje de texto y lo envía al usuario de otro
computador. El mensaje circula por un laberinto de computadores conectados entre sí
hasta llegar a su destino. Para remitir y recibir este tipo de mensajes se utilizan unas
aplicaciones conocidas con el nombre genérico de lectores de correo electrónico.
Outlook Express es uno de los más conocidos
Además de los mensajes de texto convencionales, el correo electrónico actual permite
adjuntar otros tipos de archivos (imágenes, por ejemplo) o cifrar los mensajes para que
sólo pueda leerlos la persona a quien se envían.
b) Grupos de noticias (UseNet)
UseNet es un servicio algo parecido al correo electrónico, pero con la diferencia que en
lugar de enviar los mensajes a una sola persona, se envían a un lugar común, donde
muchos usuarios pueden verlos y responder a ellos. UseNet apareció en 1979, cuando
era un servicio que conectaba entre sí los computadores de la Universidad de Carolina
del Norte. En la actualidad, UseNet es un servicio muy difundido de Internet, con miles
de apartados (temas) a los que los usuarios pueden enviar mensajes y respuestas: los
temas van desde la informática y la técnica, pasando por discusiones sobre asuntos
sociales, religiosos y políticos, hasta la música, la literatura y el cine.
c) FTP
Las siglas FTP (Protocolo de transferencia de archivos, File Transfer Protocol) se
refieren tanto a un servicio de Internet como a una utilidad UNIX (que más tarde fue
también una utilidad de Windows 95). El servicio FTP de Internet está formado por una
serie de servidores que guardan y distribuyen los archivos. Muchos sitios FTP
pertenecen a fabricantes de hardware y software, que los utilizan para distribuir sus
productos y las correspondientes actualizaciones.
También hay sitios FTP que pertenecen a universidades e instituciones científicas; por
medio de ellos, estas instituciones hacen llegar utilidades shareware (software que se
prueba antes de comprar; si el programa le resulta de utilidad, debe abonar lo que su
Programación Web
Instituto Tecnológico de la Laguna
3 / 18
Raymundo Jove Pérez
creador tenga estipulado) a una amplia variedad de usuarios.
d) Chat (charla)
IRC (Conversación transmitida por Internet, Internet Re/ay Chat) es otro servicio
extraordinariamente popular de Internet. Se trata de un sistema que permite a los usua-
rios reunirse en torno a un elemento común, en este caso un servidor IRC, y entablar
una conversación o charla. Pero no se trata de una conversación oral, sino que se escribe
en el computador lo que se desea decir.
No busque en las IRC unas conversaciones de muy alto nivel, pues en ellas no inter-
vienen normalmente especialistas universitarios ni ingenieros espaciales. Una gran can-
tidad de estos grupos de charla (llamados salones o canales) se ocupan de temas
populares o para adultos. Pero cuando aparece alguna noticia que atrae la atención
pública, se pueden encontrar varios grupos de noticias donde la gente se dedica a reírse
del asunto en cuestión.
Otros conceptos A continuación se explican otros conceptos con los que es conveniente estar familia-
rizados.
a) Navegador
Es la aplicación que permite al usuario descargar y visualizar páginas web de cualquier
servidor web del mundo. Como habrá supuesto, este acceso se realiza a través de
Internet. Normalmente, el sistema operativo incorpora una de estas aplicaciones, aunque
de Internet se pueden descargar navegadores de terceros. No pasa nada por tener
instalado más de un navegador.
b) ISP
ISP es el acrónimo de la expresión inglesa Internet Service Provider, Proveedor de
servicios de Internet. Es una empresa dedicada a conectar a Internet la línea telefónica o
el cable correspondiente del usuario. Por tanto, es la empresa dedicada a proveer acceso
o conexión a Internet a empresas y particulares.
c) Página web
Una página web es un documento publicado en la WWW. Normalmente, estas páginas
están escritas en lenguaje HTML. Son estas páginas las que aprenderá a crear. Una
página web es una parte constitutiva de un sitio web y puede estar enlazada a otras
páginas web mediante vínculos. Normalmente, su contenido está basado en texto e
imágenes, aunque cada vez es más común el uso de otros recursos adicionales, como
animaciones, sonidos y vídeos. Por tanto, las páginas web son auténticos documentos
multimedia.
Programación Web
Instituto Tecnológico de la Laguna
4 / 18
Raymundo Jove Pérez
En resumen, una página web es cualquier documento de información accesible a través
de la WWW, con una dirección única en Internet (URL).
d) Sitio web
Un sitio web (o simplemente sitio) es un conjunto de páginas web accesibles a través de
Internet, convenientemente enlazadas y con una finalidad concreta. Un sitio web está
identificado por una dirección (URL) única, que es la dirección de la página principal o
home page. Navegando por la Web es posible encontrarse con distintos tipos de sitios
web.
Los sitios web más sencillos son los compuestos por una sola página, en la que se habla
de algo muy concreto. En el siguiente nivel encontramos los sitios web de la gran
mayoría (empresas y particulares), compuestos por varias páginas. Actualmente, de este
tipo de sitio web destacan con luz propia los dedicados al comercio electrónico y los de
la banca online.
Los sitios de comercio electrónico son auténticos catálogos en los que una empresa o
distribuidora ofrece sus productos. El usuario elige lo que le interesa y lo añade a un
"carrito de la compra virtual". Una vez finalizada la compra, el usuario revisa el carrito
y procede a pagar, normalmente con tarjeta de crédito.
Más que nunca, ahora sí podemos decir eso de "tener el banco en casa". La gran
mayoría de bancos, por no decir todos, disponen de un sitio web en el que se ofrecen
casi todos los servicios bancarios a sus clientes. El cliente no tiene más que identificarse
convenientemente y proceder a realizar sus operaciones (transferencias, compra y venta
de valores, consulta de saldos, etc.). Todas estas operaciones han de ser validadas
mediante una firma electrónica, también única de cada cliente. Por seguridad, es
conveniente modificar la clave de acceso y la firma digital cada cierto tiempo.
En los primeros años de Internet los sitios web más utilizados eran los buscadores, o
motores de búsqueda, que, con el tiempo, se han convertido en portales. En un principio
eran herramientas web que permitían buscar documentos que contenían una
determinada palabra o frase. El resultado era un listado de direcciones web corres-
pondientes a los sitios web donde aparecían esa palabra o frase. El usuario no tenía más
que hacer click en los enlaces propuestos en el listado para acceder a los sitios web en
cuestión.
Muchos sitios web que fueron creados como buscadores han evolucionado hasta con-
vertirse en Portales, puntos de entrada a la Web que ofrecen acceso rápido y sencillo a
infinidad de servicios. Existen portales de ámbito general (por ejemplo Yahoo!, MSN,
Lycos o Altavista) y también dedicados a un tema específico (medicina, astrología,
modelismo, deportes, etc.). Todos ellos tienen algo en común: una herramienta de
búsqueda que permite buscar por toda la Web (los de ámbito general) o por los sitios
web relacionados con el tema del portal.
Los portales de consumidor o ámbito general ofrecen buscadores, servicios de correo
electrónico, salas para "chatear", titulares de prensa y otros muchos servicios. El usuario
Programación Web
Instituto Tecnológico de la Laguna
5 / 18
Raymundo Jove Pérez
puede personalizar muchos de estos portales para que, al conectarse a ellos, se muestre
la información que más le interesa.
Podríamos hablar mucho más sobre los portales y sus tipos, pero con esto es suficiente
para los que nos ocupan.
Optimización de un sitio web
Hay varios elementos de un sitio web que pueden ser optimizados. Al optimizar, un
buen diseñador web intentará encontrar el equilibrio apropiado entre estos
componentes, desde el punto de vista del diseño y del objetivo del sitio.
Entre los elementos que se deben considerar para la optimización están la accesibilidad,
usabilidad, visibilidad por el motor de búsqueda y la velocidad total de descarga de la
página.
A algunas personas puede resultarles extraño el poner accesibilidad y usabilidad como
algo que deba ser optimizado; sin embargo, Internet es un asunto global. La web estalló
en Norteamérica, y muchos otros países se quedaron atrás y todavía están intentando
alanzar el mismo nivel.
Las ideas de usabilidad y accesibilidad llegarán a ser importantes a una escala global en
algún momento, pero de momento hay muchos países donde aún se están aprendiendo
cosas sobre diseño web que durante años se han utilizado en Norteamérica. Así pues,
aunque los sitios más recientes pueden contener un diseño bien pensado respecto a su
accesibilidad y usabilidad (asumiendo que el diseñador pueda mostrar al cliente que
estas cualidades tienen ventajas), otros muchos sitios existentes necesitarán ser
adaptados u 'optimizados' si no rediseñados completamente.
2. Protocolos de Internet
En el ámbito de una red de computadores, un protocolo es un conjunto de reglas
formales que permiten la comunicación entre dos nodos de la red de forma no ambigua.
Esto mismo se puede extrapolar a Internet, teniendo en cuenta que no es más que una
"red de redes".
2.1 Protocolos TCP/IP
TCP!IP (Protocolo de control de transporte/protocolo Internet, Transmission Control
Protocolllnternet Protocol) es el conjunto de protocolos que se encuentran en el núcleo
de Internet. TCP/IP nació como un experimento de sistema para conectar distintos tipos
de redes y sistemas informáticos. Las especificaciones TCP/IP fueron publicadas con
estándares abiertos que no eran propiedad de ninguna compañía, lo que favoreció que
TCP/IP se convirtiera en el "lenguaje" de Internet, permitiendo la comunicación entre
redes y equipos de casi cualquier tipo. Estos protocolos suelen ser invisibles a los usua-
rios y definen básicamente dos cosas: el modo en que se transfiere la información entre
Programación Web
Instituto Tecnológico de la Laguna
6 / 18
Raymundo Jove Pérez
dos computadores (es la tarea del protocolo TCP) y la identificación de los dispositivos
de una red mediante una dirección única (tarea del protocolo IP).
El protocolo TCP es el encargado del transporte. Al enviar un mensaje por Internet,
dicho mensaje se divide en paquetes. Cada paquete dispone de la información necesaria
para viajar desde su punto de origen hasta su destino por rutas diferentes.
Independientemente de la ruta seguida, y sin entrar en detalles sobre los dispositivos
implicados, los paquetes llegan a su destino donde son reensamblados para componer el
mensaje original. Este modelo de envío de mensajes por paquetes es muy flexible y
robusto, pues aunque haya "rutas" de la red fuera de servicio, los paquetes siempre
podrán ser "enrutados" por otras rutas y, antes o después, llegar a su destino.
El segundo protocolo de este conjunto, IP, define el denominado sistema de direccio-
namiento de Internet, según el cual todo "nodo" de la Red tiene asignada una dirección
IP única, compuesta por cuatro números separados por puntos, como, por ejemplo:
123.23.168.12. Todos los paquetes del mismo mensaje incluyen las mismas direcciones
IP de los computadores emisor y receptor.
2.2 Protocolo http.
Definición de http
HTTP de HyperText Transfer Protocol (Protocolo de transferencia de hipertexto) es
el método más común de intercambio de información en la world wide web, el método
mediante el cual se transfieren las páginas web a un ordenador.
Aunque entender el modo en que funciona HTTP no es estrictamente necesario para
desarrollar aplicaciones Web, algunas nociones sobre lo que esconden esas siglas puede
ayudar a desarrollarlas con más facilidad y confianza.
HTTP es un protocolo del nivel de aplicación para sistemas de información multimedia
distribuidos. Es un protocolo no orientado a estado que puede ser utilizado para más
propósitos que para manejar ficheros HTML.
Entre las propiedades de HTTP se pueden destacar las siguientes:
Un esquema de direccionamiento comprensible.
Utiliza el Universal Resource Identifier (URI) para localizar sitios (URL) o
nombres (URN) sobre los que hay que aplicar un método. La forma general de
un URL es servicio://host/fichero.ext .
Arquitectura Cliente-Servidor.
HTTP se asienta en el paradigma solicitud/respuesta. La comunicación se
asienta sobre TCP/IP. El puerto por defecto es el 80, pero se pueden utilizar
otros.
Es un protocolo sin conexión y sin estado.
Después de que el servidor ha respondido la petición del cliente, se rompe la
conexión entre ambos. Además no se guarda memoria del contexto de la
conexión para siguientes conexiones.
Programación Web
Instituto Tecnológico de la Laguna
7 / 18
Raymundo Jove Pérez
Está abierto a nuevos tipos de datos.
HTTP utiliza tipos MIME (Multipart Internet Mail Extension) para la
determinación del tipo de los datos que transporta. Cuando un servidor HTTP
transmite información de vuelta a un cliente, incluye una cabecera que le indica
al cliente sobre los tipos de datos que componen el documento. De la gestión de
esos datos se encargan las utilidades que tenga el cliente (visor de imágenes, de
vídeo, etc.)
Una transacción HTTP está compuesta por una cabecera, y opcionalmente, por una línea
en blanco seguida de los datos. En la cabecera se especifica tanto la acción solicitada en
el servidor, como los tipos de datos devueltos o un código de estado.
2.2.1 Métodos de Petición http.
La primera línea de una petición contiene los comandos HTTP, conocidos como
métodos. Existen varios, pero los más conocidos y utilizados son tres: GET, HEAD y
POST.
El método GET se utiliza para recuperar información identificada por un URI por parte
de los navegadores. Si el URI se refiere a un proceso generador de datos como un
programa CGI, en lugar de él, se devuelven los datos generados por el programa. El
método GET también se puede utilizar para pasar una pequeña cantidad de información
al servidor en forma de pares atributo-valor añadidos al final del URI detrás de un
símbolo de interrogación, ?.
GET /cgi/saludar.pl?nombre=pepe&[email protected] HTTP/1.0
La longitud de la petición GET está limitada por el espacio libre en los buffers de
entrada. Por lo que para mandar una gran cantidad de información al servidor ha de
utilizarse el método POST.
El método HEAD es idéntico al GET excepto que el servidor no devolverá el cuerpo del
mensaje en la respuesta a un método HEAD. Esto es útil para obtener información sobre
las entidades implicadas en la petición sin que tengan que transferirse. Sirve para
comprobar si los enlaces son válidos o para saber cuando fue la última modificación de
la entidad solicitada.
El método POST se refiere normalmente a la invocación de procesos que generan datos
que serán devueltos como respuesta a la petición. Además se utiliza para aportar datos
de entrada a esos programas. En este caso los pares atributo-valor son incluidos en el
cuerpo de la petición separados por ampersand.
POST /cgi/saludar.pl HTTP/1.0
Accept: */*
nombre=pepe&[email protected]
De este modo el método POST no sufre de las limitaciones de espacio y puede enviar
mucha más información al servidor.
Programación Web
Instituto Tecnológico de la Laguna
8 / 18
Raymundo Jove Pérez
2.2.2 Los Cookies
Los cookies representan mecanismos que permiten al servidor almacenar en el cliente
información relativa a la transacción. Así, cuando el servidor responde a una petición
del cliente, inserta una información que se conservará en el cliente. Esta información es
una descripción relativa a un conjunto de direcciones URL. En adelante, será insertada
por el cliente en una petición que referencie estas direcciones URL y se denomina un
cookie.
Este mecanismo, muy simple, proporciona una herramienta potente para numerosas
aplicaciones gestionadas por el Web.
Un cliente no puede memorizar más de 300 cookies. El tamaño máximo de cada cookie
es de 4000 bytes. Además, el cliente no puede memorizar más de 20 cookies por
servidor.
Las cookies se utilizan para memorizar las propiedades relativas a un recurso específico.
Estas propiedades se pueden definir de dos maneras:
1. Mediante una llamada la Servidor HTTP.
En este caso, un cookie es iniciado por el servidor insertando la directiva Set-Cookie
en la cabecera de la respuesta HTTP. Esto se generaliza mediante un script CGI con la
siguiente sintaxis:
Set-Cookie: Nombre=Valor; expires=Fecha; path=Camino;
domain=Nombre_ámbito; secure
2. Utilizando JavaScript.
También puede definirse mediante la propiedad cookie del objeto document. Esto
permite la definición local de propiedades de un cookie sin intervención del servidor
WWW. Así, la gestión y la memorización de los cookies las lleva a cabo el cliente.
2.3 URL
En algunos párrafos anteriores hemos hablado de los URL (Localizador uniforme de
recursos). Un URL es la dirección de Internet que se emplea para acceder a una página
web, un servidor web o cualquier otro dispositivo existente en la Red. Al URL también
se le conoce como dirección de Internet o dirección web. Para abreviar, y cuando la
conversación es sobre Internet, es normal utilizar simplemente la palabra "dirección".
Un URL típico puede tener el siguiente aspecto:
http://www.pearsoneducacion.com/musica/novedad.html
Los hay mucho más complejos, pero vamos a centramos en éste porque se parece a la
mayoría. En primer lugar nos encontramos con http:, que es el nombre del protocolo
(Hypertext Transfer Protocol, Protocolo de transferencia de hipertexto). HTIP es el pro-
tocolo de la Web que se utiliza en cada transacción y representa el sistema mediante el
Programación Web
Instituto Tecnológico de la Laguna
9 / 18
Raymundo Jove Pérez
cual se envían las peticiones de acceder a una página web y la respuesta de esa página,
remitiéndose la información que luego se verá en pantalla. Por tanto, este protocolo es el
sistema que permite el intercambio de información en la Web.
Las dos barras inclinadas ( // ) actúan como un separador. Todo lo que hay entre ellas y
la siguiente barra (en este caso, www.pearsoneducacion.com) es el nombre del dominio.
En la sección "Dominio" de este mismo capítulo tiene una explicación algo más
detallada de lo que es un dominio. La cadena www, o lo que vaya a continuación de las
dos barras inclinadas, es el nombre del servidor web. La mayoría utiliza actualmente
www porque es fácil de recordar. La extensión .com es lo que se conoce como dominio
de nivel superior, y determina el tipo de dominio. En un tercio de los URL más
comunes, la palabra entre WWW. y .com es lo que normalmente se conoce como nom-
bre de dominio; los administradores se refieren a él como dominio de segundo nivel. Es
la parte que usted compra, si quiere registrar, por ejemplo, el nombre de su empresa. Si,
por ejemplo, su empresa se llama "Bartulitos S.A.", le interesa comprar el dominio
"bartulitos" de modo que al publicar su sitio web, la dirección del mismo sería
www.bartulitos.com. Al tener registrado este dominio, también dispondría de cuentas de
correo electrónico con el mismo dominio, por ejemplo: [email protected] o
[email protected]. Todo esto contribuye a ofrecer una apariencia corporativa más
firme.
En el URL de ejemplo, la cadena Imusical indica el nivel de directorios dentro del
servidor web, que, después de todo, es un computador como el nuestro. Si al crear el
sitio web, organiza las páginas web que lo constituyen en varias carpetas, esa
organización por carpetas debe mantenerse en el servidor web donde se almacena el
sitio web, o no funcionará. En el capítulo dedicado a la publicación del sitio web lo verá
más claramente y lo entenderá mejor.
Si el URL termina con un nombre de archivo, como sucede en el ejemplo, significa que
novedad.html es el documento que está solicitando o viendo en el navegador. Si el
URL termina en una barra, significa que quiere obtener el archivo predeterminado de
ese directorio. En la mayoría de los casos, http:/www.pearsoneducacion.com/index.html
y http://www.pearsoneducacion.com/son el mismo archivo. En resumen un URL esta
dado por la cadena: servicio://host/archivo.ext
2.4 La World Wide Web
La World Wide Web (que significa Gran red mundial o, también, Red de alcance mun-
dial, y a la que se suele denominar simplemente la Web [red en inglés] o WWW) es el
servicio más popular de Internet, sin lugar a dudas. Por tanto, no debe confundir Internet
con la Web, aunque para muchos es lo mismo. Tim Berners-Lee, investigador del
CERN, fue el creador de la Web, fué creada en 1989 en un instituto de investigación de
Suiza , la web se basa en buscadores y el protocolo de transporte de hipertexto
(hypertext transport protocol (http)). La mayoría de los documentos de la web se crean
utilizando lenguaje HTML (hypertext markup language), comenzó a funcionar en 1992.
En octubre de 1993 ya habían aparecido más de 200 servidores de la Web, y en junio de
1995 su cantidad ascendía a más de 6,5 millones. Esta cifra no para de crecer y en la
actualidad se puede medir en varias decenas de millones.
Programación Web
Instituto Tecnológico de la Laguna
10 / 18
Raymundo Jove Pérez
Parte del interés que encierra la Web se debe a que es el único servicio multimedia de
Internet. En sus comienzos, la Web era un sistema exclusivamente textual (no había
gráficos), como sucedía con los programas de correo electrónico. En la actualidad, la
Web es una mezcolanza de textos, gráficos, sonidos, animaciones y realidad virtual. En
resumen, la Web es un sistema de información distribuido, basado en hipertexto, cuya
función es buscar y acceder a documentos a través de Internet.
La clase de información que puede encontrar en los sitios web es ilimitada. En su mayor
parte se trata de banalidades, pero las empresas comerciales se han apuntado a la Web a
miles, convirtiéndola en el cibermercado de finales del siglo XX y comienzos del XXI.
Es en este ámbito de Internet donde publicará su sitio web, donde lo dará a conocer a
millones de potenciales usuarios.
A modo de anécdota, para algunos la WWW es la World Wide Wait (la larga espera).
Web o la web, la red o www de World Wide Web, es básicamente un medio de
comunicación de texto, gráficos y otros objetos multimedia a través de Internet, es decir,
la web es un sistema de hipertexto que utiliza Internet como su mecanismo de transporte
o desde otro punto de vista, una forma gráfica de explorar Internet.
Es importante saber que web o www no son sinónimo de Internet, la web es un
subconjunto de Internet que consiste en páginas a las que se puede acceder usando un
navegador. Internet es la red de redes donde reside toda la información. Tanto el correo
electrónico, como FTPs, juegos, etc. son parte de Internet, pero no de la Web.
Para buscar hipertexto se utilizan programas llamados buscadores web que recuperan
trozos de información (llamados documentos o páginas web) de los servidores web y
muestran en la pantalla del ordenador de la persona que está buscando la información
gráfica, textual o video e incluso audio.
Después se pueden seguir enlaces o hyperlinks en cada página a otros documentos o
incluso devolver información al servidor para interactuar con él. Al acto de seguir un
enlace tras otro a veces se le llama navegar en Internet.
La web se ha convertido en un medio muy popular de publicar información en Internet,
y con el desarrollo del protocolo de transferencia segura (secured server protocol
(https)), la web es ahora un medio de comercio electrónico donde los consumidores
pueden escoger sus productos on-line y realizar sus compras utilizando la información
2.4.1 Arquitectura www.
La idea fundamental es que los navegadores, browsers, presentan documentos escritos
en HTML que han obtenido de un servidor Web. Estos documentos HTML
habitualmente presentan información de forma estática, sin más posibilidad de
interacción con ellos.
El modo de crear los documentos HTML ha variado a lo largo de la corta vida de las
tecnologías Web pasando desde las primeras páginas escritas en HTML almacenadas en
Programación Web
Instituto Tecnológico de la Laguna
11 / 18
Raymundo Jove Pérez
un fichero en el servidor Web hasta aquellas que se generan al vuelo como respuesta a
una acción del cliente y cuyo contenido varía según las circunstancias.
Además, el modo de generar páginas dinámicas ha evolucionado, desde la utilización
del CGI ,Common Gateway Interface, hasta los servlets pasando por tecnologías tipo
JavaServer Pages. Todas estas tecnologías se encuadran dentro de aquellas conocidas
como Server Side, ya que se ejecutan en el servidor web.
Otro aspecto que completa (¿complica?) el panorama son las inclusiones del lado del
cliente, Client Side, que se refieren a las posibilidades de que las páginas lleven
incrustado código que se ejecuta en el cliente, como por ejemplo JavaScript y
programas Java.
El esquema general de la situación se puede ver en la Figura, donde se muestran cada
tipo de tecnología involucrada en la generación e interacción de documentos Web.
Figura: Esquema general de las tecnologías Web.
Antes de entrar en detalle, presentaremos las características del World Wide Web y del
protocolo que lo sustenta, el HTTP.
3. Códigos de Respuesta del Servidor
El servidor HTTP responde con un código que informa sobre el estado de la
transacción. Los códigos se agrupan según las siguientes categorías:
Rango Significado
100-199 Informativo
200-299 Éxito en la resolución de la petición
300-399 Petición redirigida, necesarias más acciones
400-499 Petición incompleta
500-599 Errores en el servidor
Programación Web
Instituto Tecnológico de la Laguna
12 / 18
Raymundo Jove Pérez
4. Dominio
Explicado en términos muy sencillos, un dominio es como un alias que permitirá a
cualquier usuario de la Web localizar nuestra página o sitio web. También se utiliza con
el correo electrónico. Internamente, los servidores web utilizan una serie de cuatro
números separados por puntos (IP) para comunicarse entre sí. El nombre de dominio es
el "alias" que sustituye a esos números, porque siempre es más fácil recordar un nombre
que una serie de números. Por ejemplo, es mucho más fácil recordar el dominio
bartulitos.com que una serie de números parecida a 60.129.172.56, que es la dirección
IP.
El aspecto más importante de un dominio es su unicidad; es decir, es completamente
imposible que dos personas, empresas u organizaciones tengan el mismo nombre de
dominio simultáneamente. De este modo, el dominio se convierte en una auténtica señal
de identidad en la Web, en una parte imprescindible de la identidad corporativa de
muchas empresas e instituciones. De hecho, muchas de las empresas de nueva creación,
deciden sus nombres en función de si los nombres de dominio correspondientes están o
no disponibles.
Existen dos tipos de dominio:
Dominios genéricos. Son los dominios internacionales o globales y son los dominios
básicos en Internet. La Tabla 1.1 recopila los dominios genéricos.
Tabla 1.1
4.1 Los Dominios Genéricos más comunes
Dominio Descripción
.com Inicialmente estaba reservado a empresas de tipo comercial, pero ese
concepto original ha degenerado y ahora se utiliza para casi cualquier tipo de
sitio web. Es el dominio más difundido.
.org Este dominio estaba reservado inicialmente a organizaciones sin ánimo de
lucro, instituciones y fundaciones. También ha degenerado y actualmente es
una alternativa más al dominio .com.
.net Al principio estaba reservado para empresas relacionadas con Internet.
Actualmente, también se ha convertido en otra alternativa al dominio .com.
.edu Los dominios con esta terminación se utilizan con fines educativos.
.biz Esta terminación estaba reservada inicialmente para los sitios web
destinados a realizar negocios por la Web. Actualmente ha perdido este
objetivo es un dominio de conveniencia.
.into Estos dominios se reservan a sitios web cuyo cometido primordial es la
difusión o publicación de contenidos informativos.
Tabla # 1
Programación Web
Instituto Tecnológico de la Laguna
13 / 18
Raymundo Jove Pérez
4.2 Los Dominios Territoriales.
Dominios territoriales. También se conocen como dominios geográficos y son
mantenidos por cada país. Estos dominios los utilizan las organizaciones y empresas
que se establecen en Internet que desean mantener la identidad de su marca unida a un
país en particular. Por ejemplo, muchas de las grandes empresas y organizaciones
españolas utilizan la terminación .es, que es el dominio correspondiente a España. Al
igual que el de España, el resto de los dominios territoriales están compuestos por dos
letras. Por regla general, los dominios territoriales están sujetos a una normativa más
estricta que los genéricos. En la Tabla 1.2 se enumeran los dominios territoriales más
conocidos.
Tabla 1.2
Dominios territoriales más comunes
.au Australia
.ea Canadá
.eh Suiza
.en China
.de Alemania
.dk Dinamarca
.es España
.ti Finlandia
.tr Francia
.ie Irlanda
.in India
.it Italia
.jp Japón
.kr Corea del sur
.mx México
.my Malasia
.nl Holanda
.no Noruega
.nz Nueva Zelanda
.se Suecia
.sg Singapur
.tw Taiwan
.uk Reino Unido
.us Estados Unidos
.za Sudáfrica
Programación Web
Instituto Tecnológico de la Laguna
14 / 18
Raymundo Jove Pérez
Cuando el dominio expira, las autoridades competentes, de las que no hablaremos
porque no hace falta, establecen un periodo de gracia durante el cual, la persona, entidad
o empresa que registró el dominio puede renovarlo al mismo precio y en el mismo ISP.
Durante este tiempo, el dominio no se podrá transferir a otro registrador, de modo que la
persona o empresa que efectuó el registro, podrá recuperar su dominio si olvidó
renovarlo por un despiste. Ahora bien, finalizado el periodo de gracia, los dominios no
renovados entran en otro estado conocido como redemption period (periodo de
redención) que sólo está disponible para los dominios .com, .net y .org.
Existe un sitio en Internet, http://www.whois.com/, en el que se mantiene una base de
datos de todos los dominios del mundo. De hecho, puede acceder a esta dirección y, en
la parte superior derecha de la página, puede introducir el nombre de un dominio y
comprobar si existe.
La información del sistema de nombres de dominio está distribuida en diferentes
servidores en el mundo. Existe una estructura jerárquica en la que cada servidor es
responsable de conocer el nombre de dominio que administra y en caso de buscar una
información que desconoce, debe dirigirse a la cabeza de la jerarquía para iniciar la
búsqueda de la respuesta.
Dicha cabeza son los llamados servidores raíz (root-servers) y son 13, la mayoría de
ellos están en E.U. y se identifican por letras (de la A a la M), en México existe una
copia del root-server F, el cual fue colocado por NIC México en coordinación con ISC
(Internet Systems Consortium).
A continuación te presentamos el funcionamiento del Sistema de Nombres de
Dominio:
Programación Web
Instituto Tecnológico de la Laguna
15 / 18
Raymundo Jove Pérez
Esta estructura es similar al sistema de archivos de UNIX y Windows, sólo que se
escriben de derecha a izquierda.
En este caso, para encontrar el host www.negocio.com.mx, tendríamos que ir al inicio
de nuestra estructura (nodo raíz)
Del nodo raíz, bajaríamos al primer nivel que está conformado por los diferentes
nombres de dominio territoriales o ccTLDs por sus siglas en inglés (country code Top
Level Domain) así como nombres de dominios genéricos (Generic Top Level Domain).
Posterior a nuestro primer nivel, seguiríamos con las clasificaciones de cada NIC, en
este caso para México serían .com.mx, .net.mx, .org.mx, .edu.mx, .gob.mx
Dentro de la clasificación de com.mx, encontramos nuestro dominio (negocio.com.mx).
Y finalmente, los hosts que están dentro del dominio negocio.com.mx
Un cliente pregunta por un
dominio .MX
(www.negocio.com.mx)
Esta respuesta tiene que ser
contestada por el servidor de
nombres de la red a la que
pertenece el cliente que pregunta.
Un cliente pregunta por un
dominio .MX
(www.negocio.com.mx)
Esta respuesta tiene que ser
contestada por el servidor de
nombres de la red a la que
pertenece el cliente que pregunta
Como primera instancia, el
servidor de la red local, deberá
preguntar a los servidores raíz por
el dominio que está buscando
(negocio.com.mx).
Programación Web
Instituto Tecnológico de la Laguna
16 / 18
Raymundo Jove Pérez
Estos servidores conocen la información
de los diferentes NICs (ccTLDs) en el
mundo, así como de los dominios
genéricos (gTLDs), por lo que le indican
al servidor de la red local, dónde puede
encontrar más información de los
dominios bajo .MX y lo dirigen con los
servidores de NIC México.
Estos servidores conocen la información
de los diferentes NICs (ccTLDs) en el
mundo, así como de los dominios
genéricos (gTLDs), por lo que le indican
al servidor de la red local, dónde puede
encontrar más información de los
dominios bajo .MX y lo dirigen con los
servidores de NIC México.
En la información que se recaba, se tiene
que el dominio negocio.com.mx tiene
como servidores registrados
ns1.negocio.com.mx y
ns2.negocio.com.mx
Programación Web
Instituto Tecnológico de la Laguna
17 / 18
Raymundo Jove Pérez
Estos servidores conocen la información
referente al dominio negocio.com.mx, por
lo que dan la respuesta a la pregunta de
dónde encontrar www.negocio.com.mx
Cabe mencionar que quien realizó todo el
proceso de la búsqueda fue el servidor de
la red local.
Ya con la respuesta de dónde localizar a
www.negocio.com.mx, el servidor le
proporciona esta respuesta a su cliente
Con la información de dónde localizar a
www.negocio.com.mx, nuestro cliente
(quien solicitó esta información), puede
tener una comunicación directa con el host
para solicitar algún servicio, que en este
caso, es el servicio de web.
Programación Web
Instituto Tecnológico de la Laguna
18 / 18
Raymundo Jove Pérez
Con esto, se termina el proceso de
resolución de un nombre de dominio.
5. Definición de SGML
SGML son las siglas de "Standard Generalized Markup Language" o "Lenguaje de
Marcación Generalizado". Consiste en un sistema para la organización y etiquetado de
documentos. La Organización Internacional de Estándares (ISO) ha normalizado este
lenguaje en 1986.
El lenguaje SGML sirve para especificar las reglas de etiquetado de documentos y no
impone en sí ningún conjunto de etiquetas en especial.
El lenguaje HTML esta definido en términos del SGML. XML es un nuevo estándar
con una funcionalidad similar a la del SGML aunque más sencillo, y de creación
posterior.
La industria de la publicación de documentos constituye uno de los principales usuarios
del lenguaje SGML. Empleando este lenguaje, se crean y mantienen documentos que
luego son llevados a otros formatos finales como HTML, Postscript, RTF, etc.