Proyecto de Tesis - Web Mining - Garcia Seminario Julio Cesar

24
FACULTAD DE INGENIERIA ESCUELA DE INFORMATICA Y SISTEMAS IMPLEMENTACIÓN DE UNA WEB MINING SOBRE RECONOCIMIENTO DE PATRONES DE COMPORTAMIENTO DE USUARIOS PARA LA CAJA MUNICIPAL DEL SANTA CURSO : PROYECTO DE TESIS DOCENTE : MG. LIZBETH BRIONES PEREYRA CICLO : X INTEGRANTES : JULIO GARCÍA SEMINARIO Página 1

description

FACULTAD DE INGENIERIA ESCUELA DE INFORMATICA Y SISTEMASIMPLEMENTACIÓN DE UNA WEB MINING SOBRE RECONOCIMIENTO DE PATRONES DE COMPORTAMIENTO DE USUARIOS PARA LA CAJA MUNICIPAL DEL SANTACURSO:PROYECTO DE TESISDOCENTE:MG. LIZBETH BRIONES PEREYRACICLO:XINTEGRANTES: y y JULIO GARCÍA SEMINARIO DAVID CASANOVA GAMBOA2010Página 1ETAPA I: DATOS GENERALES DE LA ORGANIZACIÓNCaja Municipal De Ahorro Y Crédito Del SantaRESEÑA HISTORICA La Caja Del Santa inició sus actividades

Transcript of Proyecto de Tesis - Web Mining - Garcia Seminario Julio Cesar

Page 1: Proyecto de Tesis - Web Mining - Garcia Seminario Julio Cesar

FACULTAD DE INGENIERIAESCUELA DE INFORMATICA Y SISTEMAS

IMPLEMENTACIÓN DE UNA WEB MINING SOBRE RECONOCIMIENTO DE PATRONES DE COMPORTAMIENTO DE USUARIOS PARA LA CAJA

MUNICIPAL DEL SANTA

CURSO : PROYECTO DE TESIS

DOCENTE : MG. LIZBETH BRIONES PEREYRA

CICLO : X

INTEGRANTES :

JULIO GARCÍA SEMINARIO DAVID CASANOVA GAMBOA

2010

Página 1

Page 2: Proyecto de Tesis - Web Mining - Garcia Seminario Julio Cesar

ETAPA I: DATOS GENERALES DE LA ORGANIZACIÓN

Caja Municipal De Ahorro Y Crédito Del Santa

RESEÑA HISTORICALa Caja Del Santa inició sus actividades un 3 de marzo de 1986 en la ciudad de Chimbote -capital de la Provincia del Santa, en el Departamento de Ancash- con el propósito de ser una alternativa real para aquellos sectores de la comunidad local y regional, que tradicionalmente no han sido atendidos por la banca, en especial a la micro y pequeña empresa.

Su funcionamiento fue autorizado con operaciones de Crédito Prendario y Ahorros, productos con los que se mantuvo hasta diciembre de 1993. Año donde se decide dar inicio a operaciones con Crédito a la micro y pequeña empresa, y Crédito Personal.Posteriormente, en el año 1998, se produce la conversión de la Caja del Santa en Sociedad Anónima acontecimiento que le abre la oportunidad necesaria para desarrollarse, siendo autorizada por la Superintendencia de Banca y Seguros (SBS) para realizar operaciones activas y pasivas en moneda extranjera.

A partir del año 1999, la Caja del Santa comienza su Plan de Expansión instalando su primera Agencia fuera de Chimbote,  en la ciudad de Huaraz, lo que le posibilitó ampliar y diversificar su mercado. Al año siguiente apertura su segunda agencia en Chimbote, ubicada en la Av. Bolognesi en el centro comercial y financiero de la ciudad. En el año 2002- apertura Oficinas Especializadas en las ciudades de Casma, Huarmey y Caraz. Al año siguiente, apertura su Agencia en el distrito de Nuevo Chimbote.

En el 2006, esta importante financiera inicia sus actividades en el departamento de Lima con la apertura de dos agencias: Barranca y Huacho. En el 2008, la Caja del Santa instala su Agencia en la ciudad de Huánuco y Oficina Especial en Tingo María, y en el 2009 inaugura su Agencia en la ciudad de Huancayo en el departamento de Junín.

En el presente año, la Caja del Santa continúa su crecimiento habiendo inaugurado -el 26 de febrero- su nuevo y moderno Centro de Promoción en Pucallpa; así como -el 26 de marzo- su agencia en la ciudad de Trujillo.

Esta suma de acontecimientos, permite vislumbrar un futuro con optimismo para constituirse en el mediano plazo en una de las principales instituciones financieras de la región y del sistema de cajas.

Página 2

Page 3: Proyecto de Tesis - Web Mining - Garcia Seminario Julio Cesar

VISIONPosicionarnos como la mejor opción en Micro finanzas en los lugares donde nos ubiquemos, proporcionando servicios de máximo valor.

MISIONOfrecer a nuestros clientes servicios financieros de alto valor agregado, priorizando nuestra atención en las micro y pequeñas empresas y en aquellos que tienen acceso limitado al Sistema Bancario, empleando tecnología moderna y basados en los valores y compromiso profesional de nuestros colaboradores.

Organigrama de la CMACS ( Anexo Organigrama)

Página 3

Page 4: Proyecto de Tesis - Web Mining - Garcia Seminario Julio Cesar

PICTOGRAMA

Página 4

Page 5: Proyecto de Tesis - Web Mining - Garcia Seminario Julio Cesar

DESCRIPCION DEL PROBLEMA

La necesidad de saber cómo se comportan los usuarios de paginas es debido a que no siempre las páginas Web son desarrolladas y diseñadas de una manera adecuada para que pueda ser fácilmente utilizada por los usuarios, los programadores y diseñadores de pagina Web se enfocan mas en cómo es la lógica de negocio y como plasmarla en una página Web, pero no se toma en consideración como hacer más fácil su utilización para los usuarios en tal sentido muchas veces se le hace tedioso navegar por las paginas lo cual no es bueno para el dueño de la pagina.

no se conoce las necesidades y el comportamiento de los usuarios cuando navegan en las páginas web

El incremento del uso de paginas web, lo que hace necesario hacer un estudio sobre el comportamiento de los usuarios.

Los usuarios no están dispuestos a aprender el funcionamiento de un sitio web concreto.

los usuarios quieren comprender el funcionamiento del sitio desde el primer momento, comenzar a operar y obtener resultados de manera inmediata.

La no disposición de los usuarios a navegar por paginas que no sean fáciles de usar.

OBJETIVO GENERALDeterminar el patrón de comportamiento de los usuarios de páginas Web.

OBJETIVOS ESPECIFICOS

Entender la metodología para determina un patrón de comportamiento de un usuario de pagina Web.

Obtener la información para la personalización de los sitios

Describir conceptos relacionados con las técnicas de reconocimiento de patrones de comportamiento.

Desarrollar un modelo solución en la cual se describan los procedimientos para determinar un patrón de comportamiento.

Desarrollar un prototipo en base al modelo solución y que tenga como finalidad determine un parámetro que me identifique un patrón de comportamiento.

Entender el comportamiento de navegación del usuario, permitiendo adaptar los sitios Web a sus necesidades

Realizar mejoras en el sistema

Modificar el sitio acorde a los patrones descubiertos

Página 5

Page 6: Proyecto de Tesis - Web Mining - Garcia Seminario Julio Cesar

JUSTIFICACION DEL PROYECTO

La necesidad de identificar patrones de comportamientos de los usuarios Web es debido a que se necesita saber como es navegación de estos a través de una pagina Web para saber cuales son las preferencias del usuario y predecir lo que se está buscando para facilitar la tarea de navegación en una pagina Web a través de la modificación de esta como parte de los requerimientos que se tienen de los usuarios.

Toda aquellas páginas Web donde se comercialice algo o se quiera informar como por ejemplo en las páginas científicas, de noticias, etc. se necesita saber cómo los usuarios perciben la pagina Web si realmente tienen la información que requieren, el servicio que reciben por parte de pagina es el adecuado, etc.; para poder saber cómo los usuarios percibe la pagina Web debemos saber cómo es que estos se comporta cuando navegan a través de esta, en tal sentido la aplicación de este estudio está enfocado en la necesidad de saber cómo es el comportamiento de los usuarios Web de esta manera se busca mejorar la estructura de nuestra página en base a sus necesidades que se tenga de los usuarios, además

Justificación Operativa

La empresa tendrá mayor seguridad de la información obtenida para los clientes, proveedores y productos.

Mayor y mejor nivel de información dirigida al usuario.

Justificación Tecnológica

La Caja Municipal del Santa Cuenta Con la tecnología necesaria para la implementación de una web mining.

Justificación Económica

La caja Municipal del Santa cuenta Con Pagina Web lo que minimizaría los costos de implementación de una web Mining.

ANTECEDENTES

Modelado de patrones de comportamiento

Este estudio fue desarrollado por el departamento de Informática de Sistemas y Computadores de Universidad Politécnica de Valencia este estudio consiste en comprender y administra de una mejor manera la carga generada por los usuarios web.

La comprensión de las características de la carga es un aspecto importante cuando se diseña y provee servicios web. La mayoría de las técnicas para la caracterización de la carga actual de la web presenta limitaciones cuando tratan de representar las características dinámicas del comportamiento de los usuarios.

Página 6

Page 7: Proyecto de Tesis - Web Mining - Garcia Seminario Julio Cesar

MARCO TOERICO

1.- Archivo log Es un grupo de datos de un servidor web relacionado con la conexión, como host, identidad y autentificación de usuarios .Cada petición o cada clic generan una entrada de un usuario en este archivo.

Aquel archivo es guardado en un servidor y en donde se registra ciertos parámetros como:

Fecha de ingreso: Es la fecha en la cual ha ingresado el usuario de la pagina Web.

Hora de ingreso: Es la hora la cual ha ingresado el usuario a la página Web.

Nombre de directorio: Nombre del directorio donde se guarda el archivo log.

IP del servidor: Es la dirección lógica donde está guardado la página Web.

URL: Es la dirección secuencial de todos los módulos por donde ha navegado el usuario en la página Web.

Puerto: Es por donde entran y salen las peticiones a la página Web. IP de usuario: Es la dirección lógica del host del usuario que ha ingresado a la

página Web.

Nombre de Browser: Es el nombre de la interface con la cual el usuario puede contactarse con la pagina Web.

Parámetro de salida: es un parámetro numérico que nos indica si como es que ha sido la conexión del usuario con la pagina Web. 2xx: Nos Indica que el pedido de página ha sido exitoso. 3xx: La transferencia de archivos a través de la página ha sido correcta. 5xx: Nos Indica que el pedido de página ha fallado.

Un archivo log físicamente es cómo podemos ver en la figura:

Lectura del Archivo log: Para que nuestra data pueda ser leída por nuestro prototipo tanto el archivo log que esta nombrado por archlog y nuestro archivo log limpio (archlim) donde supuestamente se va ingresar nuestra información procesada y limpia deben ser cargadas a las siguientes direcciones: C:\Data\archlog.log

Página 7

Page 8: Proyecto de Tesis - Web Mining - Garcia Seminario Julio Cesar

C:\Data\archlim.log

2.- Pagina web Una página web es una fuente de información adaptada para la World Wide Web (WWW) y accesible mediante un navegador de Internet. Esta información se presenta generalmente en formato HTML y puede contener hiperenlaces a otras páginas web, constituyendo la red enlazada de la World Wide Web. Las páginas web pueden ser cargadas de un ordenador o computador local o remoto, llamado Servidor Web.

3.- Servidor web Es el lugar donde se almacena los archivos log, las acciones que realiza el servidor en relaciona a los registro del archivo log son los siguiente: para cada fichero enviado al cliente (esto es, pagina html y cada elemento nos contextual que contiene como botones, iconos, etc.), el servidor escribe un alinea en el archivo log (access log) si la transacción falla, algunos servidores escriben en la línea en otro archivo: el registro de errores (error log).

4.- Patrón de Comportamiento El patrón de comportamiento es la representación de un comportamiento ante un determinado contexto y tiene como finalidad poder dar solución a un problema en específico.

5.- Data Mining Data Mining, la extracción de información oculta y predecible de grandes bases de datos (DataWarehouse), es una poderosa tecnología nueva con gran potencial para ayudar a concentrarse en la información más importante de las bases de datos. Las herramientas de Data Mining predicen futuras tendencias y comportamientos, estas herramienta explotan las bases de datos en busca de patrones ocultos, encontrando información predecible que un experto no puede llegar a encontrar porque se encuentra fuera de sus expectativas.

¿Cómo trabaja Data Mining?

La técnica usada por Data Mining se llama modelado, modelado es simplemente el acto de construir un modelo en una situación donde se conoce la respuesta y luego la aplica en otra situación de la cual desconoce la respuesta.

Ejemplo: Para poder encontrar un patrón de comportamiento de los usuarios de paginas debemos estructurar un modelo es decir un conjunto de procesos a seguir para lograr el objetivo que es el reconocimiento de patrones de comportamiento para esto cada paso que se debe seguir en el Web Minig corresponde un proceso del modelo así también este modelo esta influenciado por la técnica con que se realiza el Web Minig que puede ser árboles de decisiones , redes neuronales o otra técnica, vale recalcar que Web Mining es una tipo de Data Minig que esta orientado para el estudio de datos en la Web.

7.- Técnicas del Data Mining

Página 8

Page 9: Proyecto de Tesis - Web Mining - Garcia Seminario Julio Cesar

Dependiendo de escenario y el entorno así como del tipo de estudio que se quiere realizar se escoge una determinada técnica para el proceso de Data Minino, comentaremos las más importantes.

Regla de asociación.-Por lo general esta técnica es utilizada para descubrir la correlación ente los accesos de los clientes a varios archivos disponibles en el servidor. Cada transacción está conformada por un conjunto de URL accedidas por el cliente en una visita al servidor.

Path análisis.-Este análisis es una extensión del modelo de regresión, usada para probar las correlaciones entre dos a más modelos causales que están siendo comparados.

Secuencias de patrones.-Esta técnica se basa en descubrir patrones en los cuales la presencia de un conjunto de ítems en orden temporal. Analizando estos datos se puede determinar el comportamiento de los usuarios con respecto al tiempo.

Clustering.-La agrupación aromática de los de clientes o datos con características similares sin tener una clasificación predefinida.

8.- Web Mining En el presente estudio utilizaremos las técnicas de Web Mining es una tipo de Data Minig pero está orientado para el estudio de datos en la Web.

El Web Mining es una metodología de recuperación de la información que usa herramientas de la minería de datos para extraer información tanto del contenido de las páginas, de su estructura de relaciones (enlaces) y de los registro de navegación de los usuarios. En este sentido podemos definir el Web Mining en tres variantes:

Web Content Mining (Minería de Contenido Web).).- Se centra en el contenido, y podemos obtener datos acerca de la forma de escribir que sea más atractiva para el usuario, de si la catalogación que usamos sirve para mejorar un ranking, si los temas que se tratan interesan o no.

Web Structure Mining (Minería de Estructura Web).-Obtenemos información acerca de si los usuarios encuentran la información, si la estructura de sitio es demasiado ancha o demasiado profunda, si los elementos están colocados en los lugares adecuados dentro de la página, si la navegación se entiende, cuáles son las secciones menos visitadas y su relación con el lugar que ocupan en la página central.

Web Usage Mining (Minería de Uso Web).-Esta extracción se refiere a patrones de navegación que podemos descubrir en nuestros usuarios y nos pueden servir para mejorar la misma, por ejemplo si el 80 % de nuestros usuarios recurren al campo de búsqueda cuando entran a nuestro sitio es que deberemos poner énfasis en la mejora de esa interfaz y que el motor que se encuentre detrás devuelva la información deseada.

Página 9

Page 10: Proyecto de Tesis - Web Mining - Garcia Seminario Julio Cesar

Formulación del Problema

¿Cuál es el nivel de reconocimiento de patrones de comportamiento de usuarios para la Caja municipal del santa?

Hipótesis

Implementación de una web Mining para el reconocimiento de patrones de comportamiento de usuarios para la Caja Municipal del santa.

VARIABLES

Variables IndependientesImplementación de una Web Mining.

Variables DependientesReconocer los patrones de comportamiento de usuarios.

PoblaciónTodos los usuarios que ingresan a la página de la CMS

MuestraLa muestra es una muestra aleatoria = 915 Usuarios.

Indicadores

Fecha de ingreso por usuario. Hora de ingreso por usuario. Hora de cierre por usuario. IP de usuario Tiempo total de navegación por usuario. Total de clics por usuario. Tipo de navegador Número de Usuarios que ingresan a la página por día.

Página 10

Page 11: Proyecto de Tesis - Web Mining - Garcia Seminario Julio Cesar

DISEÑO EXPERIMENTAL

Experimento

En las siguientes Graficas se muestra el resultado de haber aplicado la variable independiente, en este caso la Implementación de una Web Mining

INDICADOR: Número de usuarios que ingresan a la página por día

Grupo 1 Grupo 2(Var. INDP.)Fecha Numero

UsuariosFecha Numero

Usuarios25/08/2010 5 07/10/2010 1526/08/2010 4 08/10/2010 1227/09/2010 5 09/10/2010 1028/09/2010 3 10/10/2010 1529/09/2010 5 11/10/2010 1630/09/2010 4 12/10/2010 14

INDICADOR: Tiempo total de navegación por usuario/Segundos.

Grupo 1 Grupo 2(Var. INDP.)USUARIO TIEMPO USUARIO TIEMPO

Usuario 1 100 s Usuario 1 115 sUsuario 2 250 s Usuario 2 300 sUsuario 3 90 s Usuario 3 120 sUsuario 4 85 s Usuario 4 115 sUsuario N 95 s Usuario N 130 s

INDICADOR: Total de clics por usuario.

Grupo 1 Grupo 2(Var. INDP.)USUARIO NUM. CLIC’S USUARIO NUM. CLIC’S

Usuario 1 6 Usuario 1 12Usuario 2 4 Usuario 2 15Usuario 3 8 Usuario 3 16Usuario 4 10 Usuario 4 13Usuario N 8 Usuario N 14

Página 11

Page 12: Proyecto de Tesis - Web Mining - Garcia Seminario Julio Cesar

PRESUPUESTOEl Proyecto de Tesis Esta planificado para 4 Meses

Recursos:

1. Personal

Descripción Unidad Cantidad Costo

unitario U$$

Costo total

U$$

Investigador Meses 2 1500.00 3000.00

Analista de BD Meses 1 2000.00 2000.00

Desarrollador Web Meses 1 2000.00 2000.00

Asesoría Técnica Citas 1 2000.00 2000.00

TOTAL 9000.00

2. Bienes

Descripción Unidad Cantidad Costo

unitario U$

$

Costo total

U$$

Equipos:

- Impresora

- Scanner

- Computadora

- Memoria USB

Software:

- MYSQL

- WAMP-Server

- Dream Weaver

Materiales:

- Papel

- Cartuchos de

Tinta

- libros

Equipo

Equipo

Equipo

Equipo

Licencia

Licencia

Licencia

Millar

1

libros

1

1

1

1

1

1

1

2

2

4

100.00

100.00

1500.00

50.00

---

---

100.00

7.00

50.00

20.00

100.00

100.00

1500.00

---

---

100.00

28.00

100.00

80.00

Total 2008.00

Página 12

Page 13: Proyecto de Tesis - Web Mining - Garcia Seminario Julio Cesar

3. Servicio

Descripción Unidad Cantidad

(Mes)

Costo

unitario U$$

Costo total

U$$

Asesoría

Energía Horas 150 50.00 200.00

Internet Horas 150 120.00 480.00

Transporte Viajes 80 1.00 80.00

Fotocopiad Hoja 100 10 40.00

TOTAL 800.00

RESUMEN:

COSTO TOTAL:

Personal 7500.00Bienes 2428.00Servicios 800.00Total $ 10728.00

Página 13

Page 14: Proyecto de Tesis - Web Mining - Garcia Seminario Julio Cesar

CRONOGRAMA DE ACTIVIDADES (Anexo MS-Project)

Página 14

Page 15: Proyecto de Tesis - Web Mining - Garcia Seminario Julio Cesar

RECOMENDACIONES

Se Debe implementar una web mining ya que nos brinda la posibilidad de tener acceso a información detallada de los usuarios de las páginas web obteniendo así los datos necesarios para poder fidelisar a nuestros clientes.

En la actualidad la Web es muy utilizada por diferentes tipos de usuarios y con diferentes necesidades, esto hace indispensable la implementación de una web mining.

La web es uno de las aplicaciones o fenómenos más importantes que han surgido en los últimos tiempos, y la web mining nos da la oportunidad de descubrir un medio significativo para exponer riquezas de información.

El Desarrollo de una web mining no demanda de un gran presupuesto y su implementación es a corto plaxo lo que lo hace fácil de implementar en cualquier organización.

La web mining juega un rol importante para lograr la efectividad en las relaciones de patrones interesantes de comportamiento de usuarios ante una web.

La web mining deben verse como oportunidades sinprecedentes para la obtención de información que antes no estaba a la mano y el mejoramiento de los procesos dentro de una página web.

La Gran parte de Empresas y Organizaciones ya cuentan con una página web o sitio web, lo cual facilita aun más la implementación de una web mining.

El número de usuarios de la web cada día es mayor lo cual hace urgente la implementación de una web mining.

Página 15

Page 16: Proyecto de Tesis - Web Mining - Garcia Seminario Julio Cesar

CONCLUSIONES

La Web Mining ha despertado gran interés en la actualidad, particularmente debido alos avances de la comunidad científica en distintas líneas de investigaciónrelacionadas con Data Mining orientado a la www. La web mining en los últimosaños esto se ha potenciado fuertemente en virtud del gran aumento en volumen deltráfico, tamaño y complejidad de las fuentes de información disponibles en la Web yel reciente interés en el desarrollo aplicaciones para el comercio electrónico. Lainiciativa privada actualmente es el principal precursor de que la información seaparticular para cada individuo creando sistemas que incorporan personalizaciónconstruyen modelos de los objetivos, características, preferencias y conocimientos decada usuario. La web mining es un área con expectro amplio de investigación. En estedocumento se hace una simple aproximación para tener ciertas bases en proyectosprofundos de investigación.

El presente estudio tiene como finalidad determinar el comportamiento de un usuario de página Web estableciendo para esto una metodología basada en el Web Mining mediante la cual desarrollamos un conjunto de etapas que tiene como finalidad extraer información importante de fuentes de datos habitualmente no explotadas, para nuestro caso estas fuentes son los archivos log de los servidores Web que a través de uso de la metodología Web Mining y la técnica Clustering se busca extraer la información sobre el comportamiento de los usuarios Web.

La técnica utilizada es la Clustering mediante la cual se generan grupos de sesiones, teniendo en cuenta características común cada uno de estos grupos están conformadas por sesiones que tienen características que están determinadas por la secuencia de paginas que han navegado los usuarios de las sesiones, estas secuencias estar determinadas por tres criterios que son :

Usuarios que solo visitaron la pagina principal y no ingresaron a otra pagina. Usuarios que ingresaron directamente a una pagina determinada sin necesidad

de pasar previamente por la pagina principal. Usuarios que ingresaron a una pagina determinada a través de la página

principal.

De estos porcentajes podemos concluir que la mayor cantidad de usuarios solamente estuvieronnavegando por la pagina principal esto puede ser debido a que los usuarios no encontraron la información y por ende solo se dedicaron a navegar por la pagina principal se puede afirmar estopor que el tiempo de las sesiones que ha navegado solo en la pagina principal es en promedio 3 minutos.

Se puede Observarque hubo un aumento en la cantidad de usuarios que visitaron la páginadespués de la implementación de web Mining.

Página 16

Page 17: Proyecto de Tesis - Web Mining - Garcia Seminario Julio Cesar

BIBLIOGRAFÍA

1. Chen M. Park J. y Yu P.(1996) Data mining for path traversal patterns in a web environment .En : Proc. 16 th International conference on distributed computing system Pág. 385 – 392

2. [DAW2002] DAWSON Christian, QUETGLÁS Gregorio. El proyecto Fin de Carrera en Ingeniería Informática: Una Guía para el Estudiante. Madrid: Prentice Hall, 2002. ISBN 84-205-3560-5. QA 76.27 D199 (Bib. Ingeniería)

3. Frequent Pattern Mining in Web Log Data : Budapest University of Technology and Economics; Goldmann Gy. tér 3, H-1111 Budapest, Hungary Autor: Renata Ivancsy, Istvan Vajk Pag. 81

4. [CONCYTEC] Consejo Nacional de Ciencia, Tecnología e Innovación Tecnológica http://portal.concytec.gob.pe/portal/paginas/index.jsp

5. [CER2002] CERNUDA del Río Agustín. El modelo de desarrollo para un Proyecto Fin de Carrera en Ingeniería Técnica en Informática. Departamento de Informática - Universidad de Oviedo, Escuela Universitaria de Ingeniería Técnica en Informática de Oviedo. Disponible en www.di.uniovi.es/~cernuda/pubs/jenui2002-1.pdf.

6. J. Wang, Y. Huang, G. Wu, and F. Zhang, Web Mining: Knowledge Discoveryon the Web Proc. Int'l Conf. Systems, Man and Cybernetics (SMC '99), vol. 2, pp.137-141.

7. Baeza-Yates, R. Pobrete, B. “Una herramienta de minería de consultas para eldiseño del contenido y la estructura de un sitioWeb” Actas del III Taller Nacional deMinería de Datos y Aprendizaje TAMIDA2005”, pp.39-48, 2005.

8. Kosala, R. and Blockeel, H. Web Mining Research: A Survey. ACM SIGKDD Explorations, Newsletter of the Special Interest Group on Knowledge Discovery andData Mining. Page 1-9, 2000.

9. www.wikipedia.org .

Página 17

Page 18: Proyecto de Tesis - Web Mining - Garcia Seminario Julio Cesar

ANEXOSFormato de Toma de Datos de Usuario de la WEB MINING DE LA CMACS

Evento

Usuario

Fe

cha

de

Ing

reso

Ho

ra d

e In

gre

so

Ho

ra d

e C

ierr

e

IP d

e

Usu

ari

o

Tie

mp

o d

e U

sua

rio

To

tal

de

Clic

Nav

eg

ado

r

Usuario 1 12/11/10 10.30:10 am 10.35:14 am 10.45.100.123 05:04 min 15 ExploreUsuario 2 12/11/10 11:15:12 am 11:18:22 am 15.45.1.45 03:10 min 18 FirefoxUsuario 3 13/11/10 12:13:45 am 12:18:42 am 10.45.1.67 04:57 min 09 ExploreUsuario 4 14/11/10 01:00:15 pm 01:08:12 pm 123.156.12 07:53 min 12 Opera

… … … … … … … …Usuario N 14/11/10 03:05:10 pm 03:15:08 pm 84.162.69.168 09:58 min 08 Safari

Grafica Comparativa de Navegadores Usados por los Usuarios (1 mes)

NAVEGADOR USUARIOS PORCENTAJEInternet Explore 374 40.87 %Mozila Firefox 253 27.65 %Opera 158 17.27 %Safari 70 7.65 %Msnboort 43 4.70 %NetScape 17 1.87 %TOTAL 915 100.00 %

Internet ExploreMozila FirefoxOperaSafariMsnboortNetScape

Especificación de Datos (1 mes)

Parámetro ValorTotal de Visitas Contadas 915Tiempo Promedio(Segundos) 200,53Mínimo de tiempo(Segundos) 0,00

Página 18

Page 19: Proyecto de Tesis - Web Mining - Garcia Seminario Julio Cesar

Máximo de Tiempo(Segundos) 1747

Página 19