Web Mining

25
MBA Jonny Chambi Lima, Perú - 2013 Web Mining Conocimiento en la Web

description

Introducción al Web Mining, haciendo un recorrido por la Web Analytics.

Transcript of Web Mining

Page 1: Web Mining

MBA Jonny Chambi

Lima, Perú - 2013

Web Mining Conocimiento en la Web

Page 2: Web Mining

El sitio web de: una empresa, profesional o cualquier organización es un canal de marketing, ventas, promoción, imagen, etc. En cualquier caso, interactúa de una u otra forma con todas las áreas del negocio, con objetivos, estrategias, resultados y retornos de inversión que pueden ser medidos y cuantificados.

¿Qué es la Web?

Web

Marketing Venta Promoción Imagen

Page 3: Web Mining

El análisis web: es un conjunto de técnicas relacionadas con el análisis de datos, relativos a un sitio web con el objetivo de entender su tráfico como punto de partida para optimizar diversos aspectos del mismo.

¿Que es el Análisis Web?

Lo que no se mide, no se controla, lo que no se controla,

no se mejora

Page 4: Web Mining

¿De que sitio proceden? ¿Qué hacen en el sitio? ¿Por qué paginas

navegan?

¿Durante cuánto tiempo?

¿Cuántas veces revisitan el sitio?

¿De qué país son?

¿Qué tipo de conexión de internet tienen?

¿En qué paso de un proceso de venta

desisten?

¿Cómo se capturan todos los movimientos en mi sitio

Web?

En que nos Ayuda

Responder preguntas acerca de los visitantes:

Page 5: Web Mining

KPI

1. Volumen de visitas

2. Volumen de visitantes

3. Volumen de páginas vistas

4. Porcentaje de Rebote

5. Porcentaje de crecimiento de tráfico en el periodo

6. Porcentaje de crecimiento de páginas vistas en el periodo

7. Porcentaje de nuevos visitantes

8. Porcentaje de tráfico desde buscadores

9. Porcentaje de crecimiento de tráfico directo en el periodo

10. Porcentaje de crecimiento de tráfico desde otros orígenes

10 KPI’s Más Importantes

Page 6: Web Mining

Analizadores de ficheros de logs

• Son programas que analizan los ‘logs’ de los servidores proporcionando información sobre “quién”, “cuándo” y “cómo” los visita.

Etiquetado de páginas

• Este método, está basado en la incorporación de un script a cada una de las páginas de un sitio. Cada vez que una página es visitada, este script se comunica con una base de datos a la que comunica la impresión de la página junto con, potencialmente, datos adicionales procedentes de las cookies.

Herramientas de Medición

Page 7: Web Mining

Herramientas de Medición

Google Analytics

• Es la más conocida, una de las más completas y además su uso es gratuito. Al igual que con la mayoría, para que funcione hay que insertar un código javascript generado por Google en la programación el sitio web.

Piwik

• Se trata de la herramienta de analítica web de software libre por excelencia. La interfaz es muy sencilla y cuenta con prácticamente todas las funcionalidades que provee la solución de Google. Una ventaja es que los datos que se tiene es a tiempo real.

Yahoo! Web Analytics

• Es la respuesta de Yahoo a la herramienta de Google. Tiene tres principales diferencias respecto a la a la primera:

• 1.- Guarda el historial de datos permanente.

• 2.-Ofrece información a tiempo real.

• 3.- Extrae datos socio- demográficos.

Omniture

Es una herramienta de analítica web de pago y está orientada para ser usada con webs más grandes y complejas. Es la más recomendable si manejas un gran volumen de información, quieres segmentar a grandes niveles o cruzar muchos datos o variables. Por mencionar algunas diferencias, Omniture te permite trabajar directamente desde el Excel

Page 8: Web Mining

¿Como Funciona?

Usuario

Sitio Web • Navegación

• Descarga

• Comentarios

• Compras

Script de Seguimiento

Base de Datos

Page 9: Web Mining

• Es interesante saber cuanto tráfico tiene una web que no es nuestra, ya sea por motivos de competencia o por curiosidad, estas herramientas nos permite averiguar cuanto trafico tiene una web ajena, y permiten conocer de manera aproximada el número de visitas, aunque generalmente se equivocan.

Aquí algunas herramientas:

• www.Alexa.com y

• http://www.google.com/trends/

Tráfico de la Competencia

0

20

40

60

80

100

120

11/2

0/2

01

1

12/4

/20

11

12/1

8/2

01

1

1/1/

20

12

1/1

5/2

01

2

1/2

9/2

01

2

2/1

2/2

01

2

2/2

6/2

01

2

3/1

1/2

01

2

3/2

5/2

01

2

4/8/

20

12

4/2

2/2

01

2

5/6/

20

12

5/2

0/2

01

2

6/3/

20

12

6/1

7/2

01

2

7/1/

20

12

7/15

/20

12

7/2

9/2

01

2

8/1

2/2

01

2

8/2

6/2

01

2

9/9/

20

12

9/23

/20

12

10/7

/20

12

10/2

1/2

01

2

11/4

/20

12

11/1

8/2

01

2

nike

adidas

umbro

reebok

Page 10: Web Mining

Perú: Páginas Web más visitadas

Visitas Diarias

Fuente: Alexa.com y estimación propia

Page 11: Web Mining

Visitas Diarias

Fuente: Alexa.com y estimación propia

Perú: Páginas Web más visitadas

Page 12: Web Mining

Web analytics a la pagina www.dataminingperu.com en la fecha de 8 octubre a 08 de noviembre 2012

Métricas: www.dataminingperu.com

INDICADORES CANTIDADES

Visitas 2272

Acciones 9562

Porcentaje de rebote 0.4

Acciones por visita 4.2

Promedio de duración de las visitas (en minutos) 4.4

Visitante que ha vuelto 802

Acciones por un visitante que ha vuelto 3642

Porcentaje de rebote por un visitante que ha vuelto 35%

Promedio. Acciones por visitante que ha vuelto 4.5

Promedio. Duración de la visita de los Visitantes que han Vuelto (en minutos) 5.4

Páginas vistas 8961

Descargas 492

Links de salida 101

Searches 4

Unique Keywords 4

Páginas vistas únicas 6819

Descargas Únicas 451

Links de salida Únicos 90

Conversiones 492

Visitas con conversiones 312

Page 13: Web Mining

Métricas: Web Analytics

Web analytics a la pagina www.dataminingperu.com en la fecha de 8 setiembre a 17 de febrero 2013

Page 14: Web Mining

El Web Mining se construye sobre el Web Analytics

Los datos Web tienen un valor latente mucho mayor del que puede extraerse sólo mediante el análisis convencional

Page 15: Web Mining

Análisis predictivo en las acciones online.

Web Mining

Page 16: Web Mining

Tecnología Utilizada

Piwik

• Script de Almacenamiento de datos.

Google Analytics

• Herramientas esencial de web analytics

RapidMiner

• Software más utilizado de Minería de Datos

Mysql

• Gestor de Base de datos más Utilizado

Page 17: Web Mining

Proceso de Web Mining

1. Instalación

2. Reporting

3. Análisis Ad-Hoc

4. Web Mining

Page 18: Web Mining

Fases del Modelo

Comprensión del Negocio

Comprensión de los Datos

Preparación de los Datos

Modelado Evaluación Desarrollo

Fases del Proyecto de Minería de datos

18

Page 19: Web Mining

Segmentación: Aplicación en Rapid Miner

Page 20: Web Mining

Conexión a la Fuente de Datos

Page 21: Web Mining

Aplicación: Segmentación

Page 22: Web Mining

… los segmentos:

Training 30% Buscador 37%

Nuevo 19% Full User 13%

Page 23: Web Mining

Lo que se viene…

24

Page 24: Web Mining

Gracias!

Page 25: Web Mining

Conocimiento en la Web

Web Mining