Yahoo | Búsquedas: su uso para diseñar un mejor sitio

25
2 Cómo saber qué quieren las personas a través de las búsquedas y su impacto en el diseño de sitios Web Ricardo Baeza Yates VP, Yahoo! Research Barcelona, España & Santiago, Chile 3 Agenda Introducción Conceptos de Diseño de Sitios Web Plataforma SearchMonkey de Yahoo! Diseño dirigido por el Usuario Minería Web Optimizando un Sitio Minería de Consultas

description

 

Transcript of Yahoo | Búsquedas: su uso para diseñar un mejor sitio

Page 1: Yahoo | Búsquedas: su uso para diseñar un mejor sitio

2

Cómo saber qué quieren las personas a través de las búsquedas y

su impacto en el diseño de sitios Web

Ricardo Baeza Yates

VP, Yahoo! Research

Barcelona, España & Santiago, Chile

3

Agenda

�Introducción

�Conceptos de Diseño de Sitios Web

�Plataforma SearchMonkey de Yahoo!

�Diseño dirigido por el Usuario

�Minería Web�Optimizando un Sitio�Minería de Consultas

Page 2: Yahoo | Búsquedas: su uso para diseñar un mejor sitio

Desafíos en la Web

11

Entendiendo la Web

• El repositorio público de datos más grande que existe

(¿más de 12 mil millones de páginas estáticas?)

• Hoy hay más de 176 millones de servidores Web

(49% Apache, 36% Microsoft)

• Red altamente conectada con distribución de Zipf en los

enlaces y en muchas otras medidas

Log

Log

x –�

Auto-similar &

Auto-organizada

Page 3: Yahoo | Búsquedas: su uso para diseñar un mejor sitio

12

Tendencias

• Web 2.0, redes sociales

– Fragmentación de la propiedad del contenido– Fragmentación del acceso (visitas, tema)– Fragmentación del permiso de acceso

• Incremento de la Web semántica

– RDF, microformatos, metadatos en general

• Aumento de la publicidad en Internet asociada a búsquedas

Web 2.0 en Yahoo!

• Yahoo! Groups 8 millones,, 1 de cada 10 usuarios

• Del.icio.us 2 millones de usuarios

• Flickr 1 million de fotos al día

• Yahoo! Respuestas 100M usuarios únicos,, 250M respuestas

• Messenger 85M usuarios únicos

Sitios sociales tuvieron 115M visitantes únicos, 56M “menores de 35”.

(datos del 2007)

Page 4: Yahoo | Búsquedas: su uso para diseñar un mejor sitio

Publicidad

2011

2007

2012

2011

15

Las Diferentes Facetas de la Web

Page 5: Yahoo | Búsquedas: su uso para diseñar un mejor sitio

16

La Estructura de la Web

17

La Persona tras la Consulta

Page 6: Yahoo | Búsquedas: su uso para diseñar un mejor sitio

18

Consultas en la Web

�Diversidad cultural, educacional y geográfica

�Consultas cortas, interacción impaciente

� pocas consultas & pocas respuestas vistas

�Vocabulario diferente y menos extenso

�Diferentes objetivos (Broder, 2000):

�Necesidad informacional

�Necesidad navigacional

�Necesidad transaccional

�Refinada por Rose & Levinson, WWW 2004

19

Necesidades de las Personas

• Necesidad (Broder 2002)

– Informacional – queremos aprender acerca de algo (~40% / 65%)

– Navegacional – queremos ir a un sitio (~25% / 15%)

– Transaccional – queremos hacer algo (web-mediated) (~35% / 20%)

• Acceder a un servicio

• Descargar

• Comprar

– Ambiguedades

• Encontrar una lista de páginas

• Búsqueda exploratoria

hemoglobina baja

El País

Clima Barcelona

Imágenes de la luna

Canon S410

alquiler coches Chile

Page 7: Yahoo | Búsquedas: su uso para diseñar un mejor sitio

Objetivos de un Sitio Web

• Generar visitas y fidelidad

• Estar en la Web

• Diseñar para las personas y los buscadores

• Explotar publicidad dirigida y eficiente

– Diferentes modelos: CPM, CPC

– Diferentes lugares: búsqueda, contexto

Dos Puntos de Vista

• La Persona

– Diseñador

– Usuario

• El Computador

– Buscador

– Agente de software

– Herramienta de usosintaxis

semántica

persona

software

contenido

software

persona

Page 8: Yahoo | Búsquedas: su uso para diseñar un mejor sitio

Un Modelo Causal

Buscador

Persona

Usando el Sentido Común

Los cinco pasos causales en un sitio Web:

• Buscabilidad

• Visibilidad y accesibilidad

• Contenido

• Estética

• Fidelidad

Encuéntrame, descárgame y úsame.

Déjate luego seducir y vuelve a mí una y otra vez.

Yo por mi parte usaré mucho, mucho sentido común

y trataré de sorprenderte cada día.

Ubicuidad

UsabilidadArquitectura

Page 9: Yahoo | Búsquedas: su uso para diseñar un mejor sitio

Arquitectura: Ser

Ubicuidad: Estar

Usabilidad: Servir

Buscabilidad

Visibilidad

Contenido

Estética

Fidelidad

(crear hábito)

Ubicuidad (Buscadores)

Un gran porcentaje de las visitas a un sitio

proviene de buscadores, entonces:

• ¿Encontrará mi sitio un buscador?

– No, si no ha registrado su sitio o si no posee

un enlace desde un sitio conocido

• ¿Pongo trabas a los buscadores?

– Si, si uso mal Flash, Javascript u otras

herramientas que no permiten extraer los

enlaces hacia páginas internas

Page 10: Yahoo | Búsquedas: su uso para diseñar un mejor sitio

Sitios Impenetrables

Se puede esgrimir la excusa de la ignorancia,

pero hay casos en que esto es imperdonable:

• Las empresas de TI no pueden apelar a la

excusa de ser ignorantes

• Sitios de gobierno

• Las empresas donde la información es uno de sus valores fundamentales.

• España: 30% de 300 mil sitios (2005)

¡Y sin mencionar las empresas de

información que no tienen sitio Web!

Buscabilidad (Personas)

• ¿Tengo el texto correcto en mi página

principal? ¿Puedo encontrar mi sitio

imaginando que palabras usarán mis clientes?

• ¿Queda mi sitio bien ubicado en una

búsqueda?

– Si la respuesta es no, consiga enlaces desde

otros sitios y mejore sus metadatos (para

cuando se usen)

– Busque los enlaces a que tiene su sitio

Page 11: Yahoo | Búsquedas: su uso para diseñar un mejor sitio

37

Visibilidad (Personas)

• ¿Es su diseño compatible con todos los

navegadores o usted supone que todo el

mundo usa Explorer y Windows?

• ¿Es su sitio liviano?

• ¿Es su HTML complicado o usa

herramientas de diseño sofisticadas?

download + rendering time

Page 12: Yahoo | Búsquedas: su uso para diseñar un mejor sitio

Accesibilidad

• ¿Considera su sitio alternativas para

personas con discapacidades visuales o le

da lo mismo?

• Existen normativas, fáciles de seguir, que

permiten la creación de páginas web

accesibles para todos

• WAI, Web Accessibility Initiative,

http://w3c.org/WAI/

• Recuerde que los crawlers son ciegos!

Contenido

• Su sitio debe tener algún interés si la

persona ha llegado hasta aquí

– elementos legibles y comprensibles

– coherencia de la navegación y

– de la funcionalidad en todas las páginas.

• La semántica del contenido debe responder

a la pregunta ¿cuál es mi audiencia

objetivo?

Page 13: Yahoo | Búsquedas: su uso para diseñar un mejor sitio

• ¿Es su prosa asequible a todo el mundo?

• ¿Es el idioma usado una barrera para sus

clientes?

• ¿Tenemos las palabras con que nos buscarán?

• Sea humilde: nadie sabe que quieren sus

clientes (además cambia en el tiempo)

Contenido

Estética

• Su diseño gráfico debe ser bonito pero sin

sacrificar los puntos anteriores

– Esto significa cosas obvias como no usar

fondos que afecten la legibilidad o recargar

la página con elementos distractivos

• El diseño gráfico debe ser elegante y

simple, pero también puede ser feo y

funcional

Page 14: Yahoo | Búsquedas: su uso para diseñar un mejor sitio

Fidelidad

• Su sitio ha sido usado, ¿pero volverá esta

persona a él?

– contenido o servicio que se necesite en

forma periódica

– que sea adictivo en el buen sentido de la

palabra

– que genere una comunidad virtual de

personas con intereses comunes

• Es el desafío más difícil:

el de la seducción permanente

Mejorar el Acceso a los Contenidos

• Search Monkey (Yahoo!)

– Motivar a los proveedores de contenido a

mejorar sus resultados en los buscadores y

por ende la satisfacción de los usuarios

– Proveer herramientas para mejorar el uso de

anotaciones semánticas y desarrollar

aplicaciones

– Todos ganan

Page 15: Yahoo | Búsquedas: su uso para diseñar un mejor sitio

Before After

Una plataform a abierta para usar datos

estructurados que perm iten generar resultados

m ás útiles y relevantes en Yahoo!

¿Qué es SearchMonkey?

im agen

Enlaces

internos

Resum en

atributos/

valores

Resultado Mejorado

Page 16: Yahoo | Búsquedas: su uso para diseñar un mejor sitio

Diseño Dirigido por el Usuario

• User-driven design

– Ejemplo: Yahoo!

Las personas que usan su sitio deciden su

contenido, estructura y funcionalidad

Page 17: Yahoo | Búsquedas: su uso para diseñar un mejor sitio

53

Minería Web

• Contenido: texto & multimedia

• Estructura: análisis de enlaces,

minería de redes (grafos)

• Uso: análisis de logs (bitácoras), consultas

• Correlacionar lo anterior

–Depende de la aplicación

54

Ventajas de la Minería Web

�Contenido y estructura

�Verificar la calidad de un sitio

�Problema principal: las personas

�Uso: información semántica implícita

�Es gratis y en general es mucha

�No tiene sesgo

�Complementaria a estudios de usuarios

�Valor comercial invaluable

Page 18: Yahoo | Búsquedas: su uso para diseñar un mejor sitio

55

Recolección de Datos

• Contenido y Estructura: Crawling

• Uso: Logs (Bitácoras)

– Logs del servidor Web (e.g. Apache)

• Usar el referer

–Logs de aplicaciones específicas

56

Limpieza de los Datos

• Depende del problema

• Contenido: eliminar duplicados

• Enlaces: rotos, inconsistentes

• Logs: detección de spam Web

–Robots vs. personas

Page 19: Yahoo | Búsquedas: su uso para diseñar un mejor sitio

57

Almacenamiento

• Organización: contenido, enlaces, logs

–XML, BD convencional, etc.

• Datos de uso:

–Anonimizar si es necesario

–Definir sesiones

Minería de Contenido y Estructura

• Verificar conectividad

• Verificar consistencia y estilo

– Navegación consistente

• Verificar organización

– Páginas similares deben estar enlazadas

– Páginas distintas no deberían enlazarse

Page 20: Yahoo | Búsquedas: su uso para diseñar un mejor sitio

Minería de Navegación:

Reorganización del Sitio

Hot links

Modelo de Usuario

Page 21: Yahoo | Búsquedas: su uso para diseñar un mejor sitio

61

Minería de Consultas

�Mejorar los buscadores: ranking, índice

�Esencia de la Información

–El sitio Web que la gente quiere

–El sitio Web que debemos tener

–Mejorar contenido y estructura

62

Distribución de las Consultas

Ley de Zipf: pocas consultas populares,

muchas consultas únicas

Page 22: Yahoo | Búsquedas: su uso para diseñar un mejor sitio

64

Consultas vs. Texto

65

¿Cuán lejos se va en los resultados?

(Fuente: iprospect.com WhitePaper_2006_SearchEngineUserBehavior.pdf)

Page 23: Yahoo | Búsquedas: su uso para diseñar un mejor sitio

67

Home page

Hub page

Página con

interacción

Rose & Levinson 2004

68

Datos en Consultas

�Sesión: ( (t, q), (URL, dt)* )+

�Persona, lugar, tiempo: IP, cookie

�Tarea: interacción anterior

�Dispositivo: sistema operativo, browser, ...

�Referer: de donde viene

Page 24: Yahoo | Búsquedas: su uso para diseñar un mejor sitio

Minería de Búsqueda:

Esencia de la Información

InternasExternas

70

Resultados

�Mejor texto para los enlaces

�Análisis de los casos negativos

–Respuestas que no gustan

–Consultas sin respuestas

–Páginas que sólo se visitan vía una búsqueda

� Nuevos contenidos

Page 25: Yahoo | Búsquedas: su uso para diseñar un mejor sitio

Para Recordar...

• Su sitio web siempre será probado

minuciosamente .....

.... cada vez que llegue un usuario

.... sólo si lo encuentra y lo entiende

Bibliografía – General

• Modern Information Retrieval R.

Baeza-Yates & B. Ribeiro-Neto, Addison-Wesley, 1999.

Segunda edición por aparecer..

• Mining the Web: Analysis of Hypertext and Semi Structured Data

Soumen Chakrabarti. Morgan Kaufmann; 2002.• Click: What Millions of People Are Doing Online and

Why it Matters, Bill Tancer.

• Ambient Findibility, Peter Morville, O`Reilly 2006.

• Search Analytics, Lou Rosenfeld

Sitio Web personal (libro por aparecer)

• Estudio de la Web Española R. Baeza-Yates, C. Castillo y V. López (Cybermetrics, 2006)

-

http://www.catedratelefonica.upf.es/.

• Websites:

– http://www.searchenginewatch.com/

– http://www.searchengineshowdown.com/