Motores de Búsqueda y Sistemas de Información en la Web Primera Parte: Google Lluís Codina UPF...
-
Upload
constanza-deniz -
Category
Documents
-
view
7 -
download
0
Transcript of Motores de Búsqueda y Sistemas de Información en la Web Primera Parte: Google Lluís Codina UPF...
Motores de Búsqueda y Sistemas de Información
en la WebPrimera Parte: Google
Lluís CodinaUPF
IDECBarcelona, Abril 2008
Abril 2008 L. Codina - IDEC/UPF
El modelo actual
El paradigma Google
¿Es el motor de búsqueda más usado?
¿Es el mejor?
¿A qué debe su supremacía?
¿Tiene puntos débiles?
¿Hay alternativas?
Abril 2008 L. Codina - IDEC/UPF
Google – I
Puntos fuertes: Mayor índice de cobertura de la Web (entre el 40
y el 80 por ciento de la web) Ordenación de resultados (ranking)
Componente principal: análisis de enlaces (PageRank)
Sencillez de uso + Uso avanzado… en segundo plano
Abril 2008 L. Codina - IDEC/UPF
Google – II
Puntos débiles: Ranking vulnerable (Spaming, Google bombing,
…) Alta prioridad a parecer eficientes antes que serlo
(no se pueden consultar todos los resultados, no aplican álgebra booleana, etc.)
El comercio electrónico como background unificador de su estrategia
Abril 2008 L. Codina - IDEC/UPF
Google – III
Algunos mitos sobre Google: Google “lo sabe todo” Si no está en Google es que no está en la Web Si no está en su primera página de resultados, es
que no me interesa No hay otras fuentes de información en la Web
(que merezcan la pena)
Abril 2008 L. Codina - IDEC/UPF
¿Hay vida más allá de Google?
Sí, y muy recomendable: Yahoo Search > La mejor competencia
search.yahoo.com Live > La competencia más peligrosa
www.live.com Alexa > La información añadida
www.alexa.com A9 > La búsqueda más completa
a9.com
Características de un buscador
Cálculo de Relevancia: ¿Los primeros resultados son los más
relevantes? Página de resultados:
¿Cómo presenta los resultados? Búsqueda avanzada
¿Qué opciones adicionales presenta?
Abril 2008 L. Codina - IDEC/UPF
Análisis comparativo
Buscador Relevancia Pag. Resultados Búsqueda Avan.
Yahoo
Live
a9
Total
Abril 2008 L. Codina - IDEC/UPF
Práctica - 11. Entrar en Ranking Thumbshots:
http://ranking.thumbshots.com/ Comparar Google con Yahoo usando una misma frase o palabra clave
2. Buscar una misma frase o palabra clave, p.e. “marketing”, en Google.es y en Google.com y comparar resultados
3. Seleccionar una frase o palabra clave y realizar búsquedas en: Windows Live > www.live.com Google > www.google.com Yahoo > www.yahoo.com Comparar: (1) relevancia, (2) página de resultados, (3) búsqueda
avanzada Otorgar un máximo de 3 puntos a cada uno de los tres apartados
4. Entrar en Metacrawler y realizar pruebas comparativas entre buscadores activando las columnas de los tres principales buscadores
Abril 2008 L. Codina - IDEC/UPF
Abril 2008 L. Codina - IDEC/UPF
Búsqueda Multimedia (I) Dimensiones del fenómeno
Cuantitativa - I: ¿Cuántas imágenes?75 mil millones de fotografías en un año en todo el mundo900 mil millones de fotografías almacenadas en total en todo el mundo31 millones de horas de programas de televisión al año y 71 millones de programas de radioFuente: How Much Information 2003 www.sims.berkeley.edu/research/projects/how-much-info-2003
Abril 2008 L. Codina - IDEC/UPF
Búsqueda Multimedia (II) Dimensiones…
Cuantitativa – II: ¿Qué dimensión económica? Mercado en EE.UU. de bancos de imágenes calculado en unos
3000 millones de dólares (2005). Tres datos concretos: Facturación de Corbis: 228 millones de dólares en 2005 (unos
100 millones en 2004) y 70 millones de imágenes Facturación de Getty: 733 millones de dólares en 2005 (unos
400 millones en 2004) y 70 millones de imágenes y 30.000 horas de metraje (video)
Facturación de JupiterImages (2005): 124 millones de dólares (7 millones de imágenes)
Fuente: Hoovers (www.hoovers.com)
Abril 2008 L. Codina - IDEC/UPF
Dimensiones…
Cualitativa: segmentación del mercado Editorial (revistas, libros) Prensa (diarios) Publicidad y relaciones públicas Packaging Multimedia (dvd, internet) Televisión, vídeo y cine Corporaciones (folletos y memorias de empresas) Investigación: arte, historia, sociología,
antropología, etc. Uso personal (invitaciones, tarjetas, webs, etc.)
Abril 2008 L. Codina - IDEC/UPF
Búsqueda multimedia – (III)
Motores de búsqueda convencionales El problema esencial
Derechos de autor Problemas añadidos
Baja calidad imágenes, limitaciones en las opciones de búsqueda y ausencia de metadatos
La alternativa profesional Bases de datos Repositorios Buscadores especializados “open access”
Abril 2008 L. Codina - IDEC/UPF
Búsqueda multimedia – (IV)
Bases de datos GettyImages > www.gettyimages.es Corbis > www.corbis.com AGE Fotostock > www.agefotostock.com
Repositorios Internet Archive > www.archive.org MorgueFile > www.morguefile.com
Buscadores especializados Creative Commons > es.creativecommons.org/ YotoPhoto > www.yotophoto.com
Abril 2008 L. Codina - IDEC/UPF
Fuenteswww.tasi.ac.uk
Abril 2008 L. Codina - IDEC/UPF
Alexawww.alexa.com
Abril 2008 L. Codina - IDEC/UPF
StockIndex Online
Práctica - 2
Seleccione tres frases o palabras clave que consistan en: Un elemento icónico Un concepto Un nombre propio (nombre de persona, empresa,
topónimo, etc.) Haga búsquedas con estas frases o palabras clave en
Getty y en Corbis para poder preparar un breve informe comparativo que incluya: (1) relevancia de los resultados, (2) presentación y (3) opciones de búsqueda.
Abril 2008 L. Codina - IDEC/UPF
Abril 2008 L. Codina - IDEC/UPF
Segunda Parte: Motores de búsqueda para usos académicos
Las dudas de la Web ante “misiones críticas”: ¿Es fiable? ¿Quién controla la calidad de la información? ¿Cómo filtrar la desinformación? ¿Sirven los modelos anteriores de control
editorial? ¿Cuál es la respuesta de los motores de
búsqueda?
Abril 2008 L. Codina - IDEC/UPF
La respuesta de los motores
Google Google Books
books.google.com Google Scholar
scholar.google.com MS
Live Academicacademic.live.com
Abril 2008 L. Codina - IDEC/UPF
Google Books Inputs
Digitalizaciones de colecciones libres de derechos (Bibliotecas) Contratos con editoriales
Consulta Búsqueda simple y avanzada
Navegación Sumario e Índice temático
Acceso Libro completo Número limitado de página
Opciones específicas Adquisición Localización en bibliotecas
Abril 2008 L. Codina - IDEC/UPF
Google Scholar vs. Academic Live
Inputs La Web (Google Scholar) Editoriales científicas (ambos) Acuerdos con Bibliotecas (Google Scholar)
Consultas Búsqueda avanzada (Google Scholar)
Acceso Resolución de enlaces (ambos)
Exportación de resultados Formatos bibliográficos (ambos)
Abril 2008 L. Codina - IDEC/UPF
Alternativas
Amazon www.amazon.com > Search Inside A9
www.a9.com > books
Abril 2008 L. Codina - IDEC/UPF
Práctica - 3 Seleccione una frase o una palabra clave de su interés y
compare resultados y prestaciones de: Scirus Google Scholar Windows Live
Prepare un breve informe sobre los siguientes aspectos. Relevancia Página de resultados Tipología de los documentos Opciones de búsqueda Utilidades