Motores de búsqueda de información científica y académica

24
Realizado por: Beatriz Martínez y Laura Vargas. MOTORES DE BÚSQUEDA DE INFORMACIÓN CIENTÍFICA Y ACADÉMICA

Transcript of Motores de búsqueda de información científica y académica

Realizado por:Beatriz Martínez y

Laura Vargas.

MOTORES DE BÚSQUEDA DE INFORMACIÓN CIENTÍFICA Y ACADÉMICA

Índice:

  1. Motores académicos    1.1. Scirus      1.1.1. Contexto      1.1.2. Inputs    1.2. Google Scholar      1.2.1. Contexto      1.2.2. Inputs    1.3. Live Search Academic      1.3.1. Contexto      1.3.2. Inputs  2. Conclusiones  3. Agradecimientos  4. Bibliografía

 

1. Motores académicos.La importante editorial Elsevier fue laprimera en detectar que existía una nuevanecesidad de información académica enla Web y que, por tanto, se necesitabauna nueva clase de sistemas deInformación para la Web. En concreto, Elsevier concibió un sistemacapaz de indizar páginas web de maneraautomática. Ese producto se llamó Scirus.

Su éxito despertó suficientes recelos en Google para que esta empresa intentarauna operación parecida, y así tuvimos unos pocos años después Google Scholar.Por imitación, Microsoft creó Live Search Academic .La característica principal de los tres sistemas es que solamente indizan sitios web vinculados con el mundo académico.

Proponemos la siguiente tipología dedocumentos académicos: Tipo 1: Páginas web y documentos de

todo publicados en sitios de instituciones académicas o científicas.

Tipo 2: Artículos de publicaciones científicas tipo peer review .

Tipo 3: Trabajos académicos tales como tesis doctorales o tesis de licenciatura.

Tipo 4: Documentos depositados en repositorios científicos ya sean pre-prints, post-prints, materiales didácticos, etc.

Tipo 5: Patentes Tipo 6: Libros (monografías).Los seis tipos de documentos anteriores sesolapan entre ellos.Pese a todo, la distribución anterior nosserá útil aquí para situar en contexto a losmotores de búsqueda académicos.

1.1. Scirus.

La austera pero potente y eficaz pantalla principal de Scirus.

1.1.1. Contexto Una creación de la importante editorialde revistas científicas holandesa Elsevierque es parte, a su vez, del giganteeditorial anglo-holandés Reed-Elsevier,editor de libros y revistas y productor debases de datos como Lexis-Nexis .Dispone de otras dos grandes bases deDatos: Science Direct y Scopus.

Scirus fue fundado en el año 2001 y, pocoa poco ha ido ampliando su campo deacción incorporando sucesivamentenuevas fuentes hasta convertirse en unauténtico gigante y en el más completosistema de los tres. En un análisis realizado afinales del año 2006 se constató que conteníamás de 300 millones de documentos. Otrosdos análisis previos confirmaron en sumomento que Scirus era, con muchadiferencia más completo que Google Scholarpor lo que hacía a repositorios científicos deltipo American Physical Society o PubMed.

1.1.2. InputsLos inputs de Scirus, es decir, el origen delos documentos que incluye en sus índicesson los siguientes: Artículos de revistas: principalmente,publicaciones académicas de la propiaeditorial Elsevier más un amplio grupo depublicaciones de tipo open access.Son los documentos que Scirus agrupa bajo ladenominación Journal Sources en su página deresultados y la opción del mismo nombre que sepuede marcar o desmarcar en su formulario debúsqueda.

Repositorios institucionales o académicos: hasta un total de 18 repositorios, además el de tesis doctorales de la red internacional NDLTD y el de patentes de Lexis-Nexis .Decimos "en teoría" porque las pruebas demuestran que en realidad utiliza más repositorios. Esta clase de documentos está señala por Scirus bajo la denominación Preferred Web Sources.

Páginas y documentos publicados en sitios web: en este caso se trata exclusivamente de servidores de universidades, de instituciones académicas o de departamentos o institutos de I+D de algunas empresas. Desde el punto de vista del dominio. Este grupo se identifica en Scirus como Other Web Sources.

1.2. Google Scholar.

La súper austera interfaz de GoogleScholar.

1.2.1. ContextoHa sido la empresa que ha revolucionadola búsqueda y ha acabado afectando a loshábitos de navegación. Ha empujado a losdirectorios generalistas, como Yahoo o Dmoz.La influencia de Google se ha dejado sentirtambién en el primer modelo de negocio queha sido capaz de generar beneficios en laWeb: su sistema de anuncios AdWord yAdSense, imitado también por suscompetidores.

Por último, prácticamente han creado elanálisis de enlaces. Lo cierto es que sonmuchas cosas las que Google haaportado a la Web. La cuestión es que,

ensu búsqueda de nuevas actividades,

lanzóGoogle Scholar con algunas ideas

nuevas.La más importante, sin duda, la de llevar

ala Web el análisis de citaciones.

1.2.2. InputsDe acuerdo con la documentación oficial los

inputs de Google Scholar consisten en lo siguiente:

Artículos de revistas: se trata de artículos de las editoriales académicas que han aceptado formar parte del programa de Google Scholarno, existe una documenta-ción pública que detalle qué editoriales son en concreto. Es fácil ver que hay una amplia representación de ellas, esto no substituye la buena práctica que consistiría en ir publicando qué editoriales están en el programa de Google Scholar.

Libros: se trata de editoriales que han aceptado formar parte de los contenidos de Google Scholar, en este caso, editoriales de libros. Tampoco disponemos de forma pública de una lista de estas editoriales. La segunda consiste en acuerdos con bibliotecas para obras. En general, señala que, en el caso que alguno de los resultados de Scholar sea un libro, el sistema nos remitirá a Google Books para su examen. Entendemos que debemos incluir aquí esta categoría documental porque está integrada en las búsquedas de Scholar.

Sitios Web : Al igual que Scirus, incluye documentos y páginas de sitios web vinculados con el mundo académico. La documentación oficial de Scholar no explica cómo seleccionan estos sitios. Es posible deducir, que debe utilizar un sistema similar al de Scirus, a saber, indizar sitio del tipo.edu, etc., sin de partida para analizar y a partir de los cuales encuentren otros, etc. En esta categoría, Google Scholar incluye también repositorios de e-prints como los mencionados a propósito de Scirus.

1.3. Live Search Academic

Live Search presenta la única interfaz en el mundode la búsqueda en la Web

que no intenta imitar la de Google.

1.3.1. ContextoAcaba dominando todo o parte del sector. Han llegado tarde. Lo que no sabemos es si acabarán dominado una buena parte del sector.Microsoft es la única empresa del mercado informático que dispone de capacidad tecnológica y financiera suficiente para plantear un desafío creíble. Solamente una lista de fracasos anteriores de Microsoft hace difícil pensar en su liderazgo a medio plazo, pese a los medios de que dispone.

1.3.2. InputsLa lista de inputs es simple: artículos derevistas académicas procedentes de diversaseditoriales y sociedades científicas . Lo que noindica Live Academic es cuántos títulosde estas editoriales incluye, es decir, si incluyetodas sus publicaciones o solamente una parte. Si Microsoft piensa tomar en serio su nuevo motorde búsqueda no hay duda que deberá ampliarsu lista de "publishers" a varias bandas:

editorialesde otros países, pero también mayor número detítulos de cada editorial.

 2. Conclusiones

Hasta hace poco, la Web había demostrado de sobras sucapacidad para actuar como un agente de primer orden.Faltaba el elemento de la ciencia y de la informaciónacadémica. En esta nueva etapa que está abriendo losmotores ninguno de los tres actores haya considerado incluiralguno de los aspectos de la Web semántica .Tal vez se tratede iniciativas ambas demasiado tempranas como para quepuedan pensar en unirse. Será necesario que antes madurencada una de ellas por separado antes de que puedanpensar siquiera en unir esfuerzos. De momento, las evidenciasson muy prometedoras.

4. AgradecimientosEste trabajo ha sido financiado por elMinisterio de Educación y Ciencia(España) como parte del proyectoHUM2004-03162/FILO.

5. Bibliografía Codina, Lluís. (2006). "Motores de búsqueda para usos académicos:

¿Cambio de Paradigma?". ThinkEPI, Enero 2006. [Acceso: http://www.thinkepi.net/repositorio/motores-de-busqueda-para-usos-academicos- ¿cambio-de-paradigma/]

Doldi, L. M.; Bratengeyer, E. (2005). "The web as a free source for scientific information: a comparison with fe-based databases". Online information review, v. 29, n. 4, p. 400-411

Giustini, D.; Barsky, E. (2005). " A look at Google Scholar, PubMed, and Scirus: comparisons and recommendations" JCHLA/JABSC, 26, 2005, P. 85-89. [Acceso: http://pubs.nrc-cnrc.gc.ca/jchla/jchla26/c05-030.pdf ]

Grupo Digidoc. Web semántica y Sistemas de Información Documental. Acceso: http://www.semanticaweb.net/

Jacsó, Peter. Péter's Digital Reference Shelf. December, 2006. [Acceso: http://www.gale.com/reference/peter/ ]

Rovira, Cristòfol; Marcos, Mari-Carmen; Codina, Lluís (2007). "Repositorios de publicaciones digitales de libre acceso en Europa: análisis y valoración de la accesibilidad, posicionamiento web y calidad del código". El Profesional de la Información , v. 16, n. 1, enero-febrero 2007. [Acceso en: http://eprints.rclis.org/archive/00008668/ ]