3m 8ago11E-investigación bibliográfica: Web 2.0 y 3.0, teoría y práctica
Click here to load reader
-
Upload
e-investigacion-bibliografica-fcunam -
Category
Documents
-
view
2.715 -
download
2
description
Transcript of 3m 8ago11E-investigación bibliográfica: Web 2.0 y 3.0, teoría y práctica
Layla MichánDepartamento de Biología Comparada
E-investigación
bibliográfica:
Web 2.0 y 3.0, teoría y
práctica
INFORMACIÓNCIENTÍFICA(Literatura)
TIPOS1.científica
2.Bibliográfica
3.Institucional
ÁREAS1.Biodiversidad
2.Biomedicina
APLICACIONES1.Análisis de la ciencias biológicas actuales: desarrollo, dinámica, estructura, relaciones y tendencias
2.Información e informática en ciencias , relacionadas y afines
3.Obtención de nuevo conocimiento científico
4.Planeación, evaluación, gestión y política científica
PROBLEMAS1. (R)evolución digital en las ciencias
2. Características de la E-ciencia
3. Dinámica, estructura y relaciones de la ciencia reciente
4. Publicación científica en la Web
5. Recursos web y ciberinfraestructura para ciencia
6. Colecciones de datos
7. Meta-análisis de literatura: bibliometría, análisis de redes,
minería de textos, semántica
ENFOQUE MULTIDISCIPLINARIO1.Ciencia
2. Ciencias de la información y
documentación
3. Tecnologías de la Información y
comunicación
4.Ciencias de la computación e informática
5.Historia, sociología, filosofía y
comunicación de la ciencia
Laboratorio de Cienciometría, Información e Informática en Ciencias Biológicas
Facultad de Ciencias, UNAM
1. Objeto
2. Proceso
3. Producto
Meta-análisis
Manejo
Recuperación
Búsqueda
Métodos
Análisis de las
Ciencias Biológicas
Impacto de la
revolución digital en
biología
Difundir
• Estructura
• Desarrollo
• Tendencias
• Métodos
• Patrones
• Relaciones
Herramientas electrónicas
Bibliometría
Análisis de redes
Minería de textos
Semántica
Teorías
Enfoques actuales
RetosPerspectivas
Información, informática
y cienciometría
para el estudio del
envejecimiento
(Re)evolución de la información
• Diseño de las computadoras, aparición del Internet masificación de la web.
• Formato digital: bajo costo, poco espacio.
• Explosión de la información.
• Desapareció la distinción entre escribir y publicar, se volvió un proceso simultáneo.
• Gran cantidad de colecciones de datos .
• Dinámica: cambia, está en modificación constante, tanto el contenido como los formatos.
• Masiva
• Democrática: Cualquiera puede publicar información sin revisión o edición
Contenido
• Introducción
– La Web 2.0 y 3.0
• Seis grados de separación es una teoría que intenta probar que cualquiera en la Tierra puede estar conectado a cualquier otra persona del planeta a través de una cadena de conocidos que no tiene más de cinco intermediarios (conectando a ambas personas con sólo seis enlaces) o más popularmante que "el mundo es un pañuelo". La teoría fue inicialmente propuesta en 1930 por el escritor húngaro Frigyes Karinthy en un cuento llamadoChains. El concepto está basado en la idea de que el número de conocidos crece exponencialmente con el número de enlaces en la cadena, y sólo un pequeño número de enlaces son necesarios para que el conjunto de conocidos se convierta en la población humana entera.
• Según esta teoría, cada persona conoce de media, entre amigos, familiares y compañeros de trabajo o escuela, a unas 100 personas. Si cada uno de esos amigos o conocidos cercanos se relaciona con otras 100 personas, cualquier individuo puede pasar un recado a 10.000 personas más tan sólo pidiendo a un amigo que pase el mensaje a sus amigos.
LA WEB
E-ciencia
Efecto 10X
• En la industria de TI, la tecnología y el uso evoluciona más rápido que tal vez en cualquier otra industria.
• Como regla general, los sistemas pueden crecer 10 veces en su actual arquitectura o paradigma, entonces debe ser rediseñado.
• Este efecto hace que las tecnologías de 10X de edad para convertirse en los obsoletos y los nuevos que surjan.
Ley de Moore
• Describe el número de transistores que pueden caber en un circuito integrado.
• Se duplica aproximadamente cada 18 meses.
• La Internet se duplicará en tamaño cada 5. 32 años.
Teoría de la evolución tecnológica
•
Según Richta y más tarde Bloomfield, [1] [2]
• La tecnología (que Richta define como "una entidad material creado por la aplicación de un esfuerzo mental y físico de la naturalezacon el fin de alcanzar un cierto valor") se desarrolla en tres etapas: herramientas,máquina , La automatización.
• Esta evolución, dice, sigue dos tendencias: la sustitucióndeltrabajo físico, con más trabajo intelectual eficaz y el resultado del grado mayor decontrol sobre el medio ambiente natural, incluyendo la capacidad para transformarmaterias primas en productos cada vez más complejo y flexibl
LA WEB
E-ciencia
Cloud computing (cómputo en nube)Es un enfoque transformador de la computación que involucra
muchos aspectos, entre los que se incluyen:algoritmos a gran escala que se ejecutan en diversos conjuntos de
datos (estructurados, semi-estructurados y no estructurados),
almacenados en grandes equipos con enormes cantidades de datos de enorme,
utilidades basadas en la rápida provisión de recursos informáticos personalizados, y la web ubicua con aplicaciones accesibles desde cualquier lugar.
Sin embargo, es mucho más que lo que la tecnología promete: transformar radicalmente nuestra manera de interactuar con la información.
Ecosistemas digitales• En el mundo de Internet, el rápido crecimiento y el uso exponencial de
los medios digitales ha dado lugar a la aparición de
entornos virtuales denominados ecosistemas digitales.
• Están integrados por varias entidades independientes, como: individuos,
organizaciones, servicios, software y aplicaciones para
compartir una o varias misiones y centrarse sobre las interacciones e
interrelaciones entre ellos.
• Permiten la auto-organización de los ambientes, gracias a la
recombinación y la evolución de sus "componentes digitales", en
los que los recursos proporcionados
por cada entidad están bien conservadas y son factibles de gestionar y
utilizar en conjunto.
• Debido a la naturaleza multidisciplinar de los ecosistemas digitales
y sus características, son muy complejos para el estudio y diseño.
http://130.102.71.54/medes
¿Qué son los Ecosistemas digitales?
Formados por entidades múltiples e independientes:
• individuos• organizaciones• servicios• software • aplicaciones para compartir
En el mundo del Internet, constantemente
hay un crecimiento rápido y exponencial
usando los medios digitales
Ambiente virtuales
Ecosistemas digitales
Interacciones e interelaciones entre equipos
Exhiben ambientes virtuales, gracias a la re-combinación y evolución de sus
―componentes virtuales‖
La aplicación de las Tecnologías de la información puedenser mejoradas a través de técnicas novedosas, modelos y metodologías para cada archivo como:
Soporta la estabilidad de los ecosistemasdigitales y el manejo de sus recursos
• la gestión de datos• tecnologías Web• redes• seguridad• interacciones computadora-humano• inteligencia artificial• e-servicios• sistemas de auto-organizaciónComprenden:
•manejo de datos•servicios innovadores•inteligencia computacional•plataformas de auto-organización
Cómputo en grid• No hay otro gran avance tecnológico ha
demostrado el poder de los individuos de
más de grid computing.
• Al donar su tiempo en la computadora sin
usar, puede empezar a cambiar
el mundo para mejor.
Empezar es fácil! Simplemente haga
clic aquí para unirse a la World Community
Griden la actualidad.
World Community Grid• La computación grid se une a muchos equipos individuales, creando un gran
sistema con el poder computacional masivo que supera con creces el poder
de un puñado de superordenadores. Debido a que el trabajo se divide en
trozos pequeños que se pueden procesar simultáneamente, se reduce el tiempo de
investigación de años a meses. La tecnología también es más rentable, lo que
permite un mejor uso de los fondos de crítica.
• Cambiando nuestro mundo ahora. La computación grid no es
una tecnología futurista.
• World Community Grid está trabajando en este momento la aplicación
de esta tecnología a los proyectos de investigación que puede beneficiar a todos
nosotros.
• Nuestro primer proyecto, Pliegue del Proteoma Humano, es la identificación de las
proteínas producidas por los genes humanos. Con esta información, los científicos
pueden entender cómo los defectos en las proteínas pueden
causar enfermedades, por lo que es más fácil para encontrar la cura.
• En 2003, con la computación grid, en menos de tres meses los
científicos identificaron44 posibles tratamientos para combatir la enfermedad mortal
viruela. Sin la red, el trabajo se ha tomado más de un año en completarse.
• Páginas electrónicas
• Portales (sitios web)
• Motores de bùsqueda
• Metabuscadores
• Correo electrónico
• Chats
• Alertas
• Listas de discusión
• Blogs
• Redes sociales
• Wikis
• Folksonomias (social bookmarking)
• Weminarios
• Web feed
Web 1.0
2000
Web 2.0
2003
Diferencias
•Tecnológicas
•Estructurales
•Filosóficas
•Sociológicas•Comunidades (conexiones
entre usuarios)
•Actualización constante
•Intercambiar contenido
•Compartir
•Cargar
•Creadores (contenido)
•Democrático
•Se combina información de
diferentes bases de datos
•Etiquetas
•Ratings
•Consumidores
(contenido)
CompartirEtiquetar
ClasificarPublicar
1. Explorar
2. Buscar
3. Marcar
4. Actualizar
5. Manejar
6. Analizar
7. Compartir
FácilesAplicaciones
Web
Amigables
Funciones
Web 2.0 y 3.0:
El proceso
E-investigación bibliográfica en la
Web• Explorar
– Personalizar: complementos
• Buscar– Buscadores, metabuscadores, colecciones
• Guardar– Marcar, compartir, etiquetar
• Actualizar– Automatizar: RSS y lectores de feeds: automatizar
• Sistematizar– Manejar, citar, compartir
• Difundir– Redes sociales
• Meta-análisis
Navegar
BuscarRecomendación
Selección Recuperación
Lectura
Comentar
CitarReferencias
PUBLICACIÓN
Guardar
Obtener
metadatos
1
7
3
45
6
2
Meta-análisisBibliometría
Análisis de redes
Descubrimiento Basado en Literatura
Comentar
PDFs
Acrobat
PDF Exchange*
COLECCIONES DE
DATOS
Bases de datos
Sistemas de
información
Proveedores
Citar mientras
escribo
1/100
Marcadores
Google marcadores y
block
Folkosomias
Delicious
Citeulike
Gestores de
bibliografíaGestores de
bibliografía
Endnote
Refworks
Mendeley*
Zotero
Citeulike*
HTLM
TXT
Alertas
Correos electrónicos
Listas de discusión
Agregadores
Navegadores
Google, Bing
Ciberinfraestructura
http://www.victorinox.ch/
Herramientas electrónicas
•Programas
•Aplicaciones
•Recursos
•Utilidades
•Herramientas
•Servicios
•Complementos (gadgets y plugins)
Recursos Web 2.0
Marcadores/Guardar etiquetar
Manejador
bibliografíaca
Marcador
bibliografía
Marcador web
Marcador
imágenes
Library
Torres-Salinas, D. and E. Delgado-López-Cózar (2009, September). Estrategia para mejorar la difusión de los resultados de
investigación con la web 2.0. El Profesional de la Informacion 18 (5), 534-539.
Redes sociales/Marcar compartir
Varios
Barra de herramientas de Google
Vista Previa Interclue
Delicious
Interclue
Xmarks
Zotero
Mendeley
Delicious
CiteUlike
Visualizeus
Publish or perish
Torres-Salinas, D. and E. Delgado-López-Cózar (2009, September). Estrategia para mejorar la difusión de los resultados de
investigación con la web 2.0. El Profesional de la Informacion 18 (5), 534-539.
Recursos Web 2.0
Meta-análisis
• Simultáneo al desarrollo de ciencias de lainformación (CI) y las tecnologías la información yla comunicación (TICS), en especial con eldesarrollo de las bases de datos y la Internet, sehan producido formas sistémicas de análisis decantidades colosales de información (terabites).
• Técnica cuantitativa que usa medicionesespecíficas para indicar la fuerza (tendencias) derelaciones variables en los estudios incluidos en elanálisis. La técnica enfatiza los resultados entremúltiples estudios en oposición a los resultadosobtenidos de una sola investigación.
• La Web semántica (del inglés semantic web) es la "Web de los datos".1 Se basa en la idea de añadir metadatos semánticos y ontológicos a la WorldWide Web. Esas informaciones adicionales —que describen el contenido, el significado y la relación de los datos— se deben proporcionar de manera formal, para que así sea posible evaluarlas automáticamente por máquinas de procesamiento. El objetivo es mejorar Internet ampliando la interoperabilidad entre los sistemas informáticos usando "agentes inteligentes". Agentes inteligentes son programas en las computadoras que buscan información sin operadores humanos.
Chilibot
Relaciones entre un subconjunto de genes afectados por el tratamiento con
cocaína.
Web 2.0
Artículos de vanguardia
Marcar
Compartir
cBuscar
Calificar
Rankingc
Comentar
XMLXML, siglas en inglés
de eXtensible Markup Language ('lenguaje
de marcas extensible'), es
un metalenguaje extensible de etiquetas
desarrollado por el World Wide Web
Consortium (W3C).
http://www.personalizemedia.com/garys-social-media-count/
Metrics
MENDELEY
Library
Statistics
III Meta-analisis•Scientometrics
•Network Analysis
•Text mining
•Semantics
Web
Browsers
Metabrowser
s
web browsers
specializedEditors
SuppliersSearch
Bookmark
Browse
Share
II Colecciones bibliográficasI Aplicaciones Web
Repositories
Indexes and catalogs
Information systems
Manage
Libraries
Colecciones/Sistematizar
Colecciones bibliográficas
Repositorios
Editoriales y revistas
Catálogos e índices
Sistemas de información
E-bibliotecas
La Web 2.0 (Social)
• Se centra en la capacidad de las personas para colaborar y compartir información en
línea.
• Transición de la Web estática a una dinámica, que es más organizada.
• Comunicación abierta con un énfasis en comunidades de usuarios e intercambio de
información.
• Ya no sólo se trata de ofrecer la posibilidad de encontrar información, sino de
lograr objetivos específicos, pues es factible, crear, etiquetar jerarquizar y compartir
datos.
• Lenguaje HTLM
Web 3.0 (Semántica)
• Basada en la idea de añadir metadatos semánticos e información (a través de
mapas
• cognitivos).
• Desarrollar nuevos sistemas de interoperabilidad que permitan interpretar
• metadatos para adaptarse a las acciones de los usuarios .
• Minería de textos y ontologías
• Lenguajes: XML (etiquetas) y RDF (metadatos)
Propósitos
1. Recuperación de información.
2. Obtención de nuevo conocimiento.
3. Evaluación.
4. Análisis, desarrollo, estructura y relaciones
de la dinámica científica.
Entomology
Resultados de la
encuesta: conjunto de datos más
grande analizados
http://www.kdnuggets.com/2011/05/largest-dataset-analyzed.html
Meta-análisis para PubMed
META-ANALISIS
Bibliometría Análisis de Redes
Text Mining
Bibliometría para
artículos
Bibliometría para consultas
Búsqueda
Tendencias
Bibliometría para dominios
1
10
100
1000
10000
100000
1864
1870
1876
1882
1888
1894
1900
1906
1912
1918
1924
1930
1936
1942
1948
1954
1960
1966
1972
1978
1984
1990
1996
2002
log
Do
cu
men
tos
SCI Periodica
SCI Biosis
CAB Scopus
ZR
Bibliometría para colecciones
Taxonomía AL
0
10
20
30
40
50
60
70
80
90
100
Bio
l Evolu
t
Zoolo
ogía
Eco
l y cien
c amb
Cien
c bio
log
Anat y
morf
Botàn
ica
Paleo
nto
logía
Bio
l mar y
acuát
Bio
div
y co
nserv
Gen
ética y h
erencia
Parasito
logía
Bio
l repro
d
Fisio
logía
Enfer in
fecc
Forestal
Agricu
ltura
Boquím
y b
iol m
ol
%Biosis
ZR
CAB
SCI
Periódica
Taxonomía América Latina
Taxonomía AL
Bibliometría para colecciones
Bibliometría para países/regiones
Redes para
obtención de nuevo
conocimiento
Fig. 2. Co-word space of the top 50 highly frequent and bursty words used in the top
10% most highly cited PNAS publications in 1982-2001.
Redes para
palabras
Chilibot
Relaciones entre un subconjunto de genes afectados por el tratamiento con
cocaína.
Redes para el
conocimiento
Bibliometría para el conocimiento
0
500
1000
1500
2000
2500
3000
19
00
19
05
19
10
19
15
19
20
19
25
19
30
19
35
19
40
19
45
19
50
19
55
19
60
19
65
19
70
19
75
19
80
19
85
19
90
19
95
20
00
20
05
Escherichia (94873)
Drosophila (48989)
Saccharomyces (27549)
Arabidopsis (18094)
Zea (7636)
Neurospora (6640)
Dictyostelium (6191)
Chlamydomonas (5646)
Caenorhabditis (5353)
Schizosaccharomyces (3183)
Danio (973)
Año
Docu
men
tos
0
100
200
300
400
19
40
19
45
19
50
19
55
19
60
19
65
19
70
19
75
19
80
19
85
19
90
19
95
20
00
20
05
Neurospora (6640)
Dictyostelium (6191)
Chlamydomonas (5646)
Caenorhabditis (5353)
Schizosaccharomyces (3183)
Danio (973)
Año
Docu
men
tos
Modelos en Biomedicina SCI
web semántica
La Web semántica
• (del inglés semantic web) es la "Web de los datos".1
• Se basa en la idea de añadir metadatos semánticos y ontológicos a la WorldWide Web.
• Esta información adicional —que describen el contenido, el significado y la relación de los datos— se deben proporcionar de manera formal, para que así sea posible evaluarlas automáticamente por máquinas de procesamiento.
• El objetivo es mejorar Internet ampliando la interoperabilidad entre los sistemas informáticos usando "agentes inteligentes". Agentes inteligentes son programas en las computadoras que buscan información sin operadores humanos.
Tim Berners-Lee, el creador de la
idea, la expresó de la siguiente
manera:
"Mi sueño es una Web en la que las
máquinas sean capaces de analizar
todos los datos –contenido, enlaces
y transacciones entre la gente y los
ordenadores–. La 'Web Semántica',
que haría esto posible, está todavía
por llegar, pero cuando llegue, la
rutina de nuestras compras,
burocracia y vida diaria será
gestionada por máquinas hablando
con máquinas. Los 'Agentes
Inteligentes' que han sido
anunciados durante décadas se
harán por fin realidad".
Interoperatibilidad
La interoperabilidad es la propiedad de un producto o
sistema, cuyas interfaces se conocen por
completo, para trabajar con otros productos o sistemas,
presentes o futuros, sin ningún tipo de acceso
restringido o de ejecución.
Estándares
• XML (eXtensible Markup Language)
• RDF (Resource Description Framework)
• SPARQL (an RDF Query Language)
XMLXML, siglas en inglés
de eXtensible Markup Language ('lenguaje
de marcas extensible'), es
un metalenguaje extensible de etiquetas
desarrollado por el World Wide Web
Consortium (W3C).
Ontologías taxonomía
• Una ontología es una manera formal de representar el conocimiento en el que los conceptos son descritos por su significado y su relación con los demás.
• Se asignan identificadores únicos que se asocian con cada concepto en ontologías biológicas (bio-ontologías) puede ser utilizada para enlazar información de diversas bases de datos.
http://richard.cyganiak.de/2007/10/lod/lod-datasets_2010-09-22_colored.html
Dublin Core Metadata Element
Set (DCMES)
• 15 elementos de meta-datos básicos.
Retos actuales
• Una nueva cultura (informática)
• La explosión de la cantidad y diversidad de herramientas digitales (Web)
• Colaboración
• Estándares
• Colecciones
• Normalización
• Semántica (Ontologías)
• Nube
• Acceso Abierto
• Derechos de Autor (Plagio)
• Nuevas especialidades
http://biiiogeek.blogspot.com/
• Esta investigación se lleva a cabo
gracias al financiamiento de:
• DGAPA, UNAM. Proyecto PAPIME PE
201509
• CONACYT, Ciencia Básica. Proyecto
13276 2011-2014.
Licencia Creative
Commons
http://creativecommons.org/licenses/by/3.0/deed.es_GT
Michán, L. 2011. Presentación
Forma de citar este trabajo