lydasilva.files.wordpress.com  · Web viewEn estas tareas desempeñan un papel fundamental los...

19
SERVICIO NACIONAL DE APRENDIZAJE SENA RECUPERACION DE INFORMACIÒN LIDA SILVA ACEVEDO Aprendiz TECNOLOGO GESTION BIBLIOTECARIA FABIO ERNESTO TUSO GONZALEZ Instructor

Transcript of lydasilva.files.wordpress.com  · Web viewEn estas tareas desempeñan un papel fundamental los...

Page 1: lydasilva.files.wordpress.com  · Web viewEn estas tareas desempeñan un papel fundamental los lenguajes documentales, las técnicas de resumen, la descripción del objeto documental,

SERVICIO NACIONAL DE APRENDIZAJESENA

RECUPERACION DE INFORMACIÒN

LIDA SILVA ACEVEDOAprendiz

TECNOLOGO GESTION BIBLIOTECARIA

FABIO ERNESTO TUSO GONZALEZInstructor

Bogotà D.C., Mayo de 2015.

Page 2: lydasilva.files.wordpress.com  · Web viewEn estas tareas desempeñan un papel fundamental los lenguajes documentales, las técnicas de resumen, la descripción del objeto documental,

Actividad 1. Ensayo Definición de recuperación de informaciónCordial Saludo para todos, de acuerdo como quedamos para el día 17

realizaremos la lectura y sustentación de sus ensayos relacionados con el

"concepto y  definición de recuperación de información".

Indicaciones generales:

1. Se deben citar cinco autores con sus respectivas definiciones.

2. El ensayo debe tener un número no menor a 5 hojas.

3. Se realizará la sustentación de cada uno de los escritos.

4. Los ensayos deben ser subidos a plataforma una vez sustentados en clase.

Es importante consultar los documentos que he subido a la plataforma la

lectura de los mismos les orientará en el desarrollo del escrito.

RECUPERACION DE INFORMACION

1. LIBRO: INTRODUCCION A LA DUCUMÀTICA

JESUS TRAMULLAS SAZ

Para: JesùsTramullas

La recuperación de información es el conjunto de tareas mediante las cuales

el usuario localiza y accede a los recursos de información que son

pertinentes para la resolución del problema planteado. En estas tareas

desempeñan un papel fundamental los lenguajes documentales, las técnicas

de resumen, la descripción del objeto documental, etc. (CROFT, 1987) Todos

estos factores ya han sido tratados exhaustivamente por la bibliografía

Page 3: lydasilva.files.wordpress.com  · Web viewEn estas tareas desempeñan un papel fundamental los lenguajes documentales, las técnicas de resumen, la descripción del objeto documental,

especializada, por lo que no resulta necesario insistir sobre ellos en este

lugar. Sin embargo, si es necesario recordar, como se ha señalado en la

introducción, que la informatización de estas tareas se engloba dentro del

campo de la Documentación Automatizada o Informática Documental.

Para más información consulte:http://tramullas.com/documatica/3-1.html

2. INTRODUCCION A LA RECUPERACION DE INFORMACIONLAUREANO FELIPE GOMEZ DUEÑAS

La Recuperación de Información

La Recuperación de Información (IR, InformationRetrieval) es el ´área de la

ciencia y la tecnología que trata de la adquisición, representación,

almacenamiento, organización y acceso a elementos de información. Desde

un punto de vista práctico, dada una necesidad de información del usuario,

un proceso de IR produce como salida un conjunto de documentos cuyo

contenido satisface potencialmente dicha necesidad.

Esta ùltima puntualización es de suma importancia, ya que la función de un

sistema de IR no es la de devolver la información deseada por el usuario,

sino ´únicamente la de indicar qué documentos son potencialmente

relevantes para dicha necesidad de información [134]. El ejemplo más

popular de un sistema de recuperación de información es el de los motores

de búsqueda en Internet tales como Google2 , Altavista3 o Yahoo4.

Terminología Básica

Antes de continuar, es necesario introducir algunas definiciones de uso

común. En Recuperación de Información el término documento hace

Page 4: lydasilva.files.wordpress.com  · Web viewEn estas tareas desempeñan un papel fundamental los lenguajes documentales, las técnicas de resumen, la descripción del objeto documental,

referencia, de forma genérica, a la unidad de texto almacenado por el

sistema y disponible para su recuperación. De este modo, dependiendo de la

aplicación o de su ´ámbito de uso, se tratará de artículos de prensa, páginas

web, documentos legales, tesis doctorales, etc., bien completos, bien

particionados. Podemos, por ejemplo, procesar por separado cada uno de

los capítulos de un libro o cada una de las secciones de un documento si

consideramos que su longitud total es excesiva. Por su parte, colección

denota el repositorio de documentos disponible para resolver las

necesidades de información del usuario. Cada una de las unidades léxicas

(palabras) que componen un documento —y por extensión, la colección— se

denomina término. Por su parte, la necesidad de información del usuario,

expresada en términos que el sistema pueda comprender, se denomina

consulta (query).

Asimismo, los resultados obtenidos son, por lo general, ordenados por grado

de similaridad o relevancia respecto a la consulta, introduciendo el concepto

de ordenación (ranking) [203].

El concepto mismo de relevancia merece particular atención, ya que si bien

se habla de la relevancia del documento respecto a la consulta, en un

sentido estricto tal afirmaciòn no es correcta, ya que el usuario juzgará la

relevancia del documento devuelto respecto a su necesidad de información

original, no respecto a la consulta en la que ´esta ha sido reflejada. Se trata,

por tanto, de un concepto con un alto componente de subjetividad.

Recuperación de Información y Sistemas de Bases de Datos

Existen dos grandes tipos de sistemas para el procesamiento de elementos

de información [26,131]: los sistemas de Recuperación de Información y los

sistemas de Bases de Datos. Mientras los sistemas de Bases de Datos están

optimizados para el manejo de datos estructurados con una semántica bien

Page 5: lydasilva.files.wordpress.com  · Web viewEn estas tareas desempeñan un papel fundamental los lenguajes documentales, las técnicas de resumen, la descripción del objeto documental,

definida, los sistemas de Recuperación de Información, por el contrario,

están diseñados para el procesamiento de texto en lenguaje natural,

raramente estructurado y, por lo general, de semántica ambigua. En un

sistema de Bases de Datos el usuario introduce una consulta especìfica

expresada en ´algebra relacional, obteniendo como salida, en forma tabular,

todos los resultados que satisfacen dicho requerimiento sin posibilidad

alguna de error —ya que invalidaría por completo el resultado. Sin embargo,

en el caso de los sistemas de Recuperación de Información los resultados

frecuentemente contienen errores, y no tienen por qué ser completos.

De hecho, el objetivo de un sistema de Recuperación de Información es

maximizar el número de documentos relevantes devueltos a la vez que se

minimiza el número de documentos no relevantes devueltos [131].

3-MOTORES DE RECUPERACIÓN DE INFORMACIÓN : UN ANÁLISIS COMPARATIVO (PARTE II)

MARIA DEL CARMEN MARCOS MORA

Los motores de búsqueda son una de las herramientas más utilizadas para

recuperar información en el web. A diferencia de los directorios o índices

temáticos, los motores cuentan con un robot que recorre la red de forma

automática y almacena la información recogida en una base de datos.

Algunos de ellos se pueden consultar en distintos servidores e incluso

disponen de versiones en varios idiomas. Además de las funciones de

búsqueda propias de los buscadores, ofrecen diversos servicios como

directorio, páginas blancas y amarillas, noticias, etc.

La cobertura varía de unos a otros, aunque todos ellos se basan

principalmente en las páginas web. Como instrumento documental, los

motores reflejan la cadena de información, ya que realizan búsquedas,

Page 6: lydasilva.files.wordpress.com  · Web viewEn estas tareas desempeñan un papel fundamental los lenguajes documentales, las técnicas de resumen, la descripción del objeto documental,

indizan documentos, permiten la consulta por parte del usuario y ofrecen los

resultados de ésta. Todos los aspectos referidos se han analizado en seis de

los buscadores más utilizados internacionalmente.

Motores de recuperación de información : un análisis comparativo (parte II) -

4.RECUPERACIÒN DE INFORMACIÒN: MODELOS, SISTEMAS Y EVALUACIÒN

FRANCISCO JAVIER MARTINEZ MENDEZ

Este capítulo representa una presentación del concepto de recuperación de

información, y del conjunto de diferencias que posee con otras aplicaciones

de laInformática en lo relacionado con la gestión y recuperación de datos. Al

mismo tiempo se exponen los distintos modelos sobre los que se basan los

sistemas que permiten la recuperación de información.

Hacia una definición de la Recuperación de Información.

Resulta cuando menos curioso el hecho de que un concepto tan empleado

como el de recuperación de información presente cierta confusión a la hora

de establecer una definición que lo sitúe adecuadamente dentro del campo

de las Ciencias de la Información. Rijsbergen es el autor que mejor introduce

este problema al considerar que “se trata de un término que suele ser

definido en un sentido muy amplio” [RIJ, 1999]. En realidad, el profuso uso

de este término, al igual que ocurre en otras disciplinas con otros vocablos

que también pueden parecer básicos, ha propiciado que el mismo no se

encuentre bien empleado en muchas ocasiones, ya que unas veces los

autores lo presentan como sinónimo de la recuperación de datos llevada

desde la perspectiva de las base de datos. Otro conjunto de autores

expresan las diferencias que, a su juicio, presentan ambos conceptos (con lo

cual la definición de recuperación de información queda, en cierto modo,

Page 7: lydasilva.files.wordpress.com  · Web viewEn estas tareas desempeñan un papel fundamental los lenguajes documentales, las técnicas de resumen, la descripción del objeto documental,

supeditada a la anterior), un tercer grupo de autores la define de forma muy

genérica sin entrar en mayores consideraciones sobre estas diferencias, y un

cuarto y último grupo pasa de largo sobre este problema, profundizando más

en la explicación de los sistemas de recuperación de información1 (SRI en

adelante).

5. GESTIÓN DIGITAL DE LA INFORMACIÓN: DE BITS A BIBLIOTECAS DIGITALES Y A LA WEB

RICARDO BAEZA YATES

Para este autor, el problema de la recuperación de información se define

como “dada una necesidad de información (consulta + perfil del usuario + ... )

y un conjunto de documentos, ordenar los documentos de más a menos

relevantes para esa necesidad y presentar un subconjunto La Recuperación

y los SRI -4- de aquellos de mayor relevancia”. En la solución de este

problema se identifican dos grandes etapas:

1. Elección de un modelo que permita calcular la relevancia de un documento

frente a una consulta.

2. Diseño de algoritmos y estructuras de datos que implementen este modelo

de forma eficiente.

Baeza-Yates se preocupa especialmente de las estructuras de datos y

métodos de acceso a los mismos, siendo este autor una verdadera

referencia en esta materia. Curiosamente, a la hora de definir la recuperación

de información, en lugar de proponer una definición propia, emplea la

elaborada por Salton: “la recuperación de la información tiene que ver con la

representación, almacenamiento, organización y acceso a los ítem de

información”.

Page 8: lydasilva.files.wordpress.com  · Web viewEn estas tareas desempeñan un papel fundamental los lenguajes documentales, las técnicas de resumen, la descripción del objeto documental,

ENSAYO

RECUPERACION DE INFORMACIÒN

La recuperación de información es realizar varias tareas, localizando y

accediendo a todos los datos que se encuentren en la web relacionado con

lo que estamos investigando; utilizando el lenguaje documental para realizar

las búsquedas por medio de los diferentes buscadores.

Actualmente, gracias a la documentación automatizada registrada en la web

podemos acceder a la recuperación de los datos.

Muy importante tener el dato más relevante del tema que estamos

investigando de ahí partimos para investigar, utilizando los sistemas de

recuperación de la información y las bases de datos, haciendo énfasis en su

relevancia.

Segùn Jesùs Tramullas, la recuperación de información es el conjunto de

tareas mediante las cuales el usuario localiza y accede a los recursos de

información que son pertinentes para la resolución del problema planteado.

Opino que es muy acertada esta afirmación porque actualmente contamos

con muchas herramientas que nos ayudan a buscar de manera certera los

datos que necesitamos y podemos clasificar.

Esta información la encontramos ya almacenada y organizada en la web

mediante el proceso IR (InformationRetrieval) que traduce Recuperación de Información.

Page 9: lydasilva.files.wordpress.com  · Web viewEn estas tareas desempeñan un papel fundamental los lenguajes documentales, las técnicas de resumen, la descripción del objeto documental,

Para Laureano Felipe Gòmez Dueñas, la Recuperación de Información (IR,

InformationRetrieval) es el ´área de la ciencia y la tecnología que trata de la

adquisición, representación, almacenamiento, organización y acceso a

elementos de información. Desde un punto de vista práctico, dada una

necesidad de información del usuario, un proceso de IR produce como salida

un conjunto de documentos cuyo contenido satisface potencialmente dicha

necesidad.

Cuando algún usuario requiera recuperar datos, nosotros como profesionales

de la información le brindamos las herramientas necesarias para que lleve al

éxito su búsqueda.

También contamos con los motores de búsqueda que se encuentran en la

web, entre ellos tenemos: como Google2 , Altavista3 o Yahoo4.

Con éstos buscadores se nos facilita más la ubicaciòn de los datos de lo que

necesitemos puede ser un artículo, un libro, una tesis, una videoconferencia,

un datos específico de algo o de alguien.

Los motores que se encuentran en internet realizan una búsqueda general y

nos puede arrojan millones de datos relacionados con nuestra búsqueda,

relacionando datos e incluso en otros idiomas que nos pueden servir en

nuestra investigación relacionada.

De acuerdo a nuestros datos relevantes podemos realizar varias búsquedas

simultáneas del mismo tema, podemos ayudarle a nuestro usuario con su

búsqueda.

Los datos que se encuentran en la web, son datos que siempre se podrán

recuperar con ayuda de los buscadores y de los motores, nosotros nos

encargamos de tener los datos que más haga relación al tema, persona, etc.

Page 10: lydasilva.files.wordpress.com  · Web viewEn estas tareas desempeñan un papel fundamental los lenguajes documentales, las técnicas de resumen, la descripción del objeto documental,

Por medio de las bases de datos podemos acceder a la parte invisible que se

encuentra en internet.

Los datos relevantes o fiables los podemos introducir directamente o por

medio de interrogantes para tener resultados comparables y verídicos.

Podemos realizar la recuperación por medio de codificaciones e indicios de

no tener claramente los datos más relevantes del tema.

Contamos con varias fuentes por ejemplo las bases de datos bibliográficas,

que tienen información referencial o el texto completo. Los catálogos que

cuentan con todos los documentos existentes en una biblioteca. Los

buscadores y metabuscadores que contienen, organizan e indexan la

información en internet.

La información que se quiera recuperar nos arrojará variedad de contenidos

y de ahí seleccionamos lo que es de nuestro interés, los buscadores o los

motores que utilicemos nos ayudarán con todos los datos, textos, videos,

videoconferencias, etc, que están conectados a nuestra necesidad.

Analizando todos los contextos y definiciones y verificando información

analizo que los gestores de referencia nos permiten articular las bases de

datos bibliográficas y los diversos sistemas de referencias bibliográficas.

Un Gestor de referencias es nuestra base de datos bibliográfica

personalizada que nos brinda la posibilidad de recopilar información de

diversas fuentes ( bases de datos académicas, catálogos de bibliotecas entre

otros recursos) para organizar y crear redes sociales por medio de las cuales

podemos difundir y compartir los resultados de nuestras búsquedas.

Evaluando las determinaciones opino que para la correcta búsqueda de

información debemos hacer lo siguiente:

Page 11: lydasilva.files.wordpress.com  · Web viewEn estas tareas desempeñan un papel fundamental los lenguajes documentales, las técnicas de resumen, la descripción del objeto documental,

-Determinar el objeto de búsquedas o necesidad de información

-Identificar fuentes de información

-Análisis de las opciones de búsqueda

-Selección y evaluación de la información

Podemos usar varias fuentes de información dependiendo de los datos que

necesitamos pueden ser bibliográfica, biográfica, geográfica, cronológica,

legislativa, de localización y general.

Por materia pueden ser generales y especializadas. Por la naturaleza de la

información puede ser textual, numérica, gráfica.

Todas las búsquedas que realizamos y localizamos le hacemos el proceso

de seleccionar los datos que nos interesan para nuestra necesidad.

Cuando se nos presenta la oportunidad de hacer una recuperación de

información, sabemos que contamos con herramientas para realizar la labor

rápido, eficaz, eficiente y con la certeza de haber prestado un buen servicio a

nuestro usuario de la biblioteca unidad de información.

Encontramos formas básicas y más especializadas de realizas las consultas,

de acuerdo a la información que se requiera.

Teniendo en cuenta que de los millones de datos que podemos encontrar en

la web, algunos pueden ser muy verídicos y otros pueden ser algo

relacionados.

Page 12: lydasilva.files.wordpress.com  · Web viewEn estas tareas desempeñan un papel fundamental los lenguajes documentales, las técnicas de resumen, la descripción del objeto documental,

Cuando obtenemos todos los posibles datos significativos con nuestro interés

lo llevamos a que se convierta en conocimiento para nosotros o nuestros

usuarios interesados.

Los contenidos que podemos encontrar están los que se encuentran en la

web, las bases con imágenes digitalizadas y las bases de datos.

El proceso requiere entradas (datos) y las salidas (información), para el uso

de la comunidad en general en cualquier momento.

Toda la información se encuentra generalmente en lenguaje natural.

Algunas herramientas con las que contamos son las imágenes, mapas,

sonidos y presentaciones, para complementar las búsquedas.

Cada día nuestra labor como futuros bibliotecólogos nos exige màs

compromiso y capacitación tecnológica constante para estar a la vanguardia

de los adelantos, para poder estar familiarizados con todas las herramientas

y aplicaciones que podemos utilizar en nuestro entorno, para mejorar nuestro

servicios y atención al usuario.

En conclusión podemos decir que recuperación de información es realizar la

búsqueda de un tema, teniendo como base los datos màs relevantes para

asì realizar la tarea de extraer los documentos relacionados de nuestro

interés, para llevarlo a un conocimiento real del asunto.

Es seleccionar toda la información adquirida y utilizar lo más importante para

nuestro beneficio.

Page 13: lydasilva.files.wordpress.com  · Web viewEn estas tareas desempeñan un papel fundamental los lenguajes documentales, las técnicas de resumen, la descripción del objeto documental,
Page 14: lydasilva.files.wordpress.com  · Web viewEn estas tareas desempeñan un papel fundamental los lenguajes documentales, las técnicas de resumen, la descripción del objeto documental,