Por Que Se Investiga Un Tema

3
08/11/2009 1 ¿Por qué se investiga en un tema? Francisco Delgado del Hoyo, David Zayas Gómez, Juan Alberto Muñoz, David Getino Ferreras Metodología sobre la Investigación – Master Universitario de Investigación en “Tecnologías de la Información y las Comunicaciones”, Universidad de Valladolid Resumen En este documento se analiza el estado del arte en 3 áreas relacionadas con sistemas telemáticos por parte del grupo Musical. Las opiniones han sido recogidas por el portavoz de esta sesión (Francisco Delgado del Hoyo) sintetizando las opiniones particulares de los cuatro miembros del grupo para mostrar la opinión conjunta en cada área. En general se ha recurrido a fuentes digitales (bibliotecas de revistas, Google Scholar, libros, etc.) y se ha intentado relacionar con la teoría de Kuhn. 1. Introducción Antes de comenzar su trabajo de investigación, un científico debe analizar todas las fuentes de información posibles (artículos, libros, grupos, científicos investigadores, etc) para documentarse sobre el estado del arte o estado actual del área en el que va a investigar. Debido al carácter no exhaustivo de este informe y a que actualmente la mayoría de información se encuentra digitalizada hemos recurrido, además de aportar nuestros conocimientos y los comentarios de aula, sobre todo a estas bibliotecas digitales científicas: Web Of Knowledge: www.accesowok.fecyt.es Google Scholar: scholar.google.com Esta tarea ayuda a enmarcar el trabajo a realizar dentro de un contexto global, aporta un nuevo punto de vista de los problemas resueltos y muestra los retos y líneas de investigación dentro de un área científica. Se investiga lo que serían los paradigmas y reglas de la ciencia según la teoría de Kuhn. En este documento vamos a analizar el estado en 3 temas propios de los sistemas telemáticos: en la sección 2 sobre las jerarquías de memoria, en la sección 3 explotación de paralelismo a alto nivel y en la 4 software basado en servicios y “cloud computing”. Finalmente se recogen todas las referencias utilizadas para formar una opinión en las secciones anteriores. 2. Jerarquía de memoria La velocidad de los procesadores, en relación con la de la memoria, ha crecido en los últimos años un factor de 1000:1. Esto plantea lo que se llama el ‘GAP’ entre memoria y procesador [3]. Para poder avanzar en la computación es imprescindible continuar investigando formas de acceder en menos tiempo a la memoria, normalmente creando nuevas jerarquías de memoria [1]. Además el auge de las arquitecturas multiprocesador hace necesarios nuevos caminos para aprovechar el acceso concurrente [2][4]. Las líneas de investigación actuales tratan de acercar el comportamiento de la memoria humana a las máquinas, para resolver problemas o comportamientos que son sencillos para los humanos, pero extremadamente complejos para las máquinas. Atendiendo a los resultados de búsquedas de publicaciones es un campo de activa investigación, aunque no es un campo clave. En el año 2008 se publicaron unos 2000 artículos sobre jerarquía de memoria, lo cual demuestra que es un tema de interés actual. 3. Entornos de desarrollo, conversión de algoritmos y compiladores, en relación con el paralelismo a alto nivel La misma ciencia normal que ha aceptado que los sistemas distribuidos son una buena solución a los problemas de capacidad de cómputo, está avanzando gracias a la paralelización. Existen soluciones que permiten paralelización a alto nivel, pero no existen soluciones para la paralelización automática de software secuencial [9]. Aquí sería donde más piezas del puzzle quedan por resolver, y por eso se investiga [8]. Actualmente hay diferentes puntos desde los que abordar la solución a este problema. En este sentido existen proyectos importantes en esta

Transcript of Por Que Se Investiga Un Tema

Page 1: Por Que Se Investiga Un Tema

08/11/2009 1

¿Por qué se investiga en un tema?

Francisco Delgado del Hoyo, David Zayas Gómez, Juan Alberto Muñoz, David Getino Ferreras Metodología sobre la Investigación – Master Universitario de Investigación en “Tecnologías de la Información y las

Comunicaciones”, Universidad de Valladolid

Resumen

En este documento se analiza el estado del arte en 3 áreas relacionadas con sistemas telemáticos por parte del grupo Musical. Las opiniones han sido recogidas por el portavoz de esta sesión (Francisco Delgado del Hoyo) sintetizando las opiniones particulares de los cuatro miembros del grupo para mostrar la opinión conjunta en cada área. En general se ha recurrido a fuentes digitales (bibliotecas de revistas, Google Scholar, libros, etc.) y se ha intentado relacionar con la teoría de Kuhn.

1. Introducción

Antes de comenzar su trabajo de investigación, un científico debe analizar todas las fuentes de información posibles (artículos, libros, grupos, científicos investigadores, etc) para documentarse sobre el estado del arte o estado actual del área en el que va a investigar. Debido al carácter no exhaustivo de este informe y a que actualmente la mayoría de información se encuentra digitalizada hemos recurrido, además de aportar nuestros conocimientos y los comentarios de aula, sobre todo a estas bibliotecas digitales científicas:

• Web Of Knowledge: www.accesowok.fecyt.es

• Google Scholar: scholar.google.com Esta tarea ayuda a enmarcar el trabajo a realizar dentro de un contexto global, aporta un

nuevo punto de vista de los problemas resueltos y muestra los retos y líneas de investigación dentro de un área científica.

Se investiga lo que serían los paradigmas y reglas de la ciencia según la teoría de Kuhn. En este documento vamos a analizar el estado en 3 temas propios de los sistemas telemáticos: en la sección 2 sobre las jerarquías de memoria, en la sección 3 explotación de paralelismo a alto nivel y en la 4 software basado en servicios y “cloud computing”. Finalmente se recogen todas las referencias utilizadas para formar una opinión en las secciones anteriores.

2. Jerarquía de memoria

La velocidad de los procesadores, en relación con la de la memoria, ha crecido en los últimos años un factor de 1000:1. Esto plantea lo que se llama el ‘GAP’ entre memoria y procesador [3]. Para poder avanzar en la computación es imprescindible continuar investigando formas de acceder en menos tiempo a la memoria, normalmente creando nuevas jerarquías de memoria [1]. Además el auge de las arquitecturas multiprocesador hace necesarios nuevos caminos para aprovechar el acceso concurrente [2][4].

Las líneas de investigación actuales tratan de acercar el comportamiento de la memoria humana a las máquinas, para resolver problemas o comportamientos que son sencillos para los humanos, pero extremadamente complejos para las máquinas.

Atendiendo a los resultados de búsquedas de publicaciones es un campo de activa investigación, aunque no es un campo clave. En el año 2008 se publicaron unos 2000 artículos sobre jerarquía de memoria, lo cual demuestra que es un tema de interés actual. 3. Entornos de desarrollo, conversión de algoritmos y compiladores, en relación con el

paralelismo a alto nivel

La misma ciencia normal que ha aceptado que los sistemas distribuidos son una buena solución a los problemas de capacidad de cómputo, está avanzando gracias a la paralelización. Existen soluciones que permiten paralelización a alto nivel, pero no existen soluciones para la paralelización automática de software secuencial [9]. Aquí sería donde más piezas del puzzle quedan por resolver, y por eso se investiga [8]. Actualmente hay diferentes puntos desde los que abordar la solución a este problema. En este sentido existen proyectos importantes en esta

Page 2: Por Que Se Investiga Un Tema

08/11/2009 2

área: compiladores [5] y lenguajes de programación [6]. Este tema es de obligada investigación debido al auge de las máquinas multiprocesador domésticas (motivadas por el problema de la frecuencia y la elevada capacidad de integración de los semiconductores) que obliga a desarrollar software que aproveche esta arquitectura, para lo que es imprescindible usar compiladores y entornos de desarrollo nuevos [7]. No hay duda de que la productividad en software es un problema actualmente y los entornos de desarrollo pretenden solventar este problema.

Sobre los entornos de desarrollo hay artículos relacionados con más de 800 citas. Los resultados de las búsquedas sugieren una actividad mayor que para la jerarquía de memoria. En los últimos años la producción investigadora permanece constante. Su evolución nos muestra un cierto estancamiento, debido probablemente a la dificultad de avance, pero es un campo que necesariamente ha de tener mucho futuro. No se trata de una moda sino de una necesidad.

4. Software basado en servicios y “cloud computing”

Los servicios son la base de la Web 2.0 y los 'mushups' (integración de servicios) son un tema de investigación activo. Estos campos están de moda. Son términos que en investigación se denominan “buzzword” (palabra que hace ruido, que se oye). Esta área de los sistemas telemáticos plantea la posibilidad de un cambio de paradigma de desarrollo para grandes sistemas distribuidos, el software basado en servicios, donde podría alquilarse un servicio (computación, almacenamiento) por el tiempo usado en lugar de adquirirlo e infrautilizarlo. Es un área de activa investigación actualmente en Telefónica I+D. Todo esto explica el porqué se investiga en este tema ya que es comercialmente una importante fuente de ingresos.

La investigación en “cloud computing” era el siguiente paso natural de los sistemas telemáticos, tras el olvido del “grid computing”, del cual podemos considerarlo sucesor. El “cloud” puede verse como un solo sistema físico donde la red se multiplexa interconectando múltiples servidores, de modo que la ubicación geográfica de la ejecución del código pueda ser cualquiera [10]. Es un tema de innovación (investigación aplicada a la industria) porque hay empresas que están empezando a enfocar todos sus esfuerzos hacia el SaaS (Software as a Service) donde ven sus aplicaciones como servicios que se pueden comercializar. La mayoría de documentación está etiquetada con los logotipos de grandes marcas donde se alaban los beneficios del SaaS [11]. Han sido el crecimiento del ancho de banda, la estandarización y el desaprovechamiento de recursos computacionales los que han hecho que este tema de investigación sea original, significativo y realizable.

El estado actual de popularidad (expectativas) de este tema es muy alto (“buzzword”) lo que se aprecia en que en una búsqueda en un motor de búsqueda aparecen millones de resultados. En cuanto a la investigación, hemos encontrado más de 100 artículos de nueva creación en los últimos 2 años, la mayoría sin citas aún (sólo la mitad de los artículo se han publicado en los últimos 3 años). Su futuro dependerá en gran medida de los intereses comerciales de las empresas y de la evolución del mercado. Muchos de estos artículos sólo intentan definir lo que es "cloud computig" ya que es un concepto tan nuevo que sus límites aún no están bien definidos. Por ejemplo, el artículo conceptual sobre la Web 2.0 y la comercialización de servicios de T.O`Reilly [12] ha sido citado más de 1400 veces. La elevada producción científica en este tema puede verse por ejemplo en el número de citas del artículo de Berkeley [13] de este mismo año: 72. Esto nos indica que al menos se han realizado 72 artículos más relacionados con este tema.

Según la teoría de Kuhn, estaríamos ante el inicio de un cambio en un paradigma ya existente (“grid computing”) en respuesta a las nuevas necesidades de las empresas en cuanto a computación, orientando el software para provisión de servicios sin limitaciones computacionales.

Page 3: Por Que Se Investiga Un Tema

08/11/2009 3

5. Referencias [1] Instituto de investigación en ingeniería de Aragón: i3a.unizar.es/grupos.php?ver=GAZ [2] Jerarquías de memoria en sistemas multiprocesador: www.pixelbeat.org/docs/memory_hierarchy [3] Gap entre memoria y procesador: www.cl.cam.ac.uk/research/dtg/lce-pub/public/files/tr.2001.4.pdf [4] Impacto de la jerarquía de memoria en multicomputadores: www.cs.virginia.edu/papers/00760435.pdf [5] DryadLINQ: lenguaje de alto nivel para computación paralela: research.microsoft.com/en-us/projects/dryadlinq/dryadlinq.pdf [6] Data Parallel Haskel: http://www.cs.cmu.edu/~damp/finalPapers/chakravarty.pdf [7] Proceedings, Parallel computing: www.csc.villanova.edu/~mdamian/csc3990/csrs2007/CSRS2007-Proceedings.pdf [8] Panorama de investigación en computación paralela: citeseerx.ist.psu.edu/viewdoc/download?doi=10.1.1.67.8705&rep=rep1&type=pdf [9] Paralelización automática mediante entornos de desarrollo: citeseerx.ist.psu.edu/viewdoc/download?doi=10.1.1.126.8039&rep=rep1&type=pdf [10] Cloud computing (ACM): bit-player.org/bph-publications/CACM-2008-07-Hayes-cloud.pdf [11] Software as a service (IDM): www-304.ibm.com/jct01005c/isv/marketing/saas/innovative.pdf [12] What is Web 2.0: Design patterns and business models for the next generation of

software, T. O`Reilly [13] Above the clouds: A berkeley view of cloud computing, M Armbrust, A Fox, R Griffith, AD Joseph, - EECS Department, University of California, Berkeley