Sisobserver n6

77

description

The sixth issue of SiSOBserver journal whose main aim is to share knowledge about the project.

Transcript of Sisobserver n6

Page 1: Sisobserver n6
Page 2: Sisobserver n6

2

Editor: Beatriz BarrosExecutive Editor: Inés MéndezAssistant Edition: Ana RodríguezPlace of edition: MálagaPublishing Entity: Departamento de Lenguajes y Ciencias de la Computación de la Universidad de MálagaISSN: 2174-7911

Collaborators: • Universidad de Málaga• Consejería de Economía, Innovación y Ciencia de la Junta de Andalucía• Universität Duisburg-Essen• Institute for Research Organization, Hungarian Academy of Sciences• Frontiers Research Foundation• Fondazione Rosselli• Red de Indicadores de Ciencia y Tecnología• University of Ljubljana• Universidad de Granada

Template courtesy of designfreebies.org (www.designfreebies.org)

Editor: Beatriz BarrosEditor ejecutivo: Inés MéndezAsistente de Edición: Ana RodríguezLugar de edición: MálagaEntidad editora: Departamento de Lenguajes y Ciencias de la Computación de la Universidad de MálagaISSN: 2174-7911

Colaboradores: • Universidad de Málaga• Consejería de Economía, Innovación y Ciencia de la Junta de Andalucía• Universität Duisburg-Essen• Institute for Research Organization, Hungarian Academy of Sciences• Frontiers Research Foundation• Fondazione Rosselli• Red de Indicadores de Ciencia y Tecnología• University of Ljubljana• Universidad de Granada

Plantilla cortesía de designfreebies.org (www.designfreebies.org)

2

SISOB Consortium 2011-2013. The SISOB project is supported by the European Commission, call FP7-SCIENCE-IN-SOCIETY-2010-1, as a Collaborative Pro-ject under the 7th Framework Programme, Grant agreement no.: 266588

Page 3: Sisobserver n6

BilingualJournal

WELCOME TO

CONTENT4 Welcome

6 Interview with: Francisco Triguero

14 Analysis of high impact research in the biotechnology scientifi c fi eld and its effects on microblogging social media: a case study

20 Knowledge sharing international case in the fi eld of software development (Main Path Analysis)

28 Knowledge sharing example cases from Germany

42 Knowledge trajectories and role patterns

62 Workshop of SiSOB Project

70 Sixth SISOB Project meeting in Duisburg

74 The Globarl Registry of Research Data Repositories

76 Dissemination

CONTENIDO5 Bienvenida6 Entrevista a Francisco Triguero16 Análisis de investigación de gran

impacto en el área de la biotecnología y sus efectos en redes sociales de microblogging: estudio de caso

20 Caso de estudio internacional sobre intercambio de información en el campo del desarrollo de software (Análisis de la Ruta Principal)

28 Ejemplo de casos de estudio de Alemania sobre el intercambio de información

42 Trayectorias de Conocimiento y patrones funcionales

62 Workshop del Proyecto SiSOB70 Sexta reunión plenaria del Projecto

SISOB74 The Global Registry of Research Data

Repositories76 Dissemination

3

Page 4: Sisobserver n6

4

WELCOME TO SISOBSERVERDear Readers,

We come back again to offer you a new issue of SiSOBserver. This time, however, is turn to join presentation and farewell. For three years, we have sought to live up to the commitment we entered into with our followers and maintain the identity of the SiSOB project regarding this journal format and the contents offered over the six issues of SiSOBserver.

We have attempted to collect and develop the most innovative contents in connection with the subject as well as others which were of interest to us or our readers. Thus, SiSOBserver has maintained two main sets of issues throughout its three years of life: one linked to the job done for the SiSOB project, and the other which has been the result of various trends with a signifi cant role in the development of the project.

Thus, we have shown the results obtained over the course of the project in combination with those achieved as the result of the interaction between our partners, especially in relation to the study cases and the SiSOB tool. On the other hand, we have been part of and also reported the new trends and research networks, for example, on subjects related to current technology like Open Access, Open Aire, Open Data, Orcid, etc., and also on current issues of the European Commission, governance, calls, etc. They all have a link to the project, its functioning and subject.Our followers have clearly witnessed the progression of the project over the course of the six issues of the journal. We have attempted to be leaders in our area by having the direct testimony of people and researchers who have told us about their job and given their own view on aspects like scientometrics, research evaluation, etc., or they have just given us an advance on signifi cant issues like the European research programme Horizon 2020.

SiSOBserver was founded as an essential link within the SiSOB communication structure and it has given us the opportunity to reach the three main goals of scientifi c communication, and hence, of SiSOB: open access, interactivity and information exchange. That is, it has enabled us to publish in open-access format those contents which we have considered should be known by our sphere of infl uence; it has also enabled us to interact with the scientifi c community, regardless of whether it was close or not to our sphere of infl uence, who have shown their interest in the topics addressed. The same has happened with the society, with which we have also interacted. Finally, we have set up a network of contacts and collaboration which may be the beginning of new research experiences and relationships.

The links between SiSOBserver and all the social networks have been constant contributing to complete the circuit we wanted to create. We have kept updated both the journal and SiSOBlog in other specialized and general social networks like Linkedin, Facebook or Twitter allowing us to be loyal to our goal of reaching science to the society and making it part of it.

In the fi rst issue of our journal we said that “We want SiSOBserver to become the tool for knowledge and communication available to everyone. The spirit of this journal is to listen and disseminate information”. We hope not to have failed your expectations and reach that goal. We have attempted to be honest, and we have also learnt too much, especially that science and communication are part of the same spirit: to make a better world and a more understandable environment for everyone.The farewell of the team of the SiSOB Project is not a matter of good bye but “see you soon”!!

Beatriz Barros

4

Page 5: Sisobserver n6

5

Estimados Lectores:

De nuevo les ofrecemos un nuevo número de SISOBserver, en esta ocasión nos toca unir la presentación a la despedida. Durante tres años hemos intentado ser fi eles al compromiso que adquirimos con nuestros seguidores, así como mantener la identidad del proyecto SiSOB a través del formato de la revista y de los contenidos que les hemos ofrecido a lo largo de los seis números de SISOBserver.

Hemos tratado de recoger y elaborar los contenidos más innovadores tanto de la temática del proyecto como otros de interés para nosotros y nuestros lectores. De esta forma, SiSOBserver ha mantenido a lo largo de sus tres años de vida dos vertientes temáticas, una vinculada directamente al trabajo que hemos desarrollado en SiSOB, y otra refl ejo o resultado de diversas tendencias que han jugado también un importante papel en el desarrollo del proyecto.

Así, hemos presentado los resultados que hemos obtenido a lo largo del proyecto y en la interrelación entre nuestros socios, especialmente de los casos de estudio y de la Herramienta SiSOB. Y, por otro lado, hemos sido eco y parte de nuevas tendencias y redes de investigación, como por ejemplo temas de actualidad tecnológica como Open Access, Open Aire, Open Data, Orcid, y temas de actualidad de la Comisión Europea, gobernanza, convocatorias, etc. y que ha sido también aspectos vinculados al proyecto, su funcionamiento y temática.

Sin duda, nuestros seguidores han sido testigo a lo largo de los seis número de la revista de la progresión técnica del proyecto, al tiempo que hemos tratado de ser líderes en nuestro área al contar con el testimonio directo de personas e investigadores que no sólo nos han hablado de su trabajo, sino que nos han aportado un punto de vista cercano y complementario sobre aspectos como la cienciometría o la evaluación de la investigación, o bien nos han adelantado aspectos tan importantes como el nuevo programa de investigación europeo Horizon 2020.

SiSOBserver nació como un eslabón muy importante de la estructura de comunicación de SiSOB y nos ha brindado la oportunidad de alcanzar los tres objetivos capitales de la comunicación científi ca y por ende de SiSOB: el acceso abierto, la interactividad y el intercambio de información. Es decir, nos ha permitido publicar en abierto todos los contenidos que consideramos necesario dar a conocer de nuestro proyecto a nuestras áreas de infl uencia; hemos podido interactuar con la comunidad científi ca, tanto la cercana a nuestro área de infl uencia como la que no y que se han visto interesada por los temas que hemos abordado, así como la sociedad en su conjunto; y, fi nalmente, hemos entrado en una red de contactos y colaboración que pueden ser el inicio de nuevas investigaciones y relaciones.

SiSOBServer se ha mantenido enlazada a todas las redes sociales cerrando así el circuito comunicativo que queríamos crear, manteniendo al día las actualizaciones tanto de la revista, como del blog SiSOBlog, en otras redes sociales especializadas y de carácter generalista, como Linkedin, Facebook, o twitter, manteniéndonos fi eles también a nuestro objetivo de acercar la ciencia a la sociedad y hacerla parte de la misma. En el primer número de la revista decíamos “queremos que SISOBserver sea una herramienta de conocimiento y comunicación al alcance de todos. El espíritu de esta publicación es escuchar y difundir”. Solo esperamos no haberles defraudado y haber alcanzado este objetivo. Nosotros hemos tratado de ser honestos con nuestro trabajo y también hemos aprendido mucho, especialmente que la ciencia y la comunicación son parte de un mismo espíritu, el de hacer un mundo mejor y un entorno más comprensible para las personas.

El equipo del proyecto SiSOB solo quiere despedirse de ustedes con un “hasta pronto”.

Beatriz Barros

5

BIENVENIDOS

Page 6: Sisobserver n6

6

Francisco Triguero (PhD). Es profesor titular de la Universidad de Málaga. En la actualidad es Secretario Gen-eral de Universidades, Investigación y Tecnología (SGUIT) del CICE. Ex-perto en el diseñado de políticas, re-sponsables de la gestión de toda la investigación, pública y privada en Andalucía.

Francisco Triguero (PhD). He is a full professor at the University of Malaga who is currently working as Secretary-General of Universities, Research and Technology (SGUIT) at CEICE. He is a policy maker, responsible for the public research management in Andalusia.

6

Interview with: FRANCISCO TRIGUERO

Page 7: Sisobserver n6

7

- Secretary General, facing the new R&D funding framework at national and international level, which is the po-sition of the Government of Andalusia and the challenges to be addressed?

Internationalization, smart specialization, knowledge transfer, more private invest-ment in research and development. These are some of the indicators on which we are drawing up the new R & D regional plan, very much in line with the European strat-egy set by Horizon 2020. The alternative to the current PAIDI 2007-2013 will build on lessons learned over years with regard to scientifi c policy, and will design new guidelines to get the most out of those re-sources that are being constrained by the current economic situation.

- Which novel features does the current PAIDI present in contrast with the pre-vious one?

Times are constantly changing and the ex-isting policies must be overhauled and then be developed. The conditions surrounding the former PAIDI were rather different to the current ones, especially regarding the economic issue. The new Research plan is intended to get closer to the European trends, particularly to Horizon 2020.

- Secretario General, ante el nuevo marco de fi nanciación de la I+D+i na-cional e internacional ¿cuál es la pos-tura y retos que se plantea la Junta de Andalucía?

Internacionalización, especialización in-teligente, transferencia del conocimiento, incremento de la inversión privada en in-vestigación y desarrollo. Estas son algu-nas de las líneas básicas sobre las que estamos elaborando el nuevo plan region-al de I+D+i, muy en consonancia con la estrategia europea marcada en el Hori-zonte 2020. El sustituto del actual PAIDI 2007-2013 partirá de todo lo aprendido en materia de política científi ca y diseñará di-rectrices con las que sacar el máximo ren-dimiento a unos recursos que están sien-do fuertemente limitados por la coyuntura económica.

- ¿Qué aspectos novedosos presenta este nuevo PAIDI frente al anterior?

Los tiempos cambian y las políticas deben adaptarse y evolucionar. Cuando plant-eamos el actual PAIDI vivíamos en unas condiciones muy distintas a las actuales, sobre todo económicas. En el nuevo plan de investigación queremos acercarnos a las tendencias que se siguen en Europa,

7

Entrevista a: FRANCISCO TRIGUERO

Page 8: Sisobserver n6

8

The RIS3 smart specialization (Research and Innovation Strategy for Smart Spe-cialization) on which we are now working will be a fundamental basis. The available resources must be invested in areas in which we are specialists as well as in oth-er emerging areas where we can grow and consolidate as a leading region. We also work to trigger a greater investment by the private sector in R&D with the incentive to participate in public infrastructures.

- The Smart Specialization Strategy is not only a strategy, but a fundamental requirement from the European Union to its regions in terms of sustainable growth. All the knowledge agents and the society in general are included in search of a new economic and social model. What is Andalusia doing in this regard?

Andalusia is now focused on defi ning the Research and Innovation Strategy for the Smart Specialization of Andalusia, RIS3 Andalusia. The process is also led by CEICE and the help of a large group of experts of scientifi c, economic and social areas. RIS3 allows breaking the traditional idea of sectors, promoting instead a more global approach. That is, the agri-food

en el Horizonte 2020. La especialización inteligente RIS3 (Research and Innovation Strategy for Smart Specialization), en la que ya trabajamos, será un pilar fundamental. Los recursos que tenemos debemos inver-tirlos en aquellas áreas en las que somos fuertes, además de en otras emergentes donde tenemos oportunidad de crecer y consolidarnos. Otra línea es impulsar una mayor inversión del sector privado en I+D, incentivando su participación también en infraestructuras públicas.

- La Estrategia de Especialización Inteli-gente no es solo una estrategia, es un requerimiento fi rme de Europa a sus re-giones para lograr un crecimiento sos-tenible y efi ciente, que incluye a todos los agentes del conocimiento y a la so-ciedad en su conjunto, ya que busca un nuevo modelo económico y social. ¿Qué está haciendo Andalucía a este respec-to?

Andalucía se encuentra en proceso de defi nición de la Estrategia de Investigación e Innovación para la Especialización Inteli-gente de Andalucía, RIS3 Andalucía. Un proceso liderado por la CEICE y para el que contamos con un nutrido grupo de expertos de todos los ámbitos científi cos, económi-cos y sociales. Con RIS3 la visión tradicio-

8

Page 9: Sisobserver n6

9

sector is now viewed as an opportunity for global growth which includes activities like agricultural technology, handling, packag-ing and transporting food, etc.

The Andalusian Government believes that this provides a unique opportunity to re-gional growth based on the importance of highlighting our more powerful areas to becoming the best at international level while involving research, production, the market, etc. Besides, the defi nition of this strategy is in itself a great opportunity for refl ection on a new Andalusian economic model based on more sustainable capaci-ties which emphasize our regional assets. It is also an opportunity to design new strategies which enhance the connection between our companies and our knowl-edge and transfer centres, increasing our participation in open innovation process-es, making us become more competitive and strengthening our presence in the global market.

- Which mechanisms and tools will be established to apply the RIS3 propos-als?

PAIDI will of course be pervaded by the RIS3 result and, together with the incen-tives proposed by the Andalusian Agency

nal de sectores desaparece, realizándose un enfoque más global. Es decir, el sector de la agroalimentación se entiende aho-ra como una oportunidad de crecimiento global, que involucra a varias actividades: la tecnología agrícola, transporte, etc.

Para el Gobierno andaluz es una opor-tunidad de crecimiento, haciendo énfasis en aquellos ámbitos en los que somos po-tentes para ser los mejores a escala inter-nacional, involucrando la investigación, la producción, el mercado… Esta estrategia es una gran oportunidad para refl exionar sobre un nuevo modelo económico anda-luz, con capacidades más sostenibles, que ponga en valor los activos de la región. También de diseñar nuevas estrategias que conecten más y mejor a nuestras empresas con nuestros centros de cono-cimiento y transferencia, que nos permita participar de los procesos de innovación abierta, ganar en competitividad, crecer y mejorar la presencia de Andalucía en el mercado global.

- Qué mecanismos y herramientas se pondrán en marcha para aplicar las me-didas propuestas por las RIS3?

El resultado de la RIS3 impregnará al PAI-DI y éste, junto a las órdenes de incentivos

9

Page 10: Sisobserver n6

10

of Innovation and Development and all other agencies of the Andalusian Gov-ernment, it will become the development mechanism to redirect the objectives to-wards growth opportunities within the business environment.

- On the other hand, the evaluation of public research and innovation poli-cies is a matter of particular concern to governments under the current circumstances. What is Andalusia doing in this regard?

Andalusia is one of the few communities with its own assessment body, which is highly valued by the scientifi c communi-ty, the Andalusian Agency of Knowledge (AAC) recognized in the European reg-ister of agencies. Among others, AAC runs university activity accreditation and evaluation as well as Andalusian Knowl-edge System’s innovation and devel-opment. The system is therefore fi lled with a culture of evaluation and quality which expands from the new university degrees to the effective use of the public resources invested in programmes like the research projects of excellence.

de la Agencia de Innovación y Desarrollo de Andalucía así como las del resto del Go-bierno Andaluz, será el mecanismo para su desarrollo, haciendo llegar al entorno em-presarial sus objetivos reorientándolos ha-cia esas oportunidades de crecimiento.

10

Page 11: Sisobserver n6

11

At the same time and from the General Secretariat we make use of other bodies to carry out specifi c assessments, like the one on PAIDI 2007-2013, which was re-cently carried out by the Institute for Ad-vanced Social Studies (in Spanish, Institu-to de Estudios Sociales Avanzados). I am sure that the tools provided by SISOB are

- Por otra parte, la evaluación de las políticas públicas de investigación e innovación es un tema que preocupa especialmente a los gobiernos en mo-mentos como los actuales. ¿Qué está haciendo Andalucía a este respecto?

Andalucía es una de las pocas comuni-dades que cuenta con un órgano propio de evaluación, muy bien valorado por la comunidad científi ca: la Agencia Andaluza del Conocimiento (AAC), reconocida en el registro europeo de agencias. Esta enti-dad ejerce, entre sus funciones, las com-petencias de evaluación y acreditación de las actividades universitarias, desarrollo e innovación entre los agentes del Sistema Andaluz del Conocimiento. Su actividad imbuye al propio sistema de una cultura de evaluación y de la calidad que va desde los nuevos títulos universitarios hasta el apr-ovechamiento de los recursos públicos in-vertidos en programas como el de proyec-tos de investigación de excelencia.

En paralelo, desde la SGUIT nos valemos de otras entidades para realizar evaluacio-nes específi cas, como la llevada a cabo recientemente por el Instituto de Estudios Sociales Avanzados sobre el PAIDI 2007-2013. Las herramientas que nos aporte

11

Page 12: Sisobserver n6

12

going to be quite useful, from now on-wards, to assess not only how science evolves but also to know its impact on society.

- One of the issues which awake more interest among our followers of both Sisoblog and SiSObserver is the Open Access, OA. Is the knowl-edge on the Open Access dissemi-nated, fostered and created within the research community? Which are the challenges to be addressed by the General Secretariat given the new OA environment?

There is no doubt that the Open Ac-cess is key to the future vision of sci-ence. Knowledge must be shared with the citizenship, even more if it is publicly funded. And we are not speaking about future but present, at least in Andalusia. From the General Secretariat, we have made a strong commitment to offer the Andalusian society access to the sci-entifi c production of our system of R&D via a repository of scientifi c information which is linked to the System of Scien-tifi c Information of Andalusia, SICA. The repository allows researchers and An-dalusian people to know what is being

SiSOB estoy seguro que nos serán de gran utilidad, de aquí en adelante, para evaluar no solo cómo evoluciona nuestra ciencia sino, además, para conocer cómo esta im-pacta en la sociedad. - Uno de los temas que más interés gen-era entre nuestros seguidores, tanto de SiSoblog como de SiSObserver es el Ac-ceso Abierto, OA. ¿Desde la secretaria general, se difunde, potencia, genera conocimiento sobre el Acceso abierto en la comunidad investigadora? ¿Qué retos se plantea la SGUIT ante el nuevo entorno OA?

Sin duda el Acceso Abierto u Open Access (OA), es clave para la futura visión de la ciencia. El conocimiento ha de ser com-partido con la ciudadanía, sobre todo si se genera con fondos públicos. Pero no solo es futuro sino que ya es presente, al me-nos en Andalucía. Desde la SGUIT hemos apostado por ofrecer a la sociedad anda-luza el acceso a la producción científi ca de nuestro sistema de I+D+i a través de un repositorio de información científi ca ligado al Sistema de Información Científi ca de An-dalucía, SICA. Este repositorio permite a investigadores, y al conjunto de andaluces, comprobar en qué se está investigando,

12

Page 13: Sisobserver n6

13

principalmente con fondos de carácter pú-blico, así como obtener una foto del siste-ma y sus relaciones con otros agentes del mismo.

- Para fi nalizar, en un siglo en el que las fronteras físicas han desaparecido, tanto para las personas como para el conocimiento, ¿cuál es la posición de la SGUIT acerca de la movilidad de los in-vestigadores andaluces?

Las TIC y proyectos como OPEN LAB difu-minan las fronteras, de modo que las re-laciones dentro del ámbito de la investig-ación no requieran necesariamente de una presencia física. Sin embargo, también es cierto que la internacionalización se genera y refuerza gracias a los intercambios del capital humano entre universidades, cen-tros de investigación y departamentos de I+D de empresas en el ámbito internacio-nal. La libertad de movimiento es, así, un elemento importante sobre el que se sos-tiene el Espacio Europeo de Investigación. Andalucía, en su compromiso por mantener y desarrollar el sistema de I+D+i, seguire-mos apostando por esta y otras acciones que nos permitan apoyar a nuestra I+D+i en el entorno europeo e internacional.

researched, mainly with the public funds, get a general picture and know its relation-ship with other agents.- Finally, living in a century where there are no physical frontiers both for peo-ple and knowledge, what is the SGUIT’s view about the mobility of the Andalu-sian researchers?

ICTs and projects like OPEN LAB blur the boundaries, so the relations within the sphere of research do not necessar-ily require a physical presence. However, it is also true that internationalization is created and reinforced thanks to human exchanges between universities, research centres and R&D business departments at international level. Freedom of movement is, therefore, a key element on which the European Research Area rests. Due to our commitment to keep and develop the R&D system in Andalusia, we will continue sup-porting our R&D with these or other ac-tions both at European and international levels.

13

Page 14: Sisobserver n6

14

Analysis of high impact research in the biotechnology scientifi c fi eld and its effects on microblogging social media: a case study

Raúl Fidalgo-Merino (PhD) received the MSc degree in computer science from the Universidad de Málaga, Spain, in 2003 and the PhD degree in software engineering and artifi cial intelligence from the same university in 2008. He has been a research assistant at the Universidad de Málaga since 2004, as well as assistant professor at the University of Córdoba and the University of Málaga. Currently he is under contract as doctor-ate researcher in the University of Málaga and he is also hired as teaching assistant by the UNED. His research interests in-clude mining time-changing data streams for classifi cation and regression, knowledge discovery in databases and, social net-work analysis, among others.

Raúl FidalgoUniversity of Malaga

Raúl Fidalgo-Merino (PhD) Ingeniero en Informática en el año 2003 y Doctor en Ingeniería del Software e Inteligencia Artifi cial en el año 2008 por la Universidad de Málaga. Desde el año 2004 es investigador en la Universidad de Málaga, com-paginando esta tarea con actividades como docente en la Uni-versidad de Málaga y la Universidad de Córdoba. Actualmente trabaja como doctor investigador en la Universidad de Málaga y personal docente en la Universidad Nacional de Educación a Distancia (UNED). Sus áreas de interés incluyen análisis y prospección de fl ujos de datos en entornos que cambian con el tiempo tanto para tareas tanto de clasifi cación como de re-gresión, descubrimiento de conocimiento en bases de datos y, analisis de redes sociales, entre otras.

Previous and current research in biotechnology has played a role in creating the world that we live in today. But this sector has also some tensions between different applications (e.g., agricultural products). Because of these scientifi c uncertainties, society might be more or less receptive to new products or research from this industry. If the research results in the fi eld bring benefi ts for the so-ciety, they might be refl ected in the media. Thus, one can consider several sources of social data information (e.g., news, forums, blogs, microblogs, etc.) as an output for measuring the impact of science in society.

Tanto la investigación en biotecnología llevada a cabo desde sus inicios hasta la actualidad ha desempeñado un papel importante en la creación del mundo en que vivimos. Pero este sector genera, tensiones además de cambios sustanciales entre sus diferentes aplicaciones o áreas (por ejemplo, en los productos agrícolas). Debido a estas incertidumbres científi cas, la sociedad podría ser más o menos receptiva a la hora de aceptar nuevos productos o procesos de investig-ación procedentes de dicho sector: si los resultados en el área son benefi ciosos para la sociedad, podrían verse refl ejados en los medios de comunicación. Así pues, la información publicada en medios sociales provenientes de varias fuentes (por ejemplo las noticias, foros, blogs, microb-logs, etc.) podría servir como conclusión para medir el impacto de la ciencia en la sociedad.

Image taken from http://www.sxc.hu/

14

Page 15: Sisobserver n6

15

Análisis de investigación de gran impacto en el área de la biotecnología y sus efectos en redes

sociales de microblogging: estudio de caso

En este estudio nos proponemos dar respuesta a estas preguntas: ¿es posible detectar de forma automática los diferentes temas de un área de investigación controlando la producción científi ca surgida a partir de los mismos? ¿Pueden seleccionarse fácilmente subcategorías de estos temas como productivas y/o multidisciplinares para así poder realizar un mejor análisis? ¿Cuál es la magnitud e infl uencia de estos temas en los medios sociales? ¿Es la opinión general de la gente en los medios positiva, negativa o neutral con respecto a un tema o grupo de ideas?

¿Cómo hacer esta investigación?

En nuestro estudio, los procesos que pretenden dar respuesta a las preguntas anteriores necesi-tan como datos iniciales bases de datos de artículos científi cos que alberguen aquellos documen-tos de mayor relevancia (v.g., Journal Citation Reports, JCI, del Institute of Scientifi c Information, ISI, para la categoría “Biotechnology and Applied Microbiology”, año 2011).

In the study we tried to answer the following questions: Is it possible to automatically detect dif-ferent themes in a research fi eld by monitoring its scientifi c production? Can relevant subsets of these themes be easily selected as productive and/or as multidisciplinary in order to perform a better analysis? What is the magnitude and infl uence of these themes in the social media? Is the general opinion of people in the social media positive, negative or neutral regarding a theme or group of topics?

How to do this research?

In our study, the processes that try to answer the previous questions need as input scientifi c article databases containing the most relevant scientifi c papers (i.e., Journal Citation Reports, JCI, from the Institute of Scientifi c Information, ISI, for the category “Biotechnology and Applied Microbiol-ogy” in year 2011).

15

Page 16: Sisobserver n6

16

El análisis realizado con estos datos se basa en sus artículos (referencia conjunta de artículos) y las palabras clave que aparecen en los mismos (presencia conjunta de palabras clave). Al anali-zar las redes de palabras clave, obtendremos grupos de estas palabras muy relacionadas entre sí (que nosotros llamamos temas), de manera que así podremos saber lo que se investiga en un momento dado. Dentro de cada tema, utilizamos varias técnicas de análisis de redes con el fi n de obtener la lista del conjunto de palabras clave relevantes para así medir tanto la infl uencia como la opinión generada por los usuarios de dichos medios. Esta última se hace analizando los comentarios generados en torno al conjunto de palabras clave introducidas en una de las redes sociales más infl uyentes: Twiter.

Figure 1. Mapping of communities in keywords network on 2011

The analysis performed on these data is based on its articles (co-citation of articles) and the key-words that appear in them (co-occurrence of keywords). By analysing the networks of keywords, we will obtain groups of highly related keywords (that we call themes) in order to see what is being researched in a specifi c time. Within each theme, we used several techniques of network analysis to obtain the list of relevant sets of keywords in order to measure their infl uence and opinion gen-erated by social media users. The latter is done by analysing the comments generated about the sets of keywords induced in one of the most relevant social media network: Twitter.

16

Page 17: Sisobserver n6

17

Image taken from http://www.sxc.hu/

Un objetivo: la red de palabras clave

La red de palabras clave se realiza asignando en primer lugar a cada vértice una palabra clave para después unir dichos vértices si sus palabras clave correspondientes aparecen en el mismo artículo. La fuerza de estos enlaces depende del número de veces que se encuentre el vínculo en la base de datos. Dicho proceso dará lugar a un grafo no dirigido.

Para la obtención de los temas aplicamos un algoritmo de detección de comunidades llamado “el método Louvain”. Se obtuvieron un total de 21 comunidades (o temas). La imagen 1 muestra el mapeo de comunidades (temas) en palabras clave. De los 21 temas detectados, 8 son amplios, relevantes y claramente defi nidos (el ADN- que corresponde a los nodos amarillos, Células-nodos azul claro, Genes- nodos rojos, Plantas- nodos marrones, Infecciones- nodos magenta, Degrada-ciones- nodos azules oscuro, Biomasa- nodos verdes y Biosensores- nodos rosas) mientras que 13 son pequeños y aislados (por ejemplo, la enfermedad de Crohn y la colitis ulcerosa, compuesta por estas dos palabras clave – véase al fondo de la imagen 1 los dos nodos pequeños color verde oscuro).

Seleccionamos a continuación las palabras clave adecuadas de cada tema (palabras clave de alta relevancia). Es más, combinar palabras clave adecuadas produce resultados más específi cos (limitamos el número de estos conjuntos de palabras clave a 2 para evitar la explosión combina-toria)

A key: the keywords network

The keywords network is built, fi rst, by assigning each vertex to a keyword, and then linking vertices if their corresponding keywords appear in the same article. The strength of these links depends on the number of times this tie is found in the database. This procedure will build an undirected network.

In order to obtain themes, we applied a community detection algorithm called “the Louvain meth-od”. A total of 21 communities (or themes) were obtained. Figure 1 shows the mapping of commu-nities (themes) on keywords. From the 21 themes detected, 8 of them are large, relevant and well defi ned (DNA – corresponding to yellow nodes, Cells – cyan nodes, Genes – red nodes, Plants –brown nodes, Infections – magenta nodes, Degradations – dark blue nodes, Biomass –green nodes – pink nodes) while thirteen are little and isolated (e.g., Crohn’s disease and ulcerative colitis that is composed by these two keywords – see the two little dark green nodes at the bottom of Figure 1).

Then we select keywords as relevant from each theme (keywords with high degree). In addition, the combination of relevant keywords leads to more specifi c results (we limited the size of this keyword sets to 2 to avoid a combinatorial explosion).

17

Page 18: Sisobserver n6

18

Información de los Medios y análisis del impacto social

Como se ha comentado con anterioridad, Twiter es nuestra fuente para la obtención de datos. Este sitio abarca mensajes cortos de texto (llamados “tweets”) de hasta 140 caracteres, incluyen-do otros metadatos (autor, entidades, hashtags, etc.). Cualquier elemento de la lista del conjunto de términos relevantes puede usarse como término de búsqueda. Nuestras búsquedas se limitan al año 2012. Una vez se limpia la serie de tweets, éstos pasan por una herramienta de aprendizaje automático para que sean clasifi cados como “positivos”, “negativos” o “neutrales”, dependiendo de su origen semántico.

La imagen 2 muestra los resultados para una serie de palabras clave relevantes. Cada gráfi co contiene el número de tweets recuperados a partir de las búsquedas de palabras clave así como la proporción de mensajes cortos o tweets neutros, negativos y positivos. Usando esta metáfora, el analista puede ofrecer conclusiones de forma rápida y efi caz.

Mirando al futuro

Se ha desarrollado un marco que posibilita enlazar la investigación científi ca y las áreas de in-novación con los recursos que ofrecen los medios sociales. Nuestro enfoque permite detectar temas usando técnicas bien conocidas para la extracción de comunidades a partir de redes de

Social Media Information and analysis of social impact

As commented before, Twitter is our source for media information. This microblogging site is com-posed by text messages (called tweets), with at most 140 characters, which includes other meta-data (author, entities, hashtags, etc.). Any element in the list of relevant set of terms can be used as search term. Our searches are limited to the year 2012. Once the sets of tweets are cleaned, they are passed to an automated machine learning tool for being classifi ed as ‘positive’, ‘negative’ or ‘neutral’ depending on its semantic background.

Results for some relevant set of keywords can be seen in Figure 2. Each chart contains the number of tweets retrieved by the searched set of keywords as well as the proportion of neutral, negative and positive tweets. With this metaphor the analyst may produce conclusions fast and effi ciently.

Looking to the future

A framework for linking scien-tifi c research and innovation fi elds with social media re-sources has been developed.

Our approach is able to detect themes by using well-known techniques for extracting com-munities from keywords net-works, and characterize them

18

Page 19: Sisobserver n6

19

palabras clave y al mismo tiempo caracterizarlos usando el análisis de redes sociales. Al usar esta metodología, el campo de investigación de la biotecnología constaba de 8 temas bien defi nidos en el año 2011, y además se han detectado otros temas igualmente prometedores desde el punto de vista social. Observamos también cómo nuestra metodología proporciona no sólo información social o científi ca referente a los temas sino también a sus componentes (palabras clave o par de palabras clave). Se pueden extraer fácilmente temas y subcategorías de palabras clave rel-evantes para medir el impacto de los medios de microblogging. La herramienta es capaz de medir cuantitativamente este impacto usando técnicas de aprendizaje automático y de minería de textos capaces de clasifi car textos que ofrecen multitud de opiniones (positiva, negativa, neutral).

A pesar de los resultados que se muestran, cabría pensar que el tema de investigación “UC & CD” produce una infl uencia neutral o incluso parcialmente negativa en los usuarios de la red social estudiada, sin embargo debemos pensar que los tweets o mensajes cortos se refi eren a enfer-medades en general y no a la investigación. En el futuro, creemos que se deben fi ltrar aquellos mensajes que no se relacionan con la investigación.Una interesante futura línea de trabajo podría ser el análisis de la dimensión temporal junto con la obtención de la información tanto social como de la investigación/innovación a partir de los medios sociales. De este modo podríamos seguir la trayectoria de los temas en el tiempo y cómo estos infl uyen en los medios.

by using social network analysis. Using this methodology, the biotechnology research fi eld was composed by eight well defi ned themes in 2011, as well as, some promising themes from the so-cial point of view have been detected. We also saw that our methodology provides not only social and scientifi c information about themes but also referred to its components (keywords or pair of keywords). Themes and subsets of relevant keywords can be extracted easily in order to measure the impact in microblogging social media. The tool is able to quantitatively measure this impact by using machine learning and text mining tools that are able to classify text with polarity opinion (positive, negative or neutral).

Despite the results shown, one may think that the research theme “UC & CD” has neutral or even a skewed negative infl uence in the users of the social media microblog. However, we must think that some tweets refer to the general diseases, not to research. As future work, we think that messages that are not related to research should be fi ltered.

An interesting future line would be to analyse the temporal dimension together with the re-search/innovation and social in-formation retrieval from microblogging media. By doing that, we would be able to follow trajec-tories of themes through time and its infl uence in

19

Page 20: Sisobserver n6

20

Sam Zeini and Nora Pfuetzenreuteruniversität Duisburg-Essen (UDE)

Sam Zeini holds a diploma (M.Sc. equivalent) in sociology. His current research interests are focused on innovations in open source projects from a network analytical perspective. His virtual observation ap-proach uses communication and interaction data as a source for computer supported social network analy-sis. Formerly he has been working on VIP-Net and in the NoE Kaleidoscope.

Sam Zeini es diplomado en sociología (M.Sc. equivalent). Sus intereses en la investigación son actualmente la innovación en proyectos de software libre desde el punto de vista de análisis de redes. Su aproximación a la observación virtual utiliza datos de comunicación e interacción como fuente para análisis de redes sociales por ordenador. Anteriormente tra-bajó en VIP-Net y en NoE Kaleidoscope.

Caso de estudio internacional sobre intercambio de información en el campo del desarrollo de software

(Análisis de la Ruta Principal)

Nora Pfützenreuter holds a Bachelor of Science in Business Psychology. She is currently doing her Master studies of Applied Cognitive and Media Sci-ence at the University of Duisburg-Essen, which com-bines the fi eld of Psychology with Informatics. Due to her interdisciplinary studies and various working ex-periences, her expertise in research methods range from qualitative to quantitative methods, methods on Information Architecture and Social Network Analysis.

Nora Pfützenreuter es licenciada en Ciencias, Psicología Empresarial. En la actualidad realiza el máster de Applied Cognitive and Media Science en la Universidad de Duisburg-Essen, que combina el cam-po de la psicología con la informática. Debido a sus estudios interdisciplinarios y diversas experiencias de trabajo, tiene amplias conocimientos en los métodos de investigación cualitativa, desde los métodos cuanti-tativos, los métodos de la Arquitectura de Información y Análisis de Redes Sociales.

20

Knowledge sharing international case in the fi eld of software development

(Main Path Analysis)

Page 21: Sisobserver n6

21

Análisis de la Ruta Principal y áreas de aplicación

El análisis de Ruta Principal (Hummon & Doreian 1989) es una técnica de análisis de redes para el estudio cienciométrico de citas científi cas en un periodo de tiempo determinado. Su principal aplicación es la de identifi car publicaciones clave en el desarrollo de un ámbito científi co teniendo en cuenta la propia estructura temporal de desarrollo. Dicha temporalidad se representa explícitamente mediante la misma defi nición que se aplica a un grafo acíclico dirigido (DAG) en el que sus nodos corresponden a las publicaciones únicas y las aristas representan las citas entre publica-ciones. La dirección de una arista corresponde al fl ujo de conocimiento desde la publicación citada a la invocación de la misma. Por tanto, estos vínculos aúnan tanto la relación de contenidos como el orden temporal de sus contribuciones.

Con frecuencia se elige una publicación importante de la red de citaciones de publicaciones científi cas de un campo concreto como punto de partida para el desarrollo de dicho campo. Esta publicación se convierte así en la primera fuente. Los nodos sumidero representan, pues, a aquellas pub-licaciones poco signifi cativas o nuevas que aún no han sido citadas. En este sentido existe una noción implícita de tiempo en el que las fuentes representan a las publicaciones más antiguas (o no citadas) y los nodos sumidero se corresponden con las más recientes o nuevas.

Main Path Analysis and its areas of application

Main Path Analysis (Hummon & Doreian 1989) is a network analysis tech-nique for the scientometric study of scientifi c citations over a period of time. Its major application is the identifi cation of key publications in the development of a scientifi c fi eld considering the inherent temporal struc-ture of development. Temporality is explicitly accounted for through the very defi nition of a directed acyclic graph (DAG) where nodes are single publications and directed edges represent citations between publications. The direction of an edge corresponds to the fl ow of knowledge from the cited publication to the citing publication. Therefore, these links incorpo-rate both the dimension of content relations and the temporal order of the contributions.

In the citation network of scientifi c publications within one fi eld, often one important publication is chosen as a starting point of the development of the fi eld. This publication represents the fi rst source. Sink nodes then represent either unimportant or very new publications that have not been cited yet. In this sense there is an implicit notion of time where sources are the oldest (or not cited) publications and sinks are the newest ones.

21

Page 22: Sisobserver n6

22

The main path can be described as the most used path in a citation net-work taking all possible paths from the source nodes to the sink nodes.

Case 1: Computer Supported Collaborative Learning (CSCL)

For the knowledge sharing cases in the fi eld of computer science we decided to analyze the com-munities of Computer Supported Collaborative Learning (CSCL) and the community of Artifi cial Intelligence in Education (AIED). Figure 27 shows the Main Path of one part of the CSCL commu-nity from 1990 to 2012. The data has been retrieved from the Web of Knowledge and covers mainly the publications related to Psy-chology and Pedagogics.

We can clearly identify that the path starts with a survey book chapter by Clark and Brennan published in 1991 about the grounding process in communi-cation in an edited book about socially shared cognition. This idea has been taken by Baker and Lund in a frequently cited paper on refl ective interaction in the collaborative learning context. This also shows a meaningful development in the fi eld where dialogues like chats and es-pecially the refl ective process of explaining in such contexts have been empirically identifi ed as important for the learning processes. As we can see at the end of the main path in the upper left the paper by Dan Suthers and his colleagues defi ning a framework for conceptualizing, represent-ing, and analyzing distributed interaction leads the main path into a small star. This end of the path indeed shows a side by side development of dialogical interactions and analytics around these interaction and commu-nication processes within the fi eld of Computer Supported Learning.

Figure 27. Main Path of the CSCL community 1990 to 2012sam 1 gráfi co 1.png

22

Page 23: Sisobserver n6

23

La ruta principal puede describirse como la más usada en la red de citas tomando todas las rutas posibles desde los nodos fuente hasta los nodos sumidero.

Caso 1: Aprendizaje en Colaboración Asistido por Ordenador (CSCL)

Para los casos de intercambio de información en el campo in-formático decidimos analizar las comunidades de Aprendizaje en Colaboración Asistido por Ordena-dor (CSCL) y la comunidad de In-teligencia Artifi cial en Educación (AIED). La Ilustración 27 muestra la ruta principal de una parte de la co-munidad CSCL desde 1990 hasta 2012. Los datos se han extraído de la Web del Conocimiento y abarcan principalmente las publicaciones relativas a Psicología y Pedagogía.

Se puede identifi car claramente que la ruta comienza con el sondeo de un capítulo del libro publicado por Clark y Brennan en 1991 acerca del proceso de la comunicación, en un libro editado sobre el conocimiento socialmente compartido. Esta idea

se basa en un artículo de Baker y Lund citado en reiteradas ocasiones acerca de la interacción refl exiva en el contexto del aprendizaje colab-orativo, mostrándose, además, un desarrollo signifi cativo en un campo donde diálogos como los chats y, en concreto, el proceso refl exivo de la explicación en dichos contextos han sido empíricamente identifi cados como importantes en los procesos de aprendizaje. Como se puede ver al fi nal de la ruta principal en la parte superior izquierda, el artículo de Dan Suthers y sus colegas que defi ne un marco para conceptualizar, repre-sentar y analizar la interacción distribuida, conduce la ruta principal hacia la estrella pequeña. Este fi nal de ruta, de hecho, muestra un desarrollo en paralelo de las interacciones de diálogo y análisis en torno a estos pro-cesos de interacción y comunicación en el campo del Aprendizaje Asistido por Ordenador.

Figure 27. Main Path of the CSCL community 1990 to 2012sam 1 gráfi co 1.png

23

Page 24: Sisobserver n6

24

Case 2: Artifi cial Intelligence in Education (AIED)

Since the data on the CSCL is limited to parts of the community the con-trasting case of Artifi cial Intelligence in Education (AIED) covers the cita-tion data in the Arnetminer database that uses the DBLP database and also links the data to the ACM database. In this case the selection of the publications based on the venues, such as the AIED conference in our case, is possible due to the structure of DBLP and the references of these selected publications which are used to generate the citation networks for the Main Path Analysis that are giv-en by the ACM data. The network is based on all papers published in the proceedings of AIED. The AIED con-ference takes place every second year. Our data starts with a seed in the 2009 AIED conference which took place in Brighton. From that point forth we moved back to references to 2000. The analysis uses a simple workfl ow as shown in Figure 28.

Since our implementation of the SPC allows more than one path our case interestingly shows two main compo-nents in the path. Figure 29 shows the bigger main component. This com-ponent is corresponding to the trend which we already identifi ed for the CSCL community and refers to the support and analysis of interaction and communication within computer sup-ported learning scenarios. The second smaller component in Figure 30 shows the second major area in the fi eld of AIED that contains papers about in-telligent tutoring systems that can be seen as a more traditional research domain within this area.

Figure 28. Main Path Analysis workfl ow for the AIED analysis

24

Page 25: Sisobserver n6

25

Caso 2: Inteligencia Artifi cial en la Educación (AIED)

Puesto que los datos sobre el CSCL se limitan a parte de la comunidad, el caso contrastado de la Inteligencia Artifi cial en la Educación (AIED) puede cubrir los datos de citación de la base de datos Arnetminer1, que utiliza la base de datos DBLP2 además de vincular los datos a la base ACM3. En este caso, la selección de las publicaciones basada en los eventos,

como por ejemplo y en nuestro caso la conferencia AIED, es posible dada la estructura del DBLP y las referen-cias a las publicaciones selecciona-das usadas para generar las redes de citación para el Análisis de Ruta Prin-cipal proporcionadas por la base de datos ACM. La red se basa en todos los artículos publicados en las accio-nes del AIED. Dicha conferencia tiene lugar cada dos años. Nuestros datos parten de los resultados de la confer-encia AIED del año 2009, acontecida en Brighton. De ahí en adelante retro-cedemos en busca de referencias al año 2000. El análisis utiliza un sencillo fl ujo de trabajo como se muestra en la Ilustración 28.

Puesto que nuestra aplicación del SPC permite más de una ruta, nuestro caso muestra curiosamente dos compo-nentes principales en la ruta. La Ilus-tración 29 muestra el mayor de dichos componentes, que se corresponde con la tendencia ya identifi cada para la comunidad del CSCL y referida al soporte y análisis de la interacción y comunicación en escenarios de apre-ndizaje asistido por ordenador. El se-gundo y más pequeño componente de la Ilustración 30 muestra el segundo mayor tema en el campo del AIED y que incluye artículos sobre sistemas tutoriales inteligentes que pueden considerarse más del ámbito tradicio-nal de la investigación.

Figure 28. Main Path Analysis workfl ow for the AIED analysis

25

Page 26: Sisobserver n6

26

In general the cases show that Main Path Analysis can defi nitely show trends at a level that is abstract enough to contrast and compare different communities. Our cases for CSCL and AIED can demonstrate clearly that there is one common trend around the support and analysis of interaction and communication in computer supported learning contexts for both com-munities even though the papers and their authors are different. Main Path Analysis and especially our implementation which allows more than one path can also show special aspects of individual scientifi c communities like the example of the existing path for Intelligent Tutoring Systems in the AIED community highlights for our cases. The implicit temporal structure also allows the very clear observation of knowledge sharing trajectories for scientifi c communities and their citation trails.

ReferenciasHummon, N. P. and Doreian, P. 1989. Connectivity in a Citation Network: The Development of DNA Theory. Social Networks, 11, 39-63.

Figure 29. Interaction and communication support and analysis component

26

Page 27: Sisobserver n6

27

En general, los casos muestran que el Análisis de Ruta Principal puede ciertamente mostrar las tendencias a un nivel lo sufi cientemente ab-stracto como para poder contrastar y comparar diferentes comunidades. Nuestros casos para CSCL y AIED demuestran claramente la existencia de una tendencia común en torno al soporte y análisis de interacción y comunicación en contextos de aprendizaje asistido por ordenador para ambas comunidades, a pesar de que tanto los artículos como los autores de los mismos son diferentes. El Análisis de Ruta Principal y en concreto nuestra aplicación que permite más de una ruta, puede mostrar además aspectos especiales de las comunidades científi cas individuales como el ejemplo de la ruta existente para los Sistemas Tutoriales Inteligentes en la comunidad AIED destacada en nuestros casos. La estructura temporal implícita también permite una observación muy clara de las trayectorias de intercambio de información para las comunidades científi cas y su con-secuente estela de citas.

ReferenciasHummon, N. P. and Doreian, P. 1989. Connectivity in a Citation Network: The Development of DNA Theory. Social Networks, 11, 39-63.

Figure 30. Intelligent Tutoring systems main path component

27

Page 28: Sisobserver n6

28

Sam Zeini es diplomado en sociología (M.Sc. equivalent). Sus intereses en la investigación son actualmente la innovación en proyectos de software libre desde el punto de vista de análisis de redes. Su aproximación a la observación virtual utiliza datos de comunicación e interacción como fuente para análisis de redes sociales por ordenador. Anteriormente tra-bajó en VIP-Net y en NoE Kaleidoscope.

Sam Zeini and Nora Pfuetzenreuteruniversität Duisburg-Essen (UDE)

Ejemplo de casos de estudio de Alemania sobre el intercambio de información

Sam Zeini holds a diploma (M.Sc. equivalent) in sociology. His current research interests are focused on innovations in open source projects from a net-work analytical perspective. His virtual observation approach uses communication and interaction data as a source for computer supported social network analysis. Formerly he has been working on VIP-Net and in the NoE Kaleidoscope.

Nora Pfützenreuter holds a Bachelor of Science in Business Psychology. She is currently doing her Master studies of Applied Cognitive and Media Sci-ence at the University of Duisburg-Essen, which com-bines the fi eld of Psychology with Informatics. Due to her interdisciplinary studies and various working ex-periences, her expertise in research methods range from qualitative to quantitative methods, methods on Information Architecture and Social Network Analysis.

Nora Pfützenreuter es licenciada en Ciencias, Psicología Empresarial. En la actualidad realiza el máster de Applied Cognitive and Media Science en la Universidad de Duisburg-Essen, que combina el cam-po de la psicología con la informática. Debido a sus estudios interdisciplinarios y diversas experiencias de trabajo, tiene amplias conocimientos en los métodos de investigación cualitativa, desde los métodos cuanti-tativos, los métodos de la Arquitectura de Información y Análisis de Redes Sociales.

28

Knowledge sharing example cases from Germany

Page 29: Sisobserver n6

29

The nanotechnology case

Nanotechnology is an emerging fi eld within science that is in focus of pub-lic interest all over the world. The public interest and the interdisciplinary character are the sampling criteria for choosing nano science as a case for knowledge sharing (see deliverable D8.2). For this purpose we started the analysis of the case study with CENIDE, the Center for Nanointegration at the University Duisburg-Essen.

Network Text Analysis

How would topics differ in pure scientifi c discourse versus public science communication? To answer this research question, we conducted the fol-lowing research.

El caso de la nanotecnología

La nanotecnología es un nuevo campo dentro del ámbito científi co y centro de interés en todo el mundo. Tanto el interés que genera, como su carácter interdisciplinar son criterios que convierten a la nanociencia en un caso de estudio para el intercambio de información (véase el documento D8.2). A tal fi n, comenzamos el análisis del caso con CENIDE, el Centro de Nanointe-gración de la Universidad de Duisburg-Essen.

Análisis de Texto mediante Redes

¿Cómo diferirían los temas en el discurso puramente científi co frente al de la comunicación científi ca destinada al público? Para responder a esta pregunta, realizamos la siguiente investigación.

Image taken from http://www.sxc.hu/29

Page 30: Sisobserver n6

30

First we collected press releases, press items and publications from the nano technology center CENIDE located at the University Duisburg-Essen. Press releases are announcements produced by a small team mainly re-sponsible for public relations and networking of the nano center. Press items are new articles produced by press and journalists about the nano technology center. Publication abstracts are abstracts of the publications by scientist belonging to the research network.

In the next step we used the text collection as data source for the approach formulated by Leydesdorff & Hellsten (2006) and its adaption for the SISOB project. The approach roughly consists of the following steps:

• Derivation of the occurrence matrix (term occurs in n documents)• Derivation of the co-occurrence matrix (frequency of terms occurring in the same document)• Cosine normalization of the co-occurrence matrix• Factor analysis (showing which terms belong to which frame)• Visualization: – Co-occurrence matrix to generate networks – Factors to determine partitions

En primer lugar, recopilamos comunicados de prensa, artículos y publica-ciones del centro tecnológico de nanotecnología CENIDE situado en la Uni-versidad de Duisburg-Essen. Los comunicados de prensa son anuncios hechos por un pequeño equipo responsable principalmente de las relacio-nes públicas y redes sociales del centro nanotecnológico. Los artículos de prensa son artículos nuevos escritos por la prensa y los periodistas sobre el centro nanotecnológico. Los resúmenes de una publicación son los real-izados por científi cos pertenecientes a una red de investigación.

El siguiente paso fue usar los textos recopilados como fuente de datos para el enfoque formulado por Leydesdorff y Hellsten (2006) y la adaptación de los mismos para el proyecto SISOB. En términos generales, dicho enfoque presenta las siguientes etapas:

• Derivación de la matriz de ocurrencia (el término aparece en n documen-tos)• Derivación de la matriz de concurrencia (frecuencia de términos en el mismo documento)• Normalización del coseno de la matriz de concurrencia• Análisis del factor (muestra qué términos pertenecen a qué agrupación)• Visualización: – Matriz de concurrencia para generar redes – Factores para determinar cada división

30

Page 31: Sisobserver n6

3131

Figure 1. Topic network for CENIDE publication abstracts in 2008

Page 32: Sisobserver n6

32

The following diagrams show the comparison of the frames (= topic clusters) for the publication abstracts and for the press releases in the year 2008 with the different colors indicating different frames. Figure 1 shows the topics, based on the scientifi c discourse that means with publication abstracts as data basis. As we can see, besides of global topics (white frame down side) the other main topics for the frame are Spintronics, Spectroscopy, Anisot-ropy, and Growth of surfaces.

In comparison, Figure 2 shows the CENIDE press items for 2008, repre-senting the topics within the public science communication. Here we can see that this network also contains Spintronics that can also be found in the network extracted from the publication abstracts. Since the network is extracted from press items academic titles are also included in one com-ponent. The orange frame in the upper left shows clearly the new master program in nano engineering.

In general we see that the network based on the press releases differs signifi cantly from the network based on the publication abstracts due to the public relation character of press releases.

Los siguientes diagramas muestran la comparación de las agrupaciones de temas (=topic clusters) para los resúmenes de publicaciones y los co-municados de prensa del año 2008, en el que cada color representa las diferentes agrupaciones. La Ilustración 1 muestra aquellos basados en el discurso científi co que corresponden a los resúmenes de las publicacio-nes tomados como base de datos. Como se puede observar, además de las agrupaciones de temas globales (agrupación blanca en el lado inferior) también se encuentran las otras agrupaciones principales: Espintrónica, Esprectocopia, Anisotropia y Crecimiento de superfi cies.

La ilustración 2 muestra, en comparación, los artículos de prensa de CENIDE para el año 2008, que representan las agrupaciones dentro de la comunicación de la ciencia destinada al público. Como se puede observar, en esta red se encuentra también la Espintrónica, que además puede hal-larse en la red extraída de los resúmenes de publicaciones. Puesto que la red se extrae de los artículos de prensa, se incluyen además en un compo-nente las denominaciones académicas. La agrupación naranja en la parte superior izquierda muestra con claridad el nuevo programa máster en nano ingeniería.

Podemos ver, en términos generales, que la red basada en los comu-nicados de prensa difi ere signifi cativamente de aquella basada en los resúmenes de las publicaciones, principalmente debido al carácter público de los primeros.

32

Page 33: Sisobserver n6

3333

Figure 2. Topic network for CENIDE press releases in 2008

Page 34: Sisobserver n6

34

The press items which are based on the press releases and published by media are more similar to press releases. But they also differ in the sense that more contextual information added by the media can be found in the network.

Concerning the nanotechnology case we can say that using the network of co-occurring words technique enables to detect a change in semantics when the topic moves from the scientifi c to the press context. In the scien-tifi c context, CENIDE is related to specifi c knowledge and basic research. In the press releases, CENIDE and nanotechnology are strongly related to events, offers and promoting these offers. The press seems to be interested in the persons behind the research and the areas of application. In terms of social impact it is important to tell about these people.

Bibliographic Analysis

How are productivity and cooperation (co-authorship) related? Are the most productive authors also the most collaborative ones? Which role does col-laboration play in the fi eld of nanotechnology? To answer these questions,

Los artículos de prensa basados en comunicados y publicados por los me-dios se asemejan más a los comunicados, pero se diferencian también de éstos en que los medios proporcionan más información contextual en la red.

En lo referente al caso de la nanotecnología, podemos decir que el hecho de usar la técnica de red de palabras concurrentes permite detectar un cambio en la semántica cuando el tema se desplaza del contexto científi co al de la prensa. En el contexto científi co, CENIDE está vinculado al cono-cimiento específi co y la investigación básica. En los artículos de prensa, CENIDE y la nanotecnología comunican actividades, ofertas y promoción de dichas ofertas. La prensa se interesa por cada una de las personas responsables de la investigación y sus áreas de utilidad. En términos de impacto social es importante hablar de estas personas.

Análisis Bibliográfi co

¿Cómo se relacionan la productividad y la cooperación (coautoría)? ¿Son los autores más productivos también los más buscan la colaboración? ¿Qué papel desempeña la colaboración en el campo de la nanotecnología?

34

Page 35: Sisobserver n6

35

we took a look at the productivity, measured by the degree centrality and the collaboration, measured by the betweeness centrality of the researchers.

The bibliographic data for the nanotechnology analysis has been gathered from SCOPUS database for three different centers with a comparable focus:

1. CENIDE (Center for Nano Integration, University of Duisburg-Essen)2. NIM (Nanosystems Initiative Munich)3. KIT (DFG Center for Functional Nanostructures at the Karlsruhe Institute of Technology)

The data set uses the Pajek partition structure to include the different institu-tions CENIDE, NIM, and KIT.

One result we got based on the comparison of the degree centrality and the productivity of researchers is that productive scientists not necessarily gain a high centrality position in co-authorship networks.

Para responder a estas preguntas, examinamos la productividad científi ca, medida por el grado de centralidad y la colaboración, que defi nimos como la centralidad de intermediación entre los investigadores.

Los datos bibliográfi cos para el análisis de la nanotecnología se han obteni-do de la base de datos SCOPUS para tres centros diferentes que cuentan con un enfoque similar:

1. CENIDE (Centro de Nanointegración, Universidad de Druisburg-Essen)2. NIM (Nanosystems Initiative Munich)3. KIT (DFG Centro de Nano estructuras Funcionales en el Instituto de Tec-nología Karslruhe)

El conjunto de datos utiliza la estructura de división de Pajek para así incluir a las distintas instituciones CENIDE, NIM y KIT.

Uno de los resultados obtenidos basándonos en la comparación del grado de centralidad y la productividad de los investigadores es que los científi cos productivos no obtienen necesariamente una alta posición central en las redes de autoría compartida.

35

Page 36: Sisobserver n6

36

While confronting the researchers with these results some of them were surprised, especially the high productive researchers who usually force single authorship journal publications. They didn’t expect the importance of a collaborative culture of publishing. For nanotechnology it is important to show the difference between degree centrality in co-authorship networks and productivity of individual researchers since there are different publica-tion cultures included in the domain. While for example traditional scientists from the research area of physics usually publish alone or with only few co-authors, mechanical engineers might have a culture of collaborative and interdisciplinary publishing. Especially in cases of young researchers we could observe that one young researcher with a high centrality score also receives a lot of grants.

Another interesting case is the case of one researcher who is not well known for a special paradigm but has developed and optimized methods to pro-duce high amounts of nano particles. In his role as a supplier for nano par-ticles he contributes to different research groups and their research within the center. This leads to his presence as co-author in several papers and he gains a high centrality as a consequence in the resulting co-authorship network.

Al exponer a los investigadores con estos resultados, muchos de ellos se sorprendieron, especialmente aquellos con una mayor productividad que normalmente potencian la autoría individual de las publicaciones, puesto que no se esperaban la importancia de la publicación compartida. En el caso de la nanotecnología es importante mostrar la diferencia entre el grado de centralidad en redes de autoría compartida y la productividad individual de los investigadores puesto que existe una cultura diferente en cada caso. Mientras que los científi cos tradicionales del campo de la investigación publican por lo general de manera individual o contando con algún que otro autor, los ingenieros mecánicos desarrollan una cultura de publicación interdisciplinar y en colaboración. En el caso concreto de investigadores jóvenes se puede observar especialmente el hecho de que reciben además más subvenciones si cuentan con mayor grado de centralidad.

Resulta interesante también el caso del investigador no muy conocido por un aspecto concreto, pero que ha desarrollado y optimizado métodos que producen ingentes cantidades de nano partículas. Como proveedor de nano partículas, contribuye con los diferentes grupos de investigación y su desarrollo en el centro, lo que produce como resultado su participación como coautor en varios artículos proporcionándole una mayor centralidad como resultado de la red establecida de autorías conjuntas.

36

Page 37: Sisobserver n6

37

This shows and underlines the fi ndings from interviews with members of CENIDE and the Network Text Analysis saying that especially enabler roles and providers of enabling technologies are important for the success and impact of scientifi c communities. Especially universities who usually are in-terested in hiring famous researchers should consider that enabling is one important factor in the competition to get the best scientists.

The biotechnology case

The case of biotechnology is based on an excellence cluster in Hannover, Germany called Rebirth . It was founded in 2006 as a research cluster ad-dressing diffi cult health problems especially related to the heart. It seeks the synergy between Medicine, Biochemistry, Physics, Chemistry and Engi-neering to overcome limitations in traditional Medicine.

The research design is similar to the nanotechnology case based on Net-work Text Analysis. Here we also conducted both approaches by Diesner/Carley and Leydesdorff/Hellsten to compare topics in press releases and topics in publication abstracts for the years 2008 to 2011.

Todo esto pone de manifi esto los hallazgos derivados de las entrevistas con miembros del CENIDE y del Análisis de Textos mediante Red, que señalan que las funciones de facilitador y proveedor de tecnologías son importantes tanto para el éxito como el impacto de las comunidades científi cas. En con-creto las universidades, que normalmente procuran contar entre sus fi las con investigadores de prestigio, deben considerar que para conseguir a los mejores científi cos, éste es un factor importante a tener en cuenta.

El caso de la biotecnología

El caso de la biotecnología se basa en un clúster de excelencia de Hanover, Alemania, denominado Rebirth1, fundado en el año 2006 como clúster de investigación que aborda los problemas de salud, en particular los relacio-nados con el corazón. El mismo busca la sinergia entre la Medicina, Bio-química, Física, Química e Ingeniería con el fi n de superar las limitaciones de la Medicina tradicional.

El diseño de la investigación es parecido al caso de la nanotecnología ba-sado en el Análisis de Textos mediante Red. Además realizamos aquí am-bos enfoques usando el planteamiento de Diesner/Carley y Leydesdorff/Hellsten para comparar las agrupaciones de temas tratados tanto en comu-nicados de prensa, como en resúmenes de publicaciones para el período comprendido entre los años 2008 y 2011.

37

Page 38: Sisobserver n6

38

In general both approaches lead to very similar results. Related to the social dimension they very clearly demonstrate that the different discourses may show and also hide different things. In both approaches we can observe that the scientifi c discourse represented by the publication abstracts contains the term mice which refers to animal testing. Figure 6 shows this based on the Leydesdorff/Hellsten approach. In contrast the press releases are mainly dominated by terms referring to children and reconstructive therapy approaches especially related to heart issues. In case of children and their growth process it is evident that therapy based on stem cells is one impor-tant path to heal heart diseases. On the other hand it seems that public communication in this case is avoiding unpopular topics like animal testing. Healing children with heart diseases seems to benefi tthe image of an ex-cellence cluster.

The general analysis of the press releases shows a clear overview of main topics in the excellence cluster as shown in Figure 7.

En términos generales, ambas enfoques arrojan resultados parecidos. En cuanto a la dimensión social, ambos muestran claramente que discursos diferentes pueden exponer, pero también ocultar, cosas diferentes. Así, en ambos planteamientos, se puede observar que el discurso científi co de los resúmenes de publicaciones usa el término “mice” (ratones) para referirse al ensayo con animales. La Ilustración lo muestra basándose en el enfoque de Leydesdorff/Hellsten. Esto contrasta con los comunicados de prensa, dominados principalmente por términos que hacen referencia a los niños y a enfoques terapéuticos reconstructores relacionados especialmente con temas de corazón. En el caso de los niños y su proceso de crecimiento, es evidente que una terapia basada en el uso de células madre es una vía im-portante para la cura de enfermedades de corazón. Por otra parte, parece que la comunicación de cara al público evita en este caso el uso de temas espinosos como el del ensayo con animales. Curar a niños con enferme-dades cardíacas parece benefi ciar la imagen de un clúster de excelencia.

El análisis general de los comunicados de prensa muestra una clara visión general de los temas principales del clúster de excelencia como se aprecia en la Ilustración 7.

38

Page 39: Sisobserver n6

39

Figure 6. Central term mice referring to animal testing

39

Page 40: Sisobserver n6

40

In sum we can state that for both cases (nanotechnology and biotechnology) the Network Text Analysis approaches are a very practicable way to show differences between public discourses and scientifi c discourses. Press re-leases and the more diffi cult to collect press items are a good way to capture the public discourse. In contrast publication abstracts are practicable since they are available usually without a subscription to specifi c databases or journals. The diffi culty is to understand and interpret the scientifi c terms and the identifi ed frames. In case of nanotechnology the possibility to interview researchers provided a good way to understand the specifi cs by asking the scientists. In contrast, the case of biotechnology - without the possibility to interview experts - required intensive internet research to understand the unknown terms and to interpret the found frames

References

Diesner, J., & Carley, K. M., 2005. Reveal-ing Social Structure from Texts: Meta-Matrix Text Analysis as a novel method for Network Text Analysis. In V. K. Narayanan & D. J. Arm-strong, Causal Mapping for Information Sys-tems and Technology Research, 81-108. Har-risburg, PA: Idea Group Publishing.

Leydesdorff, L.; Hellsten, I., 2006: Measuring the Meaning of Words in Contexts: An auto-mated analysis of controversies about ‘Mon-arch butterfl ies,’ ‘Frankenfoods,’ and stem cells’. In: Scientometrics, 67, 231-258

Figure 7. Topic clusters (frames) in the Rebirth press releases

40

Page 41: Sisobserver n6

41

En resumen, podemos decir que para ambos casos (nano tecnología y biotec-nología) los enfoques de Análisis de Texto mediante Red constituyen una forma muy práctica de exponer las diferencias entre el discurso público y el científi co. Los comunicados de prensa así como los más difíciles de recopilar artículos de prensa representan una buena forma de refl ejar el discurso público. En cambio, los resúmenes de publicaciones son posibles, puesto que se hallan a disposición de cualquiera sin el requerimiento de una suscripción a una base de datos o revista concreta. La difi cultad estriba en la comprensión e interpretación de los términos científi cos y sus áreas asociadas. En el caso de la nanotecnología, el poder entrevistar a los investigadores permitió entender con exactitud al pod-er preguntar directamente a los científi cos. En cambio, y en el caso de la bio-tecnología- sin la posibilidad de contar con la opinión de los expertos- se hizo necesaria una intensa búsqueda en internet para poder entender los términos desconocidos e interpretar las agrupaciones encontradas.

Figure 7. Topic clusters (frames) in the Rebirth press releases

41

Page 42: Sisobserver n6

42

Knowledge trajectories and role patternsTrayectorias de Conocimiento

y patrones funcionalesSam Zeini and Nora Pfuetzenreuter

Universität Duisburg-Essen (UDE)

Sam Zeini holds a diploma (M.Sc. equivalent) in sociology. His current research interests are focused on innovations in open source projects from a net-work analytical perspective. His virtual observation approach uses communication and interaction data as a source for computer supported social network analysis. Formerly he has been working on VIP-Net and in the NoE Kaleidoscope.

Sam Zeini es diplomado en sociología (M.Sc. equivalent). Sus intereses en la investigación son actualmente la innovación en proyectos de software libre desde el punto de vista de análisis de redes. Su aproximación a la observación virtual utiliza datos de comunicación e interacción como fuente para análisis de redes sociales por ordenador. Anteriormente tra-bajó en VIP-Net y en NoE Kaleidoscope.

Nora Pfützenreuter holds a Bachelor of Science in Business Psychology. She is currently doing her Master studies of Applied Cognitive and Media Sci-ence at the University of Duisburg-Essen, which com-bines the fi eld of Psychology with Informatics. Due to her interdisciplinary studies and various working ex-periences, her expertise in research methods range from qualitative to quantitative methods, methods on Information Architecture and Social Network Analysis.

Nora Pfützenreuter es licenciada en Ciencias, Psicología Empresarial. En la actualidad realiza el máster de Applied Cognitive and Media Science en la Universidad de Duisburg-Essen, que combina el campo de la psicología con la informática. Debido a sus estudios interdisciplinarios y diversas experien-cias de trabajo, tiene amplias conocimientos en los métodos de investigación cualitativa, desde los mé-todos cuantitativos, los métodos de la Arquitectura de Información y Análisis de Redes Sociales.

42

Page 43: Sisobserver n6

43

¿Qué son las trayectorias y cuando pueden resultar útiles?

Las trayectorias ofrecen una taxonomía multidimensional que enfatiza el as-pecto temporal del intercambio de conocimiento. El uso de dichas trayectorias en el workbench de SISOB aumenta las posibilidades de análisis en el citado intercambio. Al tener un formato de carácter temporal, las trayectorias albergan información sobre actores, que en este caso son investigadores e instituciones, además de artefactos, publicaciones y sus características, como la localización geográfi ca o los tipos de actores, que, según la trayectoria profesional, ayudan a detectar la difusión del conocimiento tras su seguimiento durante un periodo de tiempo. Estos atributos explotan la naturaleza tácita del conocimiento para encontrar su rastro. La búsqueda, clasifi cación y selección son tareas básicas en las trayectorias y por consiguiente, pueden convertirse en redes bipartitas para su posterior análisis.

Las trayectorias son listas de entradas (ilustración 31) que albergan la infor-mación producida durante un año acerca de un investigador ligado a una insti-tución. Los investigadores se identifi can por un número, sus iniciales y nombre. La entrada se completa con los temas de investigación y una lista de los artícu-los redactados durante ese año.

What are trajectories and when may they be helpful?

Trajectories offer a multidimensional taxonomy emphasizing the temporal as-pect of knowledge sharing. Introducing trajectories in the SISOB workbench enriches analysis possibilities for the knowledge sharing case. As a transient format trajectories hold information on actors, in this case researchers and insti-tutions, as well as artifacts, here publications and their attributes. Attributes like geographic position or different types of actors, as suggested for career trajec-tories, help identifying knowledge spillovers, if they are followed over a period of time. Following attributes exploits the tacit nature of knowledge to fi nd knowl-edge trails. Searching, sorting and selecting are basic tasks on trajectories. Trajectories can subsequently be converted into a number of 2-mode-networks for further analysis.

Trajectories are lists of entries (fi gure 31). Entries hold information about a re-searcher connected to an institution in one year. Researchers are identifi ed by a number, their initials and name. Research topics and a list of papers authored in the given year complete an entry.

Figure 31. Since initials and names are not necessarily unique, researchers are identifi ed by ID. Entries exist per researcher, institution and year.

43

Page 44: Sisobserver n6

44

Un artículo tiene título, un resumen contiene una lista de autores y palabras clave. Esta palabras se han extraído de los resúmenes con la ayuda del KEA (Keyphrase Extraction Algorithm, en español Algoritmo de Extracción de Fra-ses Clave) (ilustración 32) Los temas son un cúmulo de palabras clave.Los años o instituciones que faltan se estiman a poder ser aproximadamente. Las fechas que faltan se eligen de antes y después del periodo fi jado en cada entrada, y por orden cronológico. Las instituciones se extraen de las publica-ciones o se asume que no se ha cambiado de institución. Todas las entradas que faltan se completan con la información curricular del año anterior. Pero incluso con estas correcciones, no puede evitarse la existencia de campos vacíos en la trayectoria si no existen datos en los que basarse.

Conversión de trayectorias a redes

Es posible convertir trayectorias a redes bipartitas en el formato Pajek-.net por medio del conversor TrajectoryToNet, en español Trayectoria a Red, en el workbench de SISOB para un análisis más detallado. Se pueden generar las siguientes redes: Red Autor-Institución, Red Autor-Publicación, Red Institución-Publicación, Red Autor-Tema, Red Tema-Publicación y Red Tema-Institución. Al combinar estos grafos, se puede obtener instantáneamente, por ejemplo, redes de co-autorías.

A paper has a title, an abstract, a list of authors and of keywords. Keywords have been extracted from the abstracts with the help of the KEA (Keyphrase Extraction Algorithm) (fi gure 32). Topics are an accumulation of all keywords.

Missing years or institutions are roughly estimated, if possible. Missing dates are chosen from the time span of entries before and after the given entry, as-suming a chronological order. Institutions are extracted from publications or it is assumed, that they did not change. Entire missing en-tries are fi lled with CV information of the pre-ceding year. Even with these corrections, empty fi elds in the trajectory cannot be avoid-ed, where there is no information to base es-timation on.

Converting trajectories to networks

It is possible to convert trajectories to 2-mode-networks in the Pajek .net format via the TrajectoryToNet converter in the SISOB workbench for further analysis. The follow-ing networks can be generated: Author-In-

Figure 32. Keywords are extracted from abstracts of papers.

44

Page 45: Sisobserver n6

45

stitution network, Author-Publication network, Institution-Publication network, Author-Topic network, Topic-Publication network and Topic-Institution network. By folding these graphs, it is possible to gain e.g. co-authorship networks on the fl y.

Following knowledge is often accomplished by following the mechanisms that help spreading the knowledge. Abramo, D’Angelo and Solazzi (2011) for example looked at co-authored papers to detect knowl-edge spill-overs. This addition to the SISOB workbench follows the knowledge itself, concentrating on where and when it appears, leaving how it got there to further research. This can be an advantage, since it also detects knowledge transfer by less measureable routes. The ac-tors in this scenario are R&D insti-tutions, which give the knowledge produced within their walls a posi-tion. The knowledge is represented

Análisis de trayectorias – Flujo 1: La exploración del desarrollo de un único tema en un mapa de Google. El seguimiento que se hace del conocimiento se logra a menudo siguiendo los mecanismos que ayudan a difundirlo. Abramo, D’Angelo y Solazzi (2011), por ejemplo, examinaron aquellos artículos de autoría com-partida con idea de hallar la difusión del conocimiento. La incorporación de esta herramienta al workbench de SISOB permite analizar el conocimiento en sí mismo, y deja para un análisis más en detalle el cómo llega hasta allí. Esto puede convertirse en una ventaja, ya que permite detectar la transferencia de conocimiento por rutas menos medibles. En este escenario, los actores son las instituciones de I+D que dan prestigio al conocimiento producido dentro de sus muros. El conocimiento viene representado por temas, descriptores extraídos de los resúmenes de las publicaciones. Aquellas instituciones que publican sobre estos temas se mapean en un mapa de Google de forma simi-lar al enfoque adoptado por Bornmann, Leydesdorff, Walch-Solimenta y Ettl (2011), que mostraban que artículos altamente citados se sitúan en torno a las grandes ciudades. GoogleMapAgent muestra la aparición, distribución geográ-fi ca y movimiento de un tema seleccionado a lo largo del tiempo. Los años son las divisiones de tiempo consideradas. Además, es posible analizar el ciclo de vida de un tema: dónde surge, la rapidez y lugares por los que se extiende, si tiende a seguir con una institución o se mueve entre ella y con qué rapidez y dónde comienza su descenso.

Figure 32. Keywords are extracted from abstracts of papers.

45

Page 46: Sisobserver n6

46

by topics, which are keywords extracted from abstracts of papers. Institutions publish-ing on these topics are mapped onto a Google map similarly to the approach taken by Bornmann, Leydesdorff, Walch-Solimenta and Ettl (2011), who showed, that highly cited papers are often centred around big cities. The GoogleMapAgent shows rise, geographic distribution and movement of a single selected topic over time on a Google map. Time slices are years. Thus, it is possible to study the lifecycle of a topic: Where it appears, how fast and where it spreads, if it tends to stick to institutions or oscillates between them and how fast and where it descends.

One goal of the tool is to examine, where topics appear for the fi rst time. A topic does not necessarily have to have only one starting point. Either it could have spread even within the fi rst time slice or different institutions could produce the same knowledge simultaneously. In times of globalization, public databases, Google scholar and social media, artefacts like papers are available all around the world within seconds. But knowledge can be of tacit nature and strongly bound to an actor. It would be interesting to see, if under these circumstances the statement of Glaeser, Kallal, Scheinkman and Schleifer (1992) still holds true, that “intellectual breakthroughs cross hallways and streets more easily than oceans and continents”. Eventually this agent can be used to detect typical lifecycles of topics, which could lead to the development of lifecycle patterns.

Uno de los objetivos de esta herramienta es examinar dónde aparecen los temas por primera vez teniendo en cuenta que no tiene por qué tener un único origen. Incluso podría difundirse en la primera división de tiempo, o distintas instituciones podrían producir el mismo conocimiento de manera simultánea. En un mundo globalizado como el que nos encontramos, con bases de datos públicas, el Google scholar y los medios de comunicación social, los artículos, por ejemplo, están a nuestra disposición en cuestión de segundos. Pero el conocimiento es tácito por naturaleza y está estre-chamente vinculado a un actor. Sería interesante ver si, bajo estas circunstancias, la afi rmación de Glaeser, Kallal, Scheinkman y Schleifer (1992) de que “los avances intelectuales atraviesan pasillos y calles más fácilmente que océanos y continentes” sigue estando vigente. Finalmente este agente se puede utilizar para la detección de ciclos de vida típicos de los temas, lo que podría llevarnos al desarrollo de patrones de dichos ciclos.

46

Page 47: Sisobserver n6

47

Ejemplifi cación en el Workbench de SISOB

La colección de datos geográfi cos que el TrajectoryBuilderSimulator, en espa-ñol Simulador de Construcción de Trayectorias proporciona para este fl ujo de trabajo es puramente simulada, sólo se compila con el propósito de explorar las posibilidades que ofrece el GoogleMapAgent. Por lo tanto este análisis no conduce a la obtención de resultados válidos.

La recogida consta de dieciocho entradas desde el 2009 hasta el 2012. Incluye nueve instituciones localizadas en cuatro continentes, tres de las cuales se encuentran en Boston, y dos al sur de Gran Bretaña, para cubrir así distan-cias de cientos a miles de kilómetros. Las instituciones son la Universidad de Duisburg-Essen, la Universidad de Harvard, El Instituto Tecnológico de Mas-sachusetts, la Universidad de Sidney, la Universidad de Oxford, la Universi-dad de Cambridge, la Universidad de Zagreb, La Universidad de Boston y la Universidad de Moscú. La herramienta pone a disposición las coordenadas de estas instituciones. Hay ocho temas de donde elegir (Nano tecnología, In-geniería Biomolecular, Bioinformática, Ciencia de Materiales, Neurociencias, Gráfi cos de Ordenador, Negocio Electrónico, y Análisis de Redes Sociales). La Nanotecnología aparece en cada entrada y por tanto devolverá la trayectoria completa proporcionando una demostración más clara.

Working with an example in the SISOB workbench

The collection with geodata, which the TrajectoryBuilderSimulator provides for this workfl ow, is a purely imaginary collection in the format trajectory. It is com-piled only for the purpose of exploring the possibilities the GoogleMapAgent provides. Therefore analysis does not lead to any valid results.

The collection consists of eighteen entries that span the four years from 2009 to 2012. It includes nine institutions located on four continents, with three of them situated in Boston, two of them situated in the south of Great Britain in order to cover distances from a few hundred meters to a few thousand kilome-ters. Institutions are the University of Duisburg-Essen, Harvard University, Mas-sachusetts Institute of Technology, University of Sydney, University of Oxford, University of Cambridge, University of Zagreb, Boston University and University of Moscow. Geographic coordinates for these institutions are made available by the tool. There are eight topics to choose from (Nanotechnology, Biomolecular Engineering., Bioinformatics, Material Sciences, Neurosciences, Computer-grafi cs, Electronic Business and Social Network Analysis). “Nanotechnology” is listed for every entry and will therefore return the full trajectory and give the most comprehensive demonstration.

47

Page 48: Sisobserver n6

48

Workfl ow

Figure 33 shows the workfl ow in the SISOB workbench. The GoogleMapAgent takes a trajectory provided by the TrajectoryBuilderSimulator as input. The Tra-jectoryFilterTime, which can be applied optionally, reduces the trajectory to en-tries between the years 2009 and 2012. Since the GoogleMapAgent is designed to focus on a single research topic, it is imperative for this workfl ow to use the TrajectoryFilterTopic to determine the topic of interest, which is “nanotechnol-ogy” for this example. The GoogleMapAgent fi nally transfers the information from the trajectory into the Keyhole Markup Language (kml), a XML based nota-tion for geographic information with context or metadata, which is accepted as input by the GoogleMap-API. The result is a link to a Google map, which shows an institution-institution network for the chosen topic for every year within the selected timeframe.

Figure 33. Workfl ow in the SISOB workbench to depict single topic development on GoogleMap

48

Page 49: Sisobserver n6

49

Flujo de trabajo

La ilustración 33 muestra el fl ujo de trabajo en el workbench de SISOB. El GoogleMapA-gent toma la trayectoria que proporciona como input el TrajectoryBuilderSimulator, en español Simulador de Construcción de Trayectorias. El TrajectoryFilterTime, en espa-ñol el Filtro Temporal de Trayectoria, que puede aplicarse opcionalmente, reduce la trayectoria a entradas entre los años 2009 a 2012. Puesto que el GoogleMapAgent está diseñado para centrarse en un único tema de investigación, es imprescindible que el fl ujo de trabajo use el TrajectoryFilterTopic, en español Filtro Temático de Trayec-toria para determinar el tema de interés, que para este ejemplo es “nanotecnología”. El GoogleMapAgent fi nalmente transfi ere la información de la trayectoria al Keyhole Markup Language (kml), en español el Lenguaje de Marcado de Claves, una notación basada en XML (Lenguaje de Marcado Extensible) para información geográfi ca con contexto o metadatos, aceptada como input por el GoogleMap-API. El resultado es un enlace a un mapa Google que muestra una red institución-institución para el tema elegido por cada año dentro del plazo seleccionado.

49

Page 50: Sisobserver n6

50

Tal y como se aprecia en la Ilustración 34, los años se distinguen por el color de sus enlaces. Naturalmente, las redes institucionales para un año forman un grupo altamente cohesionado. Estas redes son combinaciones de redes temática-institución, que incluyen un solo tema tras el fi ltrado. Al combinar so-bre un único tema queda un grupo de instituciones. Los enlaces se mantienen porque uno o más investigadores en la institución origen trabajan en el mismo tema que uno o más investigadores en la institución destino, pero ello no im-plica que exista cooperación entre dichas instituciones.

Un primer plano del continente americano (ilustración 35) permite un análisis más detallado de las instituciones adheridas en esta área. Tres son las univer-sidades en Boston que forman parte de la red. Un click en el nodo del mapa proporciona el nombre de la institución; un click en el enlace indica origen y destino. Por ejemplo, el Instituto de Tecnología de Massachusetts participó en la investigación del tema durante 2009 y 2012.

As can be seen in fi gure 34, years are distinguished by the colour of their links. Naturally, institution networks for one year form a clique. These networks are folded topic-institution networks, which include only one topic after fi ltering. Folding away the single topic leaves a clique of institutions. Links stand for the fact, that one or more researchers at the source institution work on the same topic as one or more researchers at the target institution, but do not imply coop-eration between institutions. Earlier links in terms of years hide later links. Years and institutions are listed in the menu on the left and can be selected or dese-lected via checkbox (see fi gure 35). In the years 2010 and 2012 the number of institutions involved has remained fairly constant, but institutions have changed and the topic has spread widely geographically.

A close up on the American continent (fi gure 35) allows for a more detailed analysis of the institutions involved in this area. Three universities in Boston are part of the network. A click on the node in the map gives the name of the institution, a click on a link indicates source and target. For example, the Mas-sachusetts Institute of Technology has participated in research in the topic dur-ing 2009 and 2012.

50

Page 51: Sisobserver n6

51

Figure 34. Overviews give a rough estimation on growth and distribution of the network.

Figure 35. A close up reveals three universities in Boston to be part of the network.

51

Page 52: Sisobserver n6

52

Actors often fulfi ll a role within a given context. In the context of knowledge sharing and researcher mobility, roles which are crucial for spreading knowl-edge or indicate change are of interest. A role therefore is a behavior in the process of acquiring, creating and sharing knowledge. The RolePatternFilter is a new addition to the SISOB workbench designed to identify researchers, who occupy predefi ned roles. Since their search is automated, they can signifi cantly shorten the process of fi nding interesting actors and serve as a starting point of research rather than its fi nal result (Klamma et al. 2006).

The patterns newcomer, terminator and continuant (fi gure 36) have already served as such starting points (Braun et al. 2001, Wagner & Leydesdorff 2005). Braun et al. (2001) applied these patterns to neurosciences and found that newcomers and terminators attach themselves primarily to continuants when co-authoring a paper. Continuants mediate relationships between newcomers and terminators.

In deliverable D8.2 the signifi cance of the knowledge broker role in multidis-ciplinary networks was mentioned. The RolePatternFilter extends the idea of roles from classical network analysis to roles, which can be derived from trajec-tories, especially since trajectories stress the development over time. Roles can serve as attributes to an actor.

52

Page 53: Sisobserver n6

53

Análisis de trayectorias – Flujo 2: El hallazgo de patrones en las trayectoriasA menudo los actores desempeñan un rol en un determinado contexto. En el contexto del intercambio del conocimiento y la movilidad del investigador, es-tos roles resultan de especial interés si se trata de expandir el conocimiento o indicar cambios. Por lo tanto un rol se traduce en una conducta en el proceso de adquisición, creación y el compartir conocimiento. El RolePatternFilter, en español Filtro de Roles de Patrones, supone una nueva inserción en el work-bench de SISOB para poder así identifi car a los investigadores que ocupan roles predeterminados. Puesto que la búsqueda está automatizada, pueden acortar signifi cativamente el proceso de búsqueda de actores signifi cativos y servir como punto de partida para la investigación más que como resultado fi nal (Klamma et al. 2006).

Los patrones de newcomer, en español recién llegados o incorporados, termi-nator, en español desvinculados y continuant, en español estables (ilustración 36) ya se han utilizado como tales puntos de partida (Braun et al. 2001, Wagner y Leydesdorff 2005). Braun et al. (2001) aplicaron estos patrones a la neuro-ciencia y hallaron que tanto los autores incorporados como los desvinculados se unen fundamentalmente a los estables cuando se trata de compartir la au-toría de un artículo y que los estables ejercen de mediadores entre los incor-porados y los desvinculados.

En el documento D8.2 se mencionaba la importancia de la función del difusor del conocimiento en las redes multicisciplinares. El RolePatternFilter amplía la idea de los roles desde el clásico análisis de redes a las funciones que se de-rivan de las trayectorias, especialmente desde que las trayectorias se centran en el desarrollo a lo largo del tiempo. Los roles pueden atributos al actor.

53

Page 54: Sisobserver n6

54

Implemented Roles

For the SISOB workbench the patterns newcomer, terminator and continuant examined by Braun et al (2001) (originally suggested by Desolla Price & Gürsey 1976) were implemented. These patterns observe publishing behaviour and are defi ned within a three years timeframe. A newcomer does not publish in the fi rst, but in the following two years. A terminator publishes in the fi rst two, but not in the last year. A continuant publishes in all three years. Matches are newcomers, terminators or continuants in the second year of the timeframe. We extended the continuant pattern to cover the years between fi rst appear-ance and termination of work (if within the fi ltered timeframe). Even if there are publishing free years in between, the researcher is still considered a continuant. However, if there were publishing free years, the researcher would be a match for the other two patterns, too. We chose to expand the timeframe, because tests with the CENIDE data on the TrajectoryBuilder showed that either due to missing data or research schedules, there were researchers not having pub-lished any papers within a year. To fi ll that gap, it can be safely assumed, that the researchers continued working on the same topic, if it was identical in the year before and after the missing year (Braun et al. 2001). The same conclusion however cannot be drawn for newcomers and terminators, since that would mean having to extrapolate forwards or backwards from the timeframe given by the input trajectory.

Figure 36. Patterns newcomer, terminator and continuant as implemented in the workbench. Grey boxes indicate the analysed timeframe, red boxes the years, in which the pattern applies.

54

Page 55: Sisobserver n6

55

Roles Implementados

Para el Workbench de SISOB se implementaron los patrones de incorporados, desvinculados y estables investigados por Braun et al. (2001) (originalmente sugeridos por Desolla Price y Gürsey 1976). Los patrones contemplan la con-ducta relativa a las publicaciones y se defi nen en un marco de tres años. Así, un autor recién incorporado no publica durante el primer año, sino durante los dos siguientes; el autor desvinculado publica los dos primeros años, pero no el tercero, mientras que el autor estable publica durante los tres años. Las coincidencias se dan por tanto en el segundo año. Ampliamos a continuación el patrón para cubrir los años entre la primera aparición y la fi nalización del tra-bajo, si se encontraban en la franja temporal que se había fi jado) Incluso si no hay publicaciones en los años intermedios, el investigador sigue siendo consid-erado un autor estable. Sin embargo, Si no hubo publicaciones, el investigador se correspondería más con los otros patrones. Decidimos ampliar la franja tem-poral porque los tests con los datos de CENIDE en el TrajectoryBuilder mostra-ban que o debido a la pérdida de datos o a los planes de investigación, había investigadores que no habían publicado nada a lo largo de un año. Para llenar ese vacío se puede asumir con seguridad que los investigadores continuaron trabajando en el mismo tema si éste era el mismo el año anterior y posterior al año perdido (Braun et al. 2001) No se puede, sin embargo, aplicar la misma conclusión a los autores incorporados y los desvinculados, puesto que ello sig-nifi caría el tener que extrapolar hacia adelante o hacia atrás desde la franja de tiempo dada por la trayectoria de partida.

Figure 36. Patterns newcomer, terminator and continuant as implemented in the workbench. Grey boxes indicate the analysed timeframe,

55

Page 56: Sisobserver n6

56

Additionally suggested roles

The roles trendsetter, diversifi er and roamer have been defi ned in addition to the existing patterns.

A Trendsetter is a newcomer to a new topic. He or she publishes on the topic within the fi rst year of its appearance.

Diversifi ers are researchers, who work on an extraordinarily large number of topics simultaneously. They hold a very broad based know-how and might act as mediators. The number of topics appropriate to identify a diversifi er might depend on the input data. To adapt to the input data, every researcher, who publishes on more topics than the mean plus the standard deviation calculated from a random year of the dataset is considered a diversifi er. Roamers are scientists, who change institutes quickly. Roamers have high geo-graphic mobility. The pattern is applied to a three years time window: Within that time window, every researcher that works at at least three different institutions is considered a roamer.

Roles propuestos adicionalmente

Además de los patrones existentes, se han defi nido los de trendsetter, en es-pañol pionero o creador de tendencias, diversifi er, en español diversifi cador y roamer, en español itinerante.

Un trendsetter es un recién llegado a un tema nuevo: él o ella publica sobre el tema durante el primer año de la aparición de éste.

Los diversifi ers son investigadores que trabajan en varios temas de manera si-multánea: poseen una base muy amplia del saber hacer y podrían actuar como mediadores. El número de temas necesarios para reconocer a un diversifi er depende de los datos de entrada. Un investigador se considera un diversifi er cuando publica en más temas que la media más la desviación normal calculada a partir de un año aleatorio del conjunto de datos.

Los roamers son científi cos que cambian frecuentemente de institución, tenien-do, por tanto una gran movilidad geográfi ca. El patrón se aplica a una ventana de tiempo de tres años: durante ese tiempo el investigador que trabaje en tres instituciones diferentes se considera un roamer.

56

Page 57: Sisobserver n6

57

Working with an example in the SISOB workbench

The RolePatternFilter works on trajectories because they hold many attributes associated with the researcher plus those associated with papers as described in Deliverable D2.2.

The collection covering 18 researchers and 6 years, which is provided by the TrajectoryBuilderSimulator, is again a purely imaginary trajectory, designed to present the patterns newcomer, terminator and continuant. Therefore, analysis does not lead to any valid results. The trajectory spans the years from 2007 to 2012. The topic “genetics”, one of fi ve topics, returns the full trajectory. The researcher Maria Gardener demonstrates the extended continuant pattern. She has published in the years 2007, 2008, 2011 and 2012. She is matching the continuant pattern from 2008 to 2011, but at the same time is detected as a newcomer in 2011 and as a terminator in 2008.

Ejemplifcación en el workbench de SISOB

El RolePatternFilter trabaja sobre trayectorias porque éstas tienen muchos atributos relacionados con el investigador además de con artículos como ya se ha descrito en el Documento D2.2.

Los datos recogidos y proporcionados por el TrajectoryBuilderSimulator o Sim-ulador de Construcción de Trayectorias y que incluyen a 18 investigadores y 6 años es, de nuevo, una trayectoria puramente imaginaria, diseñada para presentar los patrones de newcomer, terminator y continuant. Por lo tanto, el análisis no conduce a ningún resultado válido. La trayectoria cubre desde el año 2007 al 2012. El tema “genética”, uno de los cinco temas, devuelve la trayectoria completa. La investigadora María Gardener evidencia el patrón de estabilidad prolongada: ha publicado en los años 2007, 2008, 2011 y 2012. Se corresponde con el patrón de autora estable desde 2008 a 2011, pero al mismo tiempo es una newcomer o recién llegada en 2011 y terminator o autora des-vinculada en 2008.

57

Page 58: Sisobserver n6

58

Workfl ow

Figure 37 shows the workfl ow to detect matches for role pattern within the SISOB workbench. The TrajectoryBuilderSimulator provides the trajectory, the fi lters are optional. Of course it is possible to look for new and retiring research-ers on an unfi ltered trajectory. In the context of knowledge sharing it is much more interesting to fi lter the input trajectory by topic as for example, a newcom-er to topic “A” is probably at the same time a terminator to topic “B”. If this holds true for a signifi cantly large number of researchers within a short time span, it indicates a shift of interest in the researcher community. The RolePatternFilter is set to fi nd matches for the continuant pattern. Matches are downloaded via ResultDownloader.

Figure 37. Finding role patterns on trajectories in the SISOB workbench.

58

Page 59: Sisobserver n6

59

Flujo de trabajo

La ilustración 37 representa el fl ujo para la detección de coincidencias en los patrones en el workbench de SISOB. El TrajectoryBuilderSimulator ofrece la trayectoria; los fi ltros son opcionales. Por supuesto es posible buscar investi-gadores nuevos o ya retirados en una trayectoria sin fi ltrar En el contexto del intercambio de conocimiento resulta de mayor interés fi ltrar la trayectoria de input por tema. Así por ejemplo, un recién incorporado para el tema “A” es, probablemente, un desvinculado para el tema “B”. Si esto ocurre de forma sig-nifi cativa con un gran volumen de investigadores en un periodo corto de tiem-po, indica un cambio de interés en la comunidad científi ca. El RolePatternFilter trata de identifi car las coincidencias para todo el patrón. Las coincidencias se descargan por medio del ResultDownloader, en español Sistema de Descarga de Resultados.

59

Page 60: Sisobserver n6

60

Matches are listed in a txt-fi le in the form initials, name, matching years. The fi le also contains name and description of the chosen pattern.

Future steps

The patterns Trendsetter, Diversifi er and Roamer are going to be implemented for the RolePatternFilter. For Trendsetters the input trajectory should not be fi l-tered for topics because otherwise the matching algorithm will never be able to detect the beginning of a new topic.

Roles can be considered as attributes to the researchers who matched the pattern. To use this attribute in the following analysis, it would have to be rein-tegrated into the original data. This leaves two possibilities: First, the matches serve as fi ltering instructions for the original trajectory. Second, the original trajectory is transformed into SISOB graph format by means of the Trajectory-ToNet converter. The researcher nodes are then assigned a role as a property. Both possibilities require the implementation of another agent for the SISOB workbench.

Las coincidencias se enumeran en un archivo txt con iniciales, nombre, años de coincidencia. El archivo contiene además el nombre y la descripción del patrón elegido.

Trabajos futuros

Los patrones Trendsetter, Diversifi er y Roamer se aplicarán al RolePatternFil-ter.La trayectoria de input para el Trendsetter no debe ser fi ltrada por temas, porque si no el algoritmo de coincidencia no detectará el comienzo de un tema nuevo.

Los roles se pueden considerar como atributos para los investigadores que correspondían con el patrón. Para usar este atributo en el siguiente análisis tendría que integrarse en los datos originales. Esto deja dos posibilidades: Primero, que las coincidencias sirvan como instrucciones de fi ltrado para la trayectoria original y, segundo, que la trayectoria original se transforme en el formato gráfi co de SISOB por medio del TrajectorytoNet converter, en español, el conversor de Trayectoria a Red. A los nodos del investigador se le asignan entonces un rol como propiedad. Ambas posibilidades requieren de la apli-cación de otro agente para el Workbench de SISOB.

60

Page 61: Sisobserver n6

61

References

Abramo, G., D’Angelo, C. A., Solazzi, M., 2011. A bibliometric tool to assess the regional dimension of university-industry research collaborations, in: Scientometrics, published online 20. December 2011, DOI: 10.1007/s11192-011-0577-5

Bornmann, L., Leydesdorff, L., Walch-Solimena, C., Ettl, C., 2011 Mapping excellence in the geography of science. An apporach made possible by using Scopus data.

Braun, T., Glanzel, W., Schubert, A., 2001. Publication and Cooperation Patterns of the Authors of Neuroscience Journals. Scientometrics, 51, 499-510.

Desolla Price, D., Gürsey, S., 1976. Studies in scientometrics. Part 1. Transience and continuance in scientifi c authorship. Internation Forum on Information and Documenta-tion. 1, 17–24.

Glaeser, E., Kallal, H., Scheinkman, J., Shleifer, A., 1992: Growth of the cities. J. Polit Econ, 100, 1126-1152.

Klamma, R., Spaniol, M., Denev, D.,2006. PALADIN: A Pattern Based Approach to Know-ledge Discovery in Digital Social Networks. Proceedings of I-KNOW ’06 Graz, Austria, September 6 - 8Wagner, C. S., and Leydesdorff, L., 2005. Network Structure, Self-Organization and the Growth of International Collaboration in Science. Research Policy, 34, 1608-1618.

Figure 38. Matches for the pattern continuant from the test trajectory.

61

Page 62: Sisobserver n6

62

On 6 November 2013, Duisburg hosted a workshop within the framework of the SiSOB project to discuss how to study the impact of the results from the scientifi c studies on society. This is the main goal of the SiSOB project. The attempt during the workshop was to refl ect on this main goal and on how the work done along the last three years has helped to meet this challenge.

El Workshop del Proyecto SiSOB se celebró el 6 de noviembre de 2013 en la ciudad de Duisburg, con el objetivo de debatir sobre cómo estudiar el impacto en la sociedad de los resultados de los estudios científi cos. Objetivo que con-forma el eje principal de la investigación del Proyecto SiSOB. Este encuentro ha sido un punto de refl exión sobre este objetivo y de cómo los trabajos realiza-dos en el proyecto, durante tres años, han ayudado a alcanzar este reto.

Workshop of SISOB ProjectBeatriz Barros,

University of Malaga

62

Beatriz Barros received her PhD in Computer Science,Artifi cial Intelligence, in June 1999 from Universidad Politécnica de Madrid. She wrote her dissertation about automatic analysis of the collaborative processes. In 2006 she joined the University of Malaga, as a member of the IAIA research group (Investigation and Application of Artifi cial Intelligence). Currently, her main research lines include collaborative learning and virtual communities; she leads a research project entitled PATIO (patio.lcc.uma.es). Beatriz researches also social web, curricular management and scienciomentrics; she is the coordinator of the SISOB project (sisob.lcc.uma.es) and leads the project called SICA2 (sicaresearch.sica.es) in the Regional Ministry of Economy, Science and Innovation.

Beatriz Barros es Profesora Titular de la Universidad de Málaga desde el año 2007, después de pasar por la Univer-sidad Nacional de Educación a Distancia (PT, 2001) y la Uni-versidad Politénica de Madrid. Obtuvo su doctorado en Infor-mática (1999) en el Departamento de Inteligencia Artifi cial de la Universidad Politécnica de Madrid, y el de Ingeniero en In-formática (1995) en la misma universidad. En la actualidad de-sarrolla su trabajo en dos campos: aprendizaje colaborativo y comunidades virtuales, dirigiendo un proyecto de investigación llamado PATIO (patio.lcc.uma.es). También desarrolla inves-tigaciones en web social, gestión curricular y cienciometría. Es coordinadora del Proyecto SISOB (sisob.lcc.uma. es) y dirige el proyecto SICA2 (sicaresearch.sica.es)de la Consejería de Economía, Innovación y Ciencia.

Page 63: Sisobserver n6

63

The workshop started analyzing the case studies addressed by the project (Re-search mobility, Knowledge Sharing and Peer Review) and used as framework for discussion on issues and open-ended questions with the aim to connect the signifi cant challenge of connecting research results with the citizenship to im-prove their quality of life. The working day began with the following questions, each one printed in different colored pieces of paper:

a) Biggest trends in the past 10 yearsb) Emerging & future trendsc) Chances / opportunitiesd) Risks (both ways: external threats to topic, risks originating from topic)e) Role of communities and networks (of actors)f) Role of Big Datag) Role of technology and tools

La dinámica de trabajo y refl exión en el work-shop ha girado en torno a los casos de estudio tratados en el Proyecto SiSOB (movilidad de los investigadores, intercambio de conocimien-to y revisión por pares). A través de preguntas y cuestiones abiertas se trazaban conexiones entre los resultados de la investigación y la so-ciedad, así como con la mejora de la calidad de vida. El punto de partida de la jornada fueron las siguientes cuestiones, a cada una de las cu-

ales se les adjudicó un color diferente en función de sus características:

a) Grandes tendencias de los últimos 10 añosb) Tendencias emergentes y futurasc) Oportunidadesd) Riesgos (tanto externos al tema como riesgos originados por el propio temae)Papel de las comunidades y redes (de participantes/actores)f) Papel del Big Datag)Papel de la tecnología y herramientas

63

Page 64: Sisobserver n6

64

The workshop has been attended by members of the consortium as well as some experts in some of the issues of the project’s thematic framework. They travelled to Duisburg to share the results of the research done and refl ect on the open challenges and working lines to be tackled in this type of research. The idea is to make full use of the advances in technology and the new ways to col-lect data to target the specifi c objectives derived and match them with research and policy issues, the needs of society and a better life for citizens.

The workshop has become a shared activity where world-coffee discussion ac-tivities, proposal of ideas and refl ection have been put together.

Keeping in mind the case studies and a set of seven previously listed ques-tions, the most signifi cant items were identifi ed to later go on with the impact of research results on society. The questions examined the cases of use of the project: mobility, knowledge sharing and peer review, which will be dealt in depth in later posts in this journal.

64

Page 65: Sisobserver n6

65

En este encuentro han participado miembros del consorcio así como un conjun-to de invitados, expertos en temas relacionados con la temática del Proyecto. Todos ellos, se desplazaron a Dusiburg con el objetivo de compartir una jorna-da de trabajo en la que se pusieron en común los resultados de la investigación realizada. Asimismo, se refl exionó sobre los retos y líneas de trabajo que se abren en el futuro para este tipo de investigaciones. Se trata de aprovechar los avances de la tecnología y nuevas formas de obtener y coleccionar datos hacia objetivos concretos que permitan vincular la investigación con aspectos relacionados con la política, las necesidades de la sociedad y la mejora de la vida de los ciudadanos.

El workshop ha sido un encuentro dinámico, una actividad participativa en la que se ha combinado un world-caffe con actividades de debate, propuesta de ideas y refl exión.

Empezando por los casos de estudio y el conjunto de siete preguntas listadas previamente, se identifi caron los elementos más relevantes para avanzar hacia la medida del impacto de los resultados científi cos en la sociedad. Las pregun-tas se trataron desde el enfoque de los casos de estudio del Proyecto: mobi-lidad, knowledge sharing y peer review. Se tratarán en más detalle en futuros post de este revista.

65

Page 66: Sisobserver n6

66

The answers were then categorized in three major themes linked to research: scientifi c data, technology and policies. The material was then used to discuss on the great challenges to be addressed and on the advances achieved by SiSOB at political level as well as how SiSOB has been able to connect with the actions undertaken and the results achieved:

- Thus, it is interesting to notice how, in projects like SiSOB, an open policy al-lows access to data to undertake studies which connect research management to its results. SiSOB has demonstrated that the open data can be used in this sort of studies, are quite useful and help us work towards the envisaged objec-tives.- A number of items like the existence of unique identifi ers, repositories, meta-data formats, and protocol of data upload which allow creating observatories to help politicians understand how the investment in research is seen by the soci-ety. For the SiSOB project, this type of items connects projects with results and the way how citizens use them. To that aim, data from other sources different to publications or patents are also collected. That is, ‘what people say’ is collected from social networks, blogs, newspapers, reviews, etc.

- Bring the results obtained in the SiSOB Project in line with the results of simi-lar projects like ORCID, SNOWBALL, CERIF, ALTMETRICS, among others. The idea is to record results and work towards the same goal.

- The role of technology, methods and algorithms to draw up conclusions and connect different fi elds from which to measure aspects related to impact and society. We have seen in the SiSOB Project how a different approach of studies on science based on models of agent networks joined by their research activities is another way to analyze sci-ence results. Information is treated differently and particular emphasis is placed on those items which concern to society; the result is then measured and represented. In this sense, the whole process can be seen and represented as a fl ow from the sector which gener-ates knowledge to the one which uses it. Our approach attempts to represent it and then look for quantitative measures that can show and display it.

66

Page 67: Sisobserver n6

67

Las respuestas se reclasifi caron en tres grandes temas vinculados con la investig-ación: datos científi cos, tecnología y políticas. Con todo este material se debatió sobre los grandes retos que se plantean y qué avances ha supuesto el Proyecto SiSOB:

- a nivel político y el ser capaz de conectarlas con las acciones realizadas y los resultados obtenidos. Así, la política en abierto es interesante en un proyecto como SiSOB para poder tener acceso a los datos para hacer estudios que conec-ten la gestión de la investigación con los resultados de la misma. En el proyecto SiSOB ha mostrado que todos los datos que están en abierto pueden ser utiliza-dos para estudios de este tipo, son útiles y permiten trabajar hacia los objetivos planteados.

- Elementos como la existencia de identifi cadores únicos, repositorios, for-matos de metadatos, protocolos de carga de datos que permitan crear observato-rios que ayuden a los políticos a entender como la sociedad recibe las inversiones que se hacen en investigación. En el proyecto SiSOB este tipo de elementos ayu-dan a conectar proyectos con resultados y la forma en que la ciudadanía lo usa. Para ello se recopilan datos de diferentes fuentes, no solo las habituales como publicaciones o patentes sino también en “lo que dice la gente” por canales como las redes sociales, blogs, periódicos, comentarios a artículos, etc.

- Poner los resultados de SiSOB en consonancia con resultados de proyec-tos similares tales como ORCID, SNOWBALL, CERIF, ALTMETRICS, entre otros. Se trata de sumar resultados y trabajar hacia el mismo objetivo.

- El papel de la tecnología, los mé-todos y los algoritmos para descubrir con-clusiones y conectar campos diferentes, a partir de los cuales medir aspectos rela-cionados con el impacto y la sociedad. En el proyecto SiSOB hemos visto como un enfoque diferente de los estudios sobre ciencia basado en modelos de redes de agentes con relaciones basadas en activi-dades de investigación es otra forma de analizar los resultados de la ciencia. Se modela la información de otra forma y da un énfasis especial a aquellos elementos que destacan relación con la sociedad, se mide y se representa. En este sentido, todo este proceso puede verse y repre-sentarse como un fl ujo desde un sector que genera conocimiento hacia otro que lo usa. Nuestro enfoque fue intentar rep-resentarlo y luego buscar medidas cuanti-tativas para mostrarlo y visualizarlo.

67

Page 68: Sisobserver n6

68

To conclude, several aspects can be highlighted from the workshop and the surrounded discussion. Firstly, and with regard to the workshop held under the world-coffee formula and assisted by three working tables, it was an enriching experience for everyone, especially thanks to the experts’ contributions, who visited every working table and held discussions on the topics proposed with every partner, sharing their knowledge and experience. Secondly, it was also noteworthy the sharing of conclusions of each working table as well as the joint exchange and discussion around Politics, Scientifi c Data and Technology.

The workshop ended with suggestions and new proposals of analysis and re-search lines from the experts to the SiSOB researchers, which reveals the long path still to be explored.

Como conclusión se pueden resaltar varios aspectos, tanto del evento en sí como de las ideas y discusiones que tuvieron lugar en el mismo. En primer lugar, en cuanto a las características del workshop, organizado bajo la fórmula world-coffee y alrededor de tres mesas de trabajo, supuso una experiencia muy enriquecedora para todos los asistentes, especialmente por las aportaciones de los expertos, que visitaron todas las mesas debatiendo con los partner su conocimiento y experiencia acerca de los temas que se discutían. Igualmente valiosa resultó la puesta en común de las conclusiones de cada mesa así como la exposición y debate conjunto alrededor de los temas Politics, Scientifi c Data y Technology .

El workshop fi nalizó con una exposición de sugerencias y nuevas propuestas de análisis y líneas de investigación por parte de los expertos a los investiga-dores de SiSOB, demostrando el amplio camino que aún es necesario explorar en estos ámbitos.

68

Page 69: Sisobserver n6

6969

Page 70: Sisobserver n6

7070

SIXTH SISOB PROJECT MEETING IN DUISBURG

On 4 and 5 November the sixth plenary meeting of the SiSOB Project was held in the German city of Duisburg. We were received by our hosts in the Department of Computational and Cognitive Sciences of the Faculty of Engineering at the University of Duisburg-Essen.

Inés MéndezInés Méndez (PhD) belongs to the DGITE team, where she works as a technical adviser in European Projects and is an Associate Professor in the Journalism Department at the University of Seville. She has experience as a member of coordinting staff in the European Projects, in which SGUIT is partner, for example ERASTAR Regions, NEREUS, CreaMED. At the university, her main areas of research are scientifi and technological communication and journalism of quality. She participated in communi-cation and dissemination tasks in several technical European projects.

La sexta reunión plenaria del proyecto SiSOB se celebró durante los días 4 y 5 de noviembre en la ciudad alemana de Duisburg. Nuestros anfi trio-nes nos recibieron en el Department of Computational and Cognitive Sci-ences de la Faculty of Engineering en la University Duisburg-Essen.

Inés MéndezInés Méndez (Dra.) pertenece al equipo DGITE. Trabaja como consejera técnica de proyectos eu-roopeos. Ha participado en la coordinación de proyectos europeos, en la que SGUIT es socio, por ejemplo ERA-STAR Regions, NEREUS, Crea-MED. Es profesora asociada en el departamento de periodismo de la Universidad de Sevilla y sus principales áreas de investigación son la comunicación científi ca y tecnológica y el periodismo de calidad. Como investigadora universitaria, posee una interesante experiencia tomando parte en las tareas de comunicación y diseminación de diversos proyectos técnicos europeos.

Page 71: Sisobserver n6

7171

SEXTO ENCUENTRO DEL PROYECTO SISOB

As the project is reaching its last stage the meeting had a busy schedule which lasted two days and ended with the Dissemination Workshop on 6 November.The fi rst part of the meeting was mainly focused on the analysis of the project as well as the study cases: Peer Review, Mobility and Knowledge Sharing. These cases have generated a lot of activity within the consor-tium and that is the reason why their results were analyzed and discussed during the meeting.

Esta reunión contó con una agenda bastante apretada teniendo en cuenta que el proyecto se encuentra en su fase fi nal por lo cual se extendió a dos días y continuó el día 6 con la celebración del Disemination Workshop. El estado general del proyecto y de los casos de estudio centró gran parte del primer bloque temático de la reunión. Los tres casos de estudio, Peer Review, Mobility, and Knowledge sharing, han generado una gran activi-dad dentro del consorcio y en la reunión se analizaron y debatieron los principales resultados de los mismos.

Page 72: Sisobserver n6

7272

At the same time, some working meetings were held between the different working groups in order to plan, organize and ensure the even presenta-tion of the Review.

The organization of the workshop was also part of the tasks of this meet-ing because of the expectations placed upon it. The workshop was a great opportunity not only to show the invited guests the advance in the study cases but also to get their enriching feedback.

Page 73: Sisobserver n6

7373

Asimismo se realizaron reuniones de trabajo paralelas entre los diferentes grupos de trabajo con el objeto de planifi car y organizar la preparación del Review, para conseguir uniformidad en la presentación.

La preparación del Workshop fue también una de las tareas de esta re-unión ya que se tenían muchas expectativas en el mismo. El workshop suponía una oportunidad de mostrar a los expertos externos invitados los progresos obtenidos en los diferentes casos de estudio, así como recibir un enriquecedor feedback por su parte

Page 74: Sisobserver n6

74

Image taken from http://www.sxc.hu/

74

The Global Registry of Research Data Repositories

The Open Access to research data and results as well as to articles and publica-tions is a great achievement that is being attained through several disciplines. But the amount, variety and origin of open data are the trade-offs to its benefi ts.Every day researchers have to cope with an “open” universe: numerous reposito-ries, tools, formats….to search what they need, but without any guideline to un-derstand how Open Access publication works. Besides, the effort and time invested are a further handicap among the potential users: the scientifi c community.

Within this context, the goal of Re3data.org is to be-come the global registry of research data. Re3data will cover research data repositories from different academ-ic disciplines. Furthermore, it will present repositories for the permanent storage and access of data sets to researchers, funding bodies, publishers and scholarly institutions.

Re3data aims to facilitate and implement the founding principles of Open Access, the culture of exchange and free access as well as to promote a better visibility of research data.

Re3data is funded by the German Research Founda-tion DFG in the period 2012-2014. It is a joint project which counts on important partners like the Berlin School of Library and Information Science, the German Research Centre for Geosciences GFZ and the Library KIT.

Image taken from http://www.sxc.hu/

Page 75: Sisobserver n6

7575

El Repositorio de Repositorios, Re3data

El Acceso Abierto a los datos y resultados de investigaciones, así como a los artículos y publicaciones es un gran logro que se está consiguiendo, trabajando desde múltiples disciplinas para ello. Pero no todo son ventajas en el camino de avance el Acceso Abierto. El volumen, cantidad, variedad e internacionalidad de los datos en abierto son a la vez ventaja y obstáculo.

Los investigadores se enfrentan día a día al universo “en abi-erto”, multitud de repositorios, herramientas, formatos… en los que poder consultar lo que necesitan, sin una guía o pauta que les oriente en el laberinto de la publicación en abierto. Los re-cursos de esfuerzo y tiempo que esto supone que los sistemas abiertos presenten difi cultades entre sus usuarios potenciales, la comunidad científi ca.

En este contexto, re3data.org ha nacido con el objetivo de ser el repositorio mundial de datos de investigación. Re3data reunirá los repositorios de datos de investigación de distintas disciplinas académicas. Además está dotado de depósitos para el almace-namiento permanente y el acceso a los datos por parte tanto de investigadores, como de organismos de fi nanciación, editoriales y las instituciones acedémicas.

Re3data pretende facilitar y poner en práctica los principios fun-dacionales del Open Access, la cultura del intercambio, del ac-

ceso libre y de potenciar la visibilidad de los datos de investigación.

Re3data.org está fi nanciado por la Fundación Alemana de Investigación DFG, durante el período 2012-2014. Este proyecto cuenta con importantes socios referentes en su campo, como son la Escuela de Berlín de Bibliotecología y Ciencias de la Información, Centro de Investigación Alemán de Geociencias GFZ y la Biblioteca KIT.

Page 76: Sisobserver n6

76

SISOB Web:http://sisob.lcc.uma.es

SISOBserver Web:http://sisobserver.lcc.uma.es/

SISOBlog:http://sisobproject.wordpress.com/

SISOB Facebook Group:http://www.facebook.com/groups/sisob.project/

SISOB LinkedIn Group:http://www.linkedin.com/groups/SISOB-Observatorium-Science-in-Society-4012457?trk=myg_ugrp_ovr

SISOB at Twitter:http://twitter.com/#!/SISOBproject

SISOB at YouTube:http://www.youtube.com/user/SISOBproject?feature=mhee

SISOB Mendeley Profi le:http://www.mendeley.com/profi les/sisob-project/

76

DISSEMINATION

Image taken from http://www.205sqn.aafc.org.

Image taken from http://www.fi ncadelia.com

Page 77: Sisobserver n6

77

SISOB Consortium 2011-2013. The SISOB project is supported by the European Commission, call FP7-SCIENCE-IN-SOCIETY-2010-1, as a Collaborative Pro-ject under the 7th Framework Programme, Grant agreement no.: 266588