ZuenKnow-MEMORIA TÉCNICA GAITEK v05_ALL.doc

44
GAITEK 2013 Programas I+D+i de Apoyo al Sector Empresarial en Euskadi MEMORIA DEL PROYECTO ACRÓNIMO ZUENKNOW TÍTULO Extracción avanzada de conocimiento de la red Tipo de Proyecto GAITEK – Proyectos de Desarrollo de Nuevos Productos Participantes ecmware business intelligence SL AURMAN AGENTES DE LA RED VASCA DE C.T.I. Fundación TECNALIA RESEARCH & INNOVATION Página 1 de 44

Transcript of ZuenKnow-MEMORIA TÉCNICA GAITEK v05_ALL.doc

Memoria del Plan de Actuacin de Inasmet

GAITEK 2013Programas I+D+i de Apoyo al SectorEmpresarial en Euskadi

MEMORIA DEL PROYECTOACRNIMOZUENKNOW

TTULOExtraccin avanzada de conocimiento de la red

Tipo de ProyectoGAITEK Proyectos de Desarrollo de Nuevos Productos

Participantesecmware business intelligence SL

AURMAN

AGENTES DE LA RED VASCA DE C.T.I.Fundacin TECNALIA RESEARCH & INNOVATION

En Erandio, a 25 de Marzo del 2013INDICE DE CONTENIDOS41.RESUMEN GENERAL DEL PROYECTO

41.1.Resumen, Objeto y Objetivos principales

51.2.Estrategias a las que responde el proyecto

82.ANLISIS DEL ESTADO DEL ARTE

82.1.Estado del arte de la tecnologa

82.1.1.Herramientas de Anlisis de opinin (sentiment analysis)

92.1.2.Extraccin de entidades, conceptos y eventos

112.1.3.Crawlers web

122.1.4.Semntica en BI

132.1.5.Recursos lexicogrficos

142.2.Conclusiones de estado del arte

172.3.Antecedentes de las empresas participantes

172.3.1.ecmware

182.3.2.AURMAN

192.4.La novedad tecnolgica del proyecto y los resultados esperados

203.Oportunidad del proyecto

224.RIESGOS Y BENEFICIOS

224.1.RIESGOS TECNOLGICOS

224.2.RIESGOS DE MERCADO

234.3.PREVISIONES DE EXPLOTACIN COMERCIAL/ ANLISIS DE BENEFICIOS.

234.3.1.Mercado potencial

234.3.2.Anlisis econmico y financiero

245.GRUPO DE INVESTIGACIN

245.2.ECMWARE

245.3.AURMAN

266.PLANIFICACIN DEL PROYECTO. FASES Y TAREAS

266.1.Planificacin global estimada del proyecto y fases en las que se estructura

266.2.Diagrama de Gantt

276.3.Descripcin de las tareas a realizar y los tiempos estimados de ejecucin

276.3.1.Fase 0: Gestin y Coordinacin

276.3.2.Fase 1: Plan de Negocio

276.3.3.Fase 2: Actividades de I+D

276.3.4.Fase 3: Lanzamiento de la nueva empresa

276.3.5.Fase 4. Validacin y cierre

286.4.Descripcin de los entregables del proyecto por hito

297.PRESUPUESTO GLOBAL DEL PROYECTO

318.DESCRIPCIN DE SUBCONTRATACIN DE AGENTES EXTERNOS

329.JUSTIFICACIN DE INVERSIONES Y GASTOS REALIZADOS

329.1.Inversiones

329.2.Materiales

329.3.Subcontrataciones

329.4.Otros gastos

3310.AYUDA PROYECTOS

3411.EFECTO INCENTIVADOR

3512.CONTRIBUCIN DEL PROYECTO AL DESARROLLO SOSTENIBLE Y A LA PROTECCIN DEL MEDIOAMBIENTE

3613.VINCULACIN AL SISTEMA VASCO DE INNOVACIN.

3613.1.Ubicacin en Parques Tecnolgicos

3613.2.Adecuacin de los objetivos del proyecto con el Plan Ciencia Tecnologa Sociedad

1. RESUMEN GENERAL DEL PROYECTO1.2. Resumen, Objeto y Objetivos principalesEl proyecto ZUENKNOW tiene como objetivo desarrollar un producto innovador en el sector del business intelligence que haga uso de la experiencia del usuario - opiniones e interacciones vertidas por los usuarios en los medios sociales proporcionados por la red: blogs, foros, sitios webs, redes sociales y sitios microblogging - ofreciendo servicios avanzados que vayan ms all del anlisis de opinin (sentiment analysis) y extraigan conclusiones oportunidades de mercado, deteccin nuevos productos/servicios, oportunidades de mejora - que sustituyan al anlisis humano necesario hasta el momento para tal tarea.Business Intelligence (BI) se refiere al uso de datos (estructurados procesables por mquinas) en una empresa para facilitar la toma de decisiones. Las tecnologas de BI tienen como objetivo ayudar a las personas a entender ms rpidamente los datos, de forma que puedan tomar mejores y ms rpidas decisiones y, finalmente, mejorar sus movimientos hacia la consecucin de objetivos de negocio.

ZUENKNOW ser una herramienta de BI avanzado dado que capta datos pero se diferencia en que los capta del exterior: de los medios sociales (siendo datos no estructurados: no procesables directamente por mquinas) donde sus clientes actuales o potenciales comentan sobre las caractersticas y necesidades en lo que respecta a un producto o servicio, datos ocultos a las organizaciones, que pueden suponer nuevas formas de ingresos y una oportunidad para mejorar el grado de satisfaccin de los consumidores. Las empresas necesitan un servicio que les permita tomar decisiones en base a la gran cantidad de contenidos (no estructurados) que se extraen de la red. En la actualidad los productos existentes en el mbito de medios sociales no pasan del anlisis de opinin donde se refleja la percepcin positiva, negativa o neutra respecto a un producto/servicio determinado o a una caracterstica del mismo (precio, calidad, servicio,..). En este campo estn ampliamente difundidos esfuerzos orientados a hoteles u operadores de telefona mvil, que toman sus datos de fuentes muy concretas como Booking o TripAdvisor en el caso de hoteles o Twitter en el caso de la telefona mvil.

Partiendo de la premisa de que el exceso de informacin no es poder, pero el conocimiento s lo es, ZUENKNOW permite ir un paso ms all que las herramientas actuales permitiendo la automatizacin del procesamiento, actualmente manual, que va desde la obtencin de informacin de las diferentes fuentes y su posterior filtrado, en base a su relevancia en cada caso tanto de la fuente como del propio comentario (por ejemplo, hay sectores que ofrecen servicios de rpido consumo donde un comentario con horas de vida es considerado antiguo), hasta el anlisis de la experiencia del usuario para obtener conclusiones relevantes al negocio como: Posicionamiento fases de venta: si el usuario no consume un producto/servicio determinado, o est considerando hacerlo o ya lo hace. Y en el caso de ser consumidor la fidelidad que presenta. Notoriedad: del producto entre los usuarios. Oportunidades de mejora del producto/servicio extradas de la experiencia vertida por los usuarios en los medios sociales. Seguimiento posterior de la incorporacin de la mejora.

Velocidad de crecimiento de los comentarios sobre un tema.

Comparacin con la competencia.

Quines son los lderes de opinin.

ZUENKNOW se llevar a cabo por un consorcio formado por las siguientes empresas:

ecmware business intelligence S.L. (en adelante ecmware) como lder del proyecto y expertos en inteligencia de mercado y de negocio, e innovacin. AURMAN, agencia de publicidad, experta en Comunicacin estratgica, Publicidad y Comunicacin online. Fundacin Tecnalia Research & Innovation (en adelante Tecnalia) como agente subcontratado de la RVCTI y experta en crawling web y semntica.La duracin estimada del proyecto ZUENKNOW es de 31 meses, el proyecto se realizar en 3 fases durante los aos 2013, 2014 y 2015.1.3. Estrategias a las que responde el proyectoecmware ha desarrollado su modelo de negocio hasta la fecha en sus diferentes reas de negocio:

TV

Empresas

Instituciones

En el rea TV donde empez su desarrollo de negocio y donde tiene mayor volumen de negocio trabaja para empresas de referencia en el estado, algunas productoras y otras cadenas de televisin, muchos de los programas en los que hemos participado junto a ellas son de emisin internacional, por ejemplo Gran Hermano por citar alguna.

Dentro de la estrategia de expansin del negocio ecmware ha visto una oportunidad de internacionalizarse mediante la estrategia de ofrecer modelos de anlisis testado en Espaa, y que permitan a otros pases facilitar herramientas que mejoren las audiencias de los programas.

Para el desarrollo de expansin de los modelos de anlisis que se han desarrollado en Espaa, se estn llegando a acuerdos con las propias productoras que faciliten la comercializacin de los diferentes productos. Por ejemplo el acuerdo al que se ha llegado con Endemol Espaa para la comercializacin internacional de Gran Hermano.

Adems del rea de TV en el rea de empresa se trabaja en la misma lnea intentando cerrar acuerdos con empresas con las que se trabaja con modelos de anlisis a nivel nacional y que tengan fuertes implantaciones en otros pases para llegar acuerdos de comercializacin del modelo en colaboracin.

En TV la oportunidad de internacionalizacin es muy alta pudiendo crear para el proyecto ecmware un gran crecimiento haciendo del modelo un referente internacional. Hemos de tener en cuenta que Gran Hermano se emite en 62 pases, y aunque potencialmente no es posible acometer todos, es importante implantarse en los principales pases de referencia.Por otra parte en el rea empresas se esta desarrollando un proyecto con una empresa fabricante de zapatos El Naturalista, sta empresa tiene su mayor cuota de mercado en mercados ajenos al espaol, concretamente en Espaa slo posee el 9% de mercado total. El objetivo del proyecto que se esta desarrollando con ellos pretende crear un modelo muy personalizado de anlisis de mercados y adaptacin de productos que permita migrar el modelo mediante las adaptaciones a otros mercados donde la organizacin tienen mucho inters y dada la competencia necesita modelos de inteligencia altamente eficientes y sobre todo eficaces, que facilite la toma de decisiones estratgicas que aumenten su grado de xito.

ZUENKNOW es estratgico para la definicin e investigacin en metodologas y modelos de transformacin para los modelos desarrollados para los mercados nacionales a otros mercados. Facilitando la adaptacin de los servicios a otros mercados, en definitiva dando modelos competitivos para poder acometer mercados con mayor granita de xito.Debido a que los entornos de negocio cambian a gran velocidad, las organizaciones necesitan adaptarse y, en la medida de lo posible, anticiparse a dichos cambios. A partir del conocimiento obtenido de la experiencia del usuario, la organizacin puede transmitir a las diferentes reas del negocio oportunidades de mejora.

El anlisis de la experiencia de los clientes pone de manifiesto oportunidades de mercado, que permiten el lanzamiento de nuevos productos o servicios no identificados por la organizacin. Los clientes comentan necesidades y valores, ocultos para la organizacin, que pueden suponer nuevas formas de ingresos y una oportunidad para mejorar el grado de satisfaccin de los consumidores.Completar /Corregir estrategia sugerida para AURMAN.Cuando se disea una campaa publicitaria de un producto y/o marca concreta, resulta difcil medir el impacto que dicha campaa tiene en los medios sociales. En este caso lo ideal sera conocer el impacto del producto/marca antes de llevar a cabo la campaa, poder evaluarlo durante la ejecucin de la misma y a su terminacin. As mismo resulta necesario identificar el/os competidor/es directo/s para realizar mediciones de su impacto en las mismas fases, de forma que el impacto se medira por comparacin con los competidores directos.Si estas mediciones se hacen de forma manual el impacto en AURMAN es muy alto en lo que a costes de personal se refiere, resultando en una menor competitividad en el mercado y siendo, as mismo, un freno a la internacionalizacin. Las herramientas actualmente disponibles estn muy focalizadas a fuentes concretas de los medios sociales y no tienen la flexibilidad que exige la aparicin de nuevas fuentes en los medios sociales o la predileccin de los usuarios por unas fuentes u otras para verter y/o consultar comentarios y reacciones. La eleccin de las fuentes en los medios sociales depende de mltiples factores entre ellos el tipo de producto y/o marca, tipo de usuario, popularidad de una fuente frente a otra, etc. As mismo las herramientas actuales restringen los parmetros a medir, que varan de una campaa a otra, lo mismo que varan de un producto/marca a otro: no es lo mismo medir el impacto de un modelo de coche que el del estreno de un videojuego, en este caso vara entre otros la edad media del usuario, su capacidad adquisitiva, la madurez del cliente en lo que respecta a los productos, existencia de foros especializados en la marca e incluso en el producto concreto.ZUENKNOW para AURMAN ser la oportunidad para la explicitacin del conocimiento, que posee sobre medicin de impacto de campaas publicitarias, en una herramienta que automatice un proceso hasta ahora manual, permitiendo llegar a ms clientes con una oferta mejorada: mayor calidad, mejores tiempos y menor coste. Dentro de la estrategia de internacionalizacin de AURMAN, ZUENKNOW abre la va a la expansin en otros pases ayudando a salvar la barrera del idioma.)2. ANLISIS DEL ESTADO DEL ARTE2.2. Estado del arte de la tecnologa

2.2.1. Herramientas de Anlisis de opinin (sentiment analysis)2.2.1.1. NaturalOpinions

NaturalOpinions de la empresa Bitext permite analizar todo lo que se est diciendo en cada momento en Internet sobre una persona o marca, detectar automticamente las entidades, conceptos y opiniones relevantes, y procesarlas segn se desee. Estas tecnologas tienen tambin una aplicacin directa en campos como el anlisis de opinin (sentiment analysis), adems de en procesos como la automatizacin de procesos documentales.

Esta Herramienta contempla especficamente el crawling de informacin en diferentes fuentes:

Medios Sociales: Facebook, Twitter

Blogs: personales, corporativos, sociales

Foros: Ciao, EnFemenino

Webs: de empresas, de administraciones pblicas

Prensa general: ABC, El Mundo, El Pas, Europa Press

Prensa econmica: Expansin, Cinco Das, El Economista

Prensa deportiva: As, Marca, Mundo Deportivo, SportEjemplo de procesamiento de una opinin de Twitter:

Opinin 17083509 - Fuente: twitter.comtwitter

Tweet: RT @AliciaMime: Vodafone es cada vez ms abusivo, iba a cambiar a tarifa de datos, ahora me buscar otra empesa. @vodafone_es http://t.co/zgSBZrOj

Nombre de usuario: Sheizen

Fecha: 20/02/2013

Entidad: Vodafone

Tipo de la entidad: Producto

Polaridad: Negativa

2.2.1.2. Alchemy API

nicamente se ofrece en ingls y alemn. Para ms informacin ver apartado 2.1.2.3 Alchemy API.2.2.2. Extraccin de entidades, conceptos y eventos

2.2.2.1. NaturalExtractorNaturalExtractor de la empresa Bitext es un herramienta que aplicando tecnologa lingstica, permite extraer diferentes tipos de informacin a partir de grandes bases de datos de texto:

Entidades: nombres propios de personas, empresas, productos, lugares, etc, como Barack Obama, Agencia Espaola de Cooperacin Internacional, Avenida del Mar Mediterrneo

Conceptos: ideas o asuntos de los que trata un texto, como calentamiento global, pases en vas de desarrollo, fuentes principales de niveles de ruido urbano, etc.

Eventos: relaciones entre entidades y conceptos, como en la frase el presidente Barack Obama ha visitado recientemente los pases aliados de EEUU en el Golfo Prsico, de donde se extraen las siguientes relaciones: autor Barack Obama (presidente), accin visitar, objeto los pases aliados de EEUU en el Golfo Prsico.

Asimismo, NaturalExtractor permite la creacin y mantenimiento de bases de conocimiento (diccionarios especializados) especficas para cada cliente, para abordar problemas como la catalogacin automtica o la creacin de ontologas.2.2.2.2. Social Media AnalyticsLA API Social Media Analytics de la empresa DAEDALUS realiza la deteccin y clasificacin de elementos de un texto en categoras predefinidas: Entidades nombradas (nombres de personas, lugares y organizaciones), conceptos (palabras clave), expresiones de tiempo, expresiones monetarias, URIs, nmeros de telfono y otras expresiones mencionadas en el texto. Adems realiza una clasificacin basada en la polaridad para determinar si expresa un sentimiento negativo, positivo o neutral. El sistema funciona para textos en ingls y castellano.Es una API que funciona bajo licencia, el coste de la licencia lo determina el nmero de llamadas a la API y la duracin.2.2.2.3. Alchemy API

AlchemyAPI es una plataforma basada en la nube que proporciona etiquetado semntico a ms de 24.000 desarrolladores en seis continentes, y procesa +3 millones de llamadas a la API por mes. Su uso de hasta 1.000 llamadas al da a la API es gratuito. AlchemyAPI ofrece el conjunto de funciones de procesamiento de lenguaje natural, incluyendo: extraccin de entidades con nombre, anlisis de los sentimientos, el etiquetado concepto, extraccin de autor, extraccin de relaciones, deteccin de idioma, extraccin de palabras clave, extraccin de citas, intent mining, y categorizacin de temas.AlchemyAPI utiliza el anlisis lingstico profundo, el procesamiento estadstico del lenguaje natural y aprendizaje automtico para analizar contenido, extraer metadatos semnticos: informacin sobre personas, lugares, empresas, temas, idiomas, etc.Las funcionalidades que presenta son:

Extraccin de entidades nombradas. Identifica personas, compaas, organizaciones, ciudades, pero slo para ingls y utiliza una lista fija de entidades.

Extraccin de relaciones: Identifica relaciones Sujeto accin objeto mezclando el anlisis de opinin con la extraccin de entidades. Etiquetas conceptuales: Etiqueta automticamente textos y documentos. Es capaz de crear etiquetas abstractas. Actualmente slo disponible para ingls.

Extraccin de trminos/ palabras clave: AlchemyAPI es capaz de extraer topic keywords de contenido escrito. Esta funcionalidad existe para castellano. Dentro de esta funcionalidad, el anlisis de opinin slo est disponible en ingls y castellano.

Categorizacin de temas y textos: Al igual que en la funcionalidad de topic keywords, esta funcionalidad est disponible para castellano y se limita a una lista fija de categoras.2.2.2.4. OpenCalaisOpenCalais proporciona un servicio web que automticamente asocia contenido semntico al contenido enviado, tardando entre 0,5 y 1 segundo en responder con las entidades, hechos y eventos que ha encontrado en el texto, est basado en procesamiento del lenguaje natural es un modelo tipo hgaselo usted mismo que requiere experiencia tcnica. Las entidades: son personas, lugares, empresas, zonas geogrficas.

Eventos: son cosas que pasan como desastre natural,

Hechos: son relaciones como John Doe es el CEO de Acme.Esta API permite de manera gratuita procesar hasta 4 transacciones por segundo con un lmite de 50.000 al da.OpenCalais proporciona su servicio para textos en ingls, francs y castellano, pero el conjunto de entidades en francs y castellano es mucho ms limitada que en ingls.

2.2.3. Crawlers web

2.2.3.1. Nutch

Se trata de un webcrawler de cdigo abierto, de gran relevancia por ser desarrollado por la Apache Software Foundation y utilizado ampliamente en investigaciones de la web. A la par que su reputacin, se encuentra su manejo, que puede resultar complejo si no se dominan sus comandos esenciales. Tiene dos componentes claves:

Araa (Crawler): descubre y recupera pginas web

El indexador (Indexer): Disecciona las pginas y construye palabras claves basadas en sus ndices.

Para realizar las bsquedas dentro del ndice que genera Nutch utiliza Lucene, que es una librera que permite la bsqueda basada en texto. En la ltima versin se delega la indexacin y bsqueda remota a SOLR.

Dado un fichero donde se identifican las fuentes en forma de URLs, que admite en su definicin de expresiones regulares, descubre y recupera las pginas hasta un grado de profundidad definido. El Crawler es capaz de comprobar si una pgina ha sido previamente indexada y, de ser as, si ha sido modificada, con lo que el proceso de indexacin y recuperacin es rpido.

El sistema de indexacin est basado en filtros, y es personalizable cuando el crawler recupera una pgina se tiene acceso al documento, con lo que es posible disponer de los datos y almacenarlos de manera personalizada, o de realizar cualquier tratamiento sobre ellos previo a su indexacin. Nutch se puede usar tanto en plataformas Windows como Linux.

2.2.3.2. Moreover TechnologiesMoreover Technologies es un proveedor de productos empresariales para inteligencia de negocio y agregacin de noticias. Presenta diferentes productos Newsdesk: Monitorizacin de noticias y social Media: Ofrece un servicio de monitorizacin de medios: noticias, social media, medios impresos, televisin y radio. Aade 2.500 post por minuto y permite el anlisis de 250 millones de artculos en un instante. Permite monitorizar simultneamente mltiples temas con keywords ilimitadas en todos los principales idiomas y mercados internacionales.

Metabase: API que devuelve, en XML sobre http, noticias y datos de social media en tiempo real. Cada artculo y post se categoriza con ms de 50 piezas de metadatos descriptivos para indexado detallado y media analytics. Est orientado a empresas que ya tenga buscadores locales y manejen grandes bases de datos. Search engine toolkit: Un API de bsqueda que da acceso a los mismos datos que Metabase, pero en vez de un chorro de feeds, las empresas envan requerimientos individuales sobre determinados temas al buscador. El buscador devuelve los resultados en RSS de forma que sea fcilmente integrable en portales, sitios webs y aplicaciones. Esta solucin est indicada para empresas que no requieran almacenar datos ni requieran de un buscador.

2.2.4. Semntica en BILas ontologas son la solucin tcnica necesaria cuando se gestionan grandes cantidades de datos dinmicos y heterogneos, dado que permiten a las mquinas entender y procesar tales datos. Una de las capacidades fundacionales de las tecnologas semnticas es la habilidad de extender las ontologas, desde un punto de vista prctico esto significa que se pueden aadir nuevas clases, relaciones e instancias e incluso ontologas completas de forma que se ample el dominio de conocimiento segn vaya siendo necesario.

El anlisis de inteligencia de negocio en el mbito de medios sociales es un campo donde es crtico las grandes cantidades de datos heterogneos: provenientes de mltiples fuentes, expresados de forma diferente, donde una fuente hace referencias a otra, donde aparecen lderes de opinin, velocidad o corrientes de opinin, etc. Las ontologas ayudan a formalizar y representar de forma nica informacin heterognea y dinmica contribuyendo a que las mquinas puedan procesarla.Un concepto reciente en el mbito de la ingeniera de ontologas es networked ontologies que se define como:

Una Coleccin de ontologas vinculadas mediante diferentes relaciones como mapeado, modularizacin, versionado y dependencia.

En esta definicin se parte de cuatro supuestos sobre las ontologas: Son Dinmicas: las ontologas evolucionan.

Estn en red: las ontologas estn interconectadas mediante mapeados.

Son Compartidas: las ontologas son compartidas por las personas y las aplicaciones, y

Estn Contextualizadas: las ontologas son dependientes del contexto en el que se han construido o utilizado.

Proyectos previos han implementado el concepto networked ontologies en casos en los que el dominio de conocimiento era tan grande y dinmico que un modelo central no era una solucin ni ptima ni flexible. Por ejemplo, el proyecto AquaRing haca uso de siete ontologas diferentes, donde cada una cubra una porcin concreta del dominio, y donde un proceso de aprendizaje las alineaba. AquaRing haca uso de conocimiento acordado por comunidades internacionales de prctica, sin reinventar la rueda, reutilizando conocimiento existente siempre y cuando fuera necesario y permitiendo bsqueda multilinge sobre contenidos heterogneos y fsicamente distribuidos que versaban sobre un dominio de conocimiento muy amplio como especies biolgicas, biologa marina, buques, hbitats, zonas de pesca, astronoma y educacin.2.2.5. Recursos lexicogrficos

2.2.5.1. EuroWordnet

EuroWordNet es una base de datos multilinge con wordnets para varios idiomas europeos (Holands, Italiano, Castellano, Alemn, Francs. Checo y Estonio). Su fin ltimo es aadir conocimiento semntico a cualquier recurso.

Los wordnets se estructuran en synsets (conjuntos de palabras sinnimas) con relaciones semnticas bsicas entre ellos. Cada wordnet representa un nico sistema de lexicacin interno al idioma.EuroWordNet se considera un mapa semntico multidimensional, ya que en un wordnet individual cada palabra se coloca con relacin al resto de las palabras en esa lengua y, en la base de datos multilinge, estas redes relativas o mapas se conectan entre ellos a travs de un ndice de significados del ingls.Los wordnets estn a su vez enlazados al Inter-Lingual-Index. A travs de este ndice los idiomas se interconectan de forma que es posible ir de una palabra de un idioma a palabras similares en otro idioma. El ndice tambin proporciona acceso a una ontologa de alto nivel con 63 distinciones semnticas. Esta ontologa proporciona un marco semntico comn para todos los idiomas, de forma que las propiedades especficas de cada idioma se mantienen en el wordnet individual.EuroWordnet fue concebida para aplicaciones de recuperacin de informacin multilinge, con el fin de mejorar la llamada (recall) en recuperacin de informacin mediante la expansin de la(s) palabra(s) clave de un usuario a un conjunto ms amplio de variantes y palabras relacionadas en cualquiera de las lenguas interconectadas. Por ejemplo:

Palabra clave inicial: cabalgar Lista expandida de palabras clave: cabalgar; jinetear; conducir; mover; transitar, cavalcata; passeggiata; anadare; muoversi; ride; drive; move; trave; go; berijden; rijden; bewegen; reizen; gaan.Otros propsitos de EuroWordNet son:

Servir de esqueleto de los lxicos semnticos y bases de conocimiento en el futuro, necesarios para desarrollar sistemas de reconocimiento y comprensin automtica del lenguaje.

Servir de punto de partida para la elaboracin de un lxico computacional para la Traduccin Automtica.

Servir de herramientas de aprendizaje de las lenguas, en las que las personas que aprendieran una lengua pudieran ojear el vocabulario de una lengua a travs de la red a partir de una palabra conocida para ellos.

Los correctores gramaticales y ortogrficos pueden hacer uso de la informacin semntica para lograr reglas ms precisas.

El etiquetado automtico de significados en corpus textuales.2.2.5.2. FreeLing

FreeLing es una suite de herramientas para anlisis de lenguaje de cdigo abierto. Est diseado para ser utilizado como una librera externa desde cualquier aplicacin que requiera anlisis de lenguaje. Entre otras, las principales funcionalidades son: Tokenizacin de texto

Particin de frases

Anlisis morfolgico

Tratamiento de sufijos, retokenizacin

Reconocimiento multipalabra flexible

Prediccin probabilstica de categoras de palabras desconocidas

Deteccin de entidades nombradas

Reconocimiento de fechas, nmeros, ratios, monedas y magnitudes fsicas

Anotacin de sentido y desambiguacin basada en Wordnet.

etc..

Actualmente da soporta a Castellano, Cataln, Gallego, Italiano, Ingls, Ruso, Portugus, Gals y Bable.2.2.5.3. TreeTagger

http://www.ims.uni-stuttgart.de/projekte/corplex/TreeTagger/2.3. Conclusiones de estado del arteLa valoracin del sentimiento difiere en porcentaje de aciertos, siendo alrededor de un 60% cuando se utiliza en mbitos generales (bajando al 50% cuando se utiliza lenguaje coloquial) y elevndose al 80% en mbitos muy concretos, es decir, donde se tenga un buen diccionario especializado junto con reglas o macros.

Con respecto a la extraccin de indicadores, conceptos y atributos: para ser personalizables se necesitaran diccionarios propietarios, con los que la efectividad en su extraccin dependera del grado de concrecin de ste, con lo que cuanto ms especfica sea la temtica mejor.

El crawler Nutch como tal no es un producto, es de cdigo abierto y aunque hay muchsima informacin en la web, la documentacin no siempre va a ser la ms clara y completa. No es un sistema fcil de configurar, y por cada fuente de datos hay que crear un filtro que la procese y la indexe. No incorpora herramientas de Valorizacin, aunque en la fase de recuperacin se pueden hacer llamadas a libreras o herramientas externas que realicen este trabajo, esto limitara el rango de herramientas de valorizacin a utilizar.

Las herramientas de crawling de Moreover estn orientadas a noticias, aunque es lder en su sector y tambin utiliza informacin de medios sociales.

De las herramientas en el mercado analizadas ninguna basa su funcionamiento en tecnologas semnticas. S que se utilizan diccionarios para por ejemplo la extraccin de entidades pero dichos diccionarios deben ser entrenados para cada dominio concreto.

En el campo de la inteligencia de negocio aplicada al mbito de medios sociales, el conocimiento no permanece esttico y evoluciona al igual que lo hacen los productos y servicios y la madurez de los clientes en lo que al uso, disfrute y exigencia de los productos/servicios se refiere. Es donde una networked ontology explota toda su potencial.La utilizacin de ontologas permite un modelado del dominio de conocimiento ms complejo y rico y por lo tanto con mayor potencia que un diccionario. Las ontologas dotan adems de posibilidades de inferencia y razonamiento mediante reglas de negocio. La ventaja de la utilizacin de ontologas queda plasmada mediante el siguiente ejemplo que aplica al proceso de recoger informacin de medios sociales y sitios web y realizar un prefiltrado.Supongamos que nos encontrramos dentro de un mbito deportivo, donde una vez realizado el crawling sobre fuentes de Internet de dicho dominio, se hubieran obtenido como resultado del filtrado, mediante una ontologa del dominio deportivo, tres textos (reales extrados de www.as.com) donde de cada uno de ellos se hubiera realizado la extraccin de entidades nombradas de la siguiente forma:

Resultado1: El encuentro de ida de los cuartos de final de la Copa del Rey, que acab con triunfo del Real Madrid ante el Valencia por 2-0 supuso el tercero consecutivo que el meta Iker Casillas mantiene a cero.

Extraccin de entidades: Encuentro | Cuartos de final |Copa del Rey | Triunfo | Real Madrid | Valencia | Meta | Iker Casillas.

Resultado2: "Sufriremos en la vuelta, pero el resultado es ptimo y vamos con la alegra y la ilusin de pasar la eliminatoria", dijo el guardameta en Real Madrid TV tras el triunfo de su equipo en el partido de ida

Extraccin de entidades: Vuelta | Resultado | Eliminatoria | Guardameta | Real Madrid | TV | Real Madrid TV | Triunfo | Equipo | Partido | Partido de ida.

Resultado3: A Casillas no le afecta casi nada.

Extraccin de entidades: CasillasSupongamos que deseamos realizar una bsqueda con el texto de consulta Casillas. Dado que la ontologa modela el entorno deportivo, la expansin de la consulta dira que la nueva consulta es:

Casillas AND Iker Casillas AND Portero AND Portera AND Palos AND Meta AND Guardameta AND Real Madrid AND Seleccin Espaola.

Porque la ontologa conoce los conceptos equipo de ftbol y sus diferentes instancias, por ejemplo, Real Madrid y Valencia. As mismo conoce los conceptos portero, guardameta, meta, palos y portera que considera sinnimos e Iker Casillas sera una instancia de portero, que adems lo es del Real Madrid y de la Seleccin Espaola.Lanzando la bsqueda expandida, se devolveran los 3 resultados antes mencionados. Mientras que en el caso de una bsqueda textual con Casillas, el resultado nmero 2 no sera devuelto dado que Casillas como tal no aparece nombrado.En caso de no utilizar la ontologa, la expansin de la consulta la tendra que realizar el usuario en base a su experiencia y no una aplicacin de forma automtica.ZUENKNOW permitir que la consulta se expanda sin intervencin humana, permitiendo realizado un pre-filtrado automtico de resultados provenientes de un web crawling de mltiples sitios web; teniendo en cuenta parmetros como fecha, fuente de la que proviene, autor del texto, etc y aadiendo la semntica de cada resultado como otra opcin de filtrado.Los resultados una vez filtrados sern analizados de nuevo para la posterior extraccin de conclusiones necesarias para la toma de decisiones empresariales, utilizando de nuevo tecnologas semnticas y procesamiento de lenguaje natural (NLP).

La utilizacin de EuroWordNet en ZUENKNOW permite que la ontologa se enriquezca en trminos y que sea multilinge. De forma que ante la aparicin de un nuevo trmino (por introduccin manual o aprendizaje) se obtendra su synset (conjunto de sinnimos,) homnimos, hipernimos, holnimos y mernimos.A continuacin se detalla en qu se diferencia EuroWordNet de un diccionario convencional.

Los Diccionarios convencionales ofrecen:

Descripciones semnticas (glosa).

Deletreado.

Pronunciacin.

Formas derivadas.

Etimologa.

Informacin gramatical.

Usos.

Sinnimos/antnimos.

Lo que aporta EuroWordNet es:

Descripciones basadas en conceptos.

Relaciones psicolingsticas entre palabras.

Es decir un diccionario dira que rbol es: planta perenne, de tronco leoso y elevado, que se ramifica a cierta altura del suelo. (RAE)

Pero no dice:

Que el rbol tiene hojas y races.

Que las paredes de sus clulas estn compuestas de celulosa.

Que es un organismo vivo.

Tampoco se dice:

Si existen otros tipos de plantas.

Si existen distintos tipos de rboles.

Cules son.

2.4. Antecedentes de las empresas participantes2.4.1. ecmwareecmware es una organizacin fruto de un spin off de INNObask.

INNObask una organizacin en constante investigacin de oportunidades de mercado a partir de la aplicacin de tecnologas en los procesos de las organizaciones. En el ao 2009 inicio una lnea de investigacin que en un primer momento se inicio como un observatorio de tendencias, analizando la evolucin de las redes sociales desde un mbito de negocio. En los aos posteriores su investigacin se centro en como hacer negocio con la interaccin que estaban realizando las personas con las diferentes redes. Se identifico que el potencial de las redes sociales para las organizaciones podra ser enorme si esa informacin se trataba en varias fases, en las a partir de unos procesos se pona en valor la informacin.

Figura 1 Fases de procesamiento de informacin

Fruto de todas esta investigacin se cre la organizacin ecmware con el objetivo de explotar en forma de negocio todo lo creado. Para la creacin de ecmware se busc financiacin y personas que pudieran dar recorrido al negocio. ecmware es hoy en da una empresa con dos aos de recorrido, donde puede hablar de referencias de organizaciones para las que trabaja.

Proyectos de I+D Previos2.4.2. AURMANIndicar los antecedentes que motivan el desarrollo de este proyecto.

( Explicar los objetivos tecnolgicos estratgicos de la empresa solicitante. Indicar cmo se ha llegado a esta concrecin; a partir de los itinerarios de innovacin, reflexin estratgica.

( Explicar experiencias previas en participacin de proyectos de I+D.2.5. La novedad tecnolgica del proyecto y los resultados esperadosLa utilizacin de ontologas para el filtrado de resultados del crawler y la bsqueda de resultados con expansin de consulta mediante la ontologa, permite innovar en la extraccin de entidades y atributos y as mismo da una potencialidad mayor a la bsqueda, que en otro caso recae directamente en la experiencia y pericia del usuario.

La utilizacin de ontologas como base permite diferenciarse de la competencia, en tanto en cuanto, dichas ontologas sean lo suficientemente potentes en lo que a la porcin de dominio de conocimiento y calidad de representacin del mismo, logren alcanzar. En este mbito ZUENKNOW har uso de tecnologas de ontologas en red (networked ontologies) que permiten ampliar el dominio de conocimiento segn se vaya necesitando mientras que el aplicativo permanece inalterable.massssssssssssssssss3. Oportunidad del proyecto

Explicacin de la oportunidad del proyecto, por qu y para qu se acomete el proyecto.

ecmware en su afn de ser competitivos al mximo ha estado colaborado con Tecnalia en un modelo que le permita situarse en un escenario de innovacin constante. Todo el esfuerzo econmico para el desarrollo de conocimiento y tecnologa en lo que compete a la subcontratacin de Tecnalia ha corrido de los fondos propios de la organizacin.

En esta primera fase aun siendo un esfuerzo considerable ecmware asumi todos los costes dado que para la organizacin contar con socios tecnolgicos que le permitan estar a la vanguardia en innovacin es estratgico. El proyecto requiere de un mayor esfuerzo en esta fase de lanzamiento del proyecto identificado a nivel econmico y de recursos, los tiempos en los que la organizacin podra acometer el proyecto con recursos propios se establece en unos 6 aos de desarrollo ralentizndose el mismo con el objetivo que la organizacin pueda hacer frente a los costes econmicos. Esto hara que el resultado estara fuera de tiempo que aunque ira bien encauzado, otras organizaciones podra ser ms rpidas y hacer obsoletos lo resultados. Esto en un mbito nacional podra ser menor el dao a la competitividad de la organizacin, pero en un mbito internacional, el principal objetivo de este proyecto, la dejara fuera de mercado.

A partir de estas consideraciones vemos una oportunidad que el Gobierno Vasco nos pueda ofrecer herramientas que nos permitan no perder la oportunidad de ser un referente internacional en servicios de inteligencia de negocio, pudiendo hacer del negocio un crecimiento rpido en volumen de negocio, mercado y recursos humanos.

Oportunidad para AURMAN (Sugerencia: ZUENKNOW representa para AURMAN la oportunidad de ampliar mercado y facilitar la estrategia de internacionalizacin mediante una herramienta que permitir hacer uso del conocimiento y experiencia de AURMAN a la hora de medir el impacto en la red de un producto/marca o de una campaa en dichos medios sociales.

AURMAN conocedora de las necesidades de las empresas y de las soluciones a las mismas, en cada una de sus actividades: Comunicacin estratgica, Publicidad y Comunicacin online, considera a ZUENKNOW como la oportunidad de mejora de su espectro de soluciones en lo que respecta a la medicin del impacto de las campaas en la red, que por un lado le permite tener indicadores objetivos y por el otro le ofrece el conocimiento que permite afinar el diseo de campaas en base al estudio de los indicadores obtenidos en campaas anteriores, respecto a campaas de la competencia y al estado actual de la marca/producto. En resumen se obtendra una herramienta de BI en lo que a campaas en la red se refiere que sintetiza toda la experiencia acumulada por AURMAN.)

Figura 2 Servicios de AURMAN4. RIESGOS Y BENEFICIOS

( Longitud recomendada: Al menos 2 pginas

4.2. RIESGOS TECNOLGICOSExplicacin de los riesgos tecnolgicos que implica el desarrollo del proyecto. Anlisis y relevancia de los riesgos y retos tecnolgicos del proyecto as como la capacidad de la empresa o empresas para superarlos.

RIESGO IDENTIFICADOIMPACTOPLAN DE CONTINGENCIA

No se posea la suficiente experiencia que permita definir ontologas lo suficientemente potentes para que el filtrado y posterior bsqueda den mejores resultados que una bsqueda y filtrado manual.ALTOReutilizar en la medida de la posible recursos ontolgicos como no ontolgicos previamente existentes adaptndolos en cada caso concreto.

4.3. RIESGOS DE MERCADOExplicacin de los riesgos de mercado que implica el desarrollo del proyecto.

Anlisis de la certidumbre y del potencial de mercado en funcin de los usos y utilidades del nuevo producto o proceso y del grado de demanda del mismo.

Destacar que se ha identificado el riesgo de mercado pero que est controlado. Para ello, describir por cada riesgo identificado, cmo se ha pensado minimizar su impacto (despliegue paulatino de red comercial, venta a travs de canales de comercializacin externos, alianzas o acuerdos comerciales con distribuidores en terceros pases, contactos con ICEX o cmaras de comercio, asociaciones sectoriales).RIESGO IDENTIFICADOIMPACTOPLAN DE CONTINGENCIA

Adaptacin a la idiosincrasia de cada pasALTOSe iniciara el proceso de internacionalizacin en fases y identificando metodolgicamente variables de adaptacin, haciendo una adaptacin incremental y con experiencias para cada una de las fases.

No alcanzar el suficiente modelado del producto automatizando los procesosALTODesarrollo de un sistema de gestin de los procesos mediante asistentes que permita la fcil gestin de los mismo sin una curva de aprendizaje alta

Alcanzar los objetivos en el tiempo adecuadoALTODotar a la organizacin de recursos necesarios en corto plazo que permita el desarrollo del proyecto en un timing adecuado

Dificultades de tecnologas aplicadas en el mercado espaol en otros mercadosALTOIdentificar los socios adecuados en los pases objetivo que puedan implantar o desarrollar los recursos tecnolgicos necesarios y que no se encuentren ese idioma

FinanciacinALTOIdentificacin de herramientas de financiacin que permitan el desarrollo del proyecto en el tiempo justo

4.4. PREVISIONES DE EXPLOTACIN COMERCIAL/ ANLISIS DE BENEFICIOS.Anlisis y explicacin de las previsiones de impacto en la competitividad de la empresa o empresas participantes; en sus cuotas de mercado y ventas, en el empleo, etc.

Anlisis y explicacin de las previsiones de comercializacin del producto en el mercado local, nacional e internacional.

Proyeccin del potencial de mercado y/o impacto en funcin de los usos y utilidades de los nuevos productos y/o procesos en los que el proyecto puede impactar. Anlisis de los potenciales beneficios Econmicos, Ambientales, Sociales.

4.4.1. Mercado potencial

Una vez se defina el planing del proyecto a partir de la priorizacin de mercados identificando las variables de accesibilidad de adaptacin de producto, se procedera al escalado de pases objetivo, en el proyecto y en esta fase aun prematura se contemplan estos mercados:

Europa

Suramrica4.4.2. Anlisis econmico y financiero

5. GRUPO DE INVESTIGACIN

Indicar de manera sinttica la composicin del grupo de investigacin, su experiencia respecto a este proyecto y lo que puede aportar al desarrollo del mismo.

( En este apartado debe incluirse una breve descripcin del cv del jefe de proyecto de la empresa as como de las personas de su equipo que vayan a participar en las actividades del proyecto.

( De manera adicional, incluir los cvs (en formato breve) de los investigadores que colaboran desde la RVCTI.

( Longitud recomendada: Al menos 2 pginas.

5.2. ECMWARE

Rol en el proyecto:

Personal investigador:Jefe de Proyecto: Agustn BustoItxasne MonasterioZurie Aguirre

Carlos Abrantes5.3. AURMAN

Rol en el proyecto:

AURMAN ofrecer su experiencia en el diseo y medicin de campaas de publicidad en muy diferentes mbitos como: Alimentacin y bebidas.

Comercio, distribucin y consumo.

Fundaciones y Asociaciones.

Industria, automocin y accesorios.

Instituciones pblicas y privadas.

Medios de comunicacin.

Ocio, cultura y deporte.

Salud y cuidados personales.

Servicios e infraestructuras de valor.

Servicios financieros y seguros.

La variedad de clientes de AURMAN asegura que su conocimiento tiene un amplio espectro, abarcando sectores de pblico diferenciados, con sensibilidades heterogneas y que hacen uso de los medios sociales de muy diferente forma. Por lo tanto aplicar dicho conocimiento para su decantacin en forma de un herramienta que automatice un proceso hasta ahora manual. Dado que una herramienta que automatice el proceso puede dar lugar a la extraccin de indicadores impensables si el proceso fuera manual, AURMAN tambin investigar cmo incorporar dichos indicadores a su proceso de valoracin y diseo de campaas.Personal investigador:6. PLANIFICACIN DEL PROYECTO. FASES Y TAREASDescripcin de la planificacin en el tiempo del proyecto:

Plazos de ejecucin del proyecto: duracin, nmero de ejercicios, fecha de inicio y fecha de terminacin.

Fases en las que se estructura el proyecto: descripcin breve de cada fase incluyendo la fecha de inicio y la duracin estimadaExplicacin de las tareas a realizar en el proyecto incluyendo para cada tarea, su objetivo, los resultados esperados y el nmero de semanas planificadas para su ejecucin.

( Es importante no slo describir las fases, si no que la descripcin de las mismas responda las preguntas cmo vamos a alcanzar el objetivo del proyecto, cmo vamos a minimizar los riesgos, porqu lo hacemos as y no de otro modo.

( Longitud recomendada: Al menos 2 pginas.

6.2. Planificacin global estimada del proyecto y fases en las que se estructura

Fecha de Inicio:

Fecha de Finalizacin:

Duracin:

Nmero de Ejercicios:

A continuacin se identifican y definen las tareas en que se descompone el trabajo a realizar dentro de cada una de las Fases en que se divide el desarrollo del proyecto.

FASE/TAREADESCRIPCINDURACINFECHAS

FASE 0Gestin y Coordinacin

Tarea 0.1Gestin y Coordinacin

6.3. Diagrama de Gantt

6.4. Descripcin de las tareas a realizar y los tiempos estimados de ejecucin

6.4.1. Fase 0: Gestin y Coordinacin6.3.1.1. Tarea 0.1: Gestin y CoordinacinT0.1Gestin y coordinacin del Proyecto.

Objetivo de la Tarea

Descripcin de Actividades

Relacin de Entregables

Responsable

Grupo de Trabajo

6.4.2. Fase 1: Plan de Negocio6.3.2.1. Tarea 1.1: Estudio de Mercado

6.3.2.2. Tarea 1.2: Plan Econmico-Financiero6.3.2.3. Tarea 1.3: Extensin del Plan de Negocio a nuevos productos y mercados6.4.3. Fase 2: Actividades de I+D6.4.4. Fase 3: Lanzamiento de la nueva empresa 6.4.5. Fase 4. Validacin y cierre

6.3.5.1. Tarea 4.1. Pruebas de validacin6.3.5.2. Tarea 4.2. Documentacin y cierre6.5. Descripcin de los entregables del proyecto por hito

-Naturaleza: informe; especificaciones; tiles; prototipo; otros.

-Tipo: utilizacin pblica del resultado; distribucin restringida entre participantes; utilizacin interna entre participantes.TAREAHITOTITULOFECHANaturalezaTIPO

H1E1

H2

H3

7. PRESUPUESTO GLOBAL DEL PROYECTO

Tabla de presupuestos por participante y ejercicio indicando:

-Mano de obra (Horas y presupuesto)

-Inversin

-Gastos

-Subcontratacin

-Viajes

( Longitud recomendada: Una pgina (o media) por participante

Las siguientes tablas muestran la distribucin de horas y presupuestos por ejercicio para cada uno de los participantes, as mismo la ltima tabla muestra la distribucin anualizada de costes.

HORAS

PARTICIPANTE201320142015

TECNALIA

TOTAL

PRESUPUESTO

PARTICIPANTE201320142015

TECNALIA

TOTAL

DISTRIBUCIN ANUALIZADA DE COSTES

AoEntidadHorasMano ObraInversinGastosSubcontratacinViajesTotal

2013

2014

2015

TOTAL PROYECTO

8. DESCRIPCIN DE SUBCONTRATACIN DE AGENTES EXTERNOS

Detalle de los Agentes de la RVCT y Otros Agentes Externos que van a ser subcontratados, indicando el contenido del trabajo a realizar por cada uno de ellos y su encaje dentro del proyecto.

9. JUSTIFICACIN DE INVERSIONES Y GASTOS REALIZADOSJustificacin de las inversiones y gastos incorporados al Presupuesto( Evitar poner partidas de importe elevado (superior a 20k) bajo denominaciones genricas como material mecnico o licencias, detallar suficientemente los gastos

( Explicar porqu es necesario realizar estos gastos / inversiones (porqu no se puede usar material o equipo propio, prstamos,..) ( Longitud recomendada: Una pgina (o media)

9.2. Inversiones

9.3. Materiales

9.4. Subcontrataciones

9.5. Otros gastos

10. AYUDA PROYECTOSIndicar las ayudas recibidas por este proyecto e instituciones pblicas o privadas.- Pulsar botn de ayuda de la aplicacin.

- Indicar en la pantalla que se presenta los datos de ayuda que se solicitan:Empresa

Entidad

Nombre Programa

Costes subvencionables presentados

Importe solicitado

Importe concedido

Fecha de concesin

La informacin que se rellena en este punto es la que aparece en el Certificado Econmico que se debe presentar firmado.( Longitud recomendada: Una pgina (o media)

11. EFECTO INCENTIVADORSe considera:Aumento sustancial del tamao del proyecto o actividad, donde la ayuda servira para incrementar el coste total del proyecto, sin descenso del gasto del beneficiario en comparacin con una situacin sin ayuda. Tambin servira para elevar la cantidad de personal dedicado a I+D+i.Aumento sustancial del mbito de aplicacin del proyecto, donde la ayuda incrementara la cantidad de resultados esperados del proyecto o su calidad, abarcando un proyecto ms ambicioso, con mayores probabilidades de xito y donde los avances cientficos o tecnolgicos sean mayores.Aumento sustancial del ritmo de ejecucin del proyecto, donde la ayuda servira para reducir el tiempo de terminacin del proyecto en comparacin con el mismo proyecto sin contar con ayudas.Aumento sustancial del importe total gastado en I+D+i, donde la ayuda incrementara el gasto total en I+D+i de la empresa o en un proyecto en particular, sin reducir presupuesto ya destinado a otros proyectos. Aumento del gasto total en I+D+i como porcentaje del volumen de negocios.

(Se completar la tabla en funcin de los indicadores que se apliquen en cada proyecto, no es necesario completar toda la tabla)

Longitud recomendada: Una pgina.

Tabla para la justificacin de los indicadores:Sin ayudaCon ayuda

Aumento sustancial del tamao del proyecto o actividad

Aumento sustancial del mbito de aplicacin del proyecto o actividad

Aumento sustancial del ritmo de ejecucin del proyecto

Aumento sustancial del importe total gastado en I+D+i

12. CONTRIBUCIN DEL PROYECTO AL DESARROLLO SOSTENIBLE Y A LA PROTECCIN DEL MEDIOAMBIENTEAnlisis y explicacin de las repercusiones medioambientales que implica el desarrollo del proyecto

13. VINCULACIN AL SISTEMA VASCO DE INNOVACIN.

Detalle, en caso de que existiera, de la vinculacin del proyecto al Sistema Vasco de Innovacin haciendo referencia a los siguientes aspectos:

-Ubicacin en Parques Tecnolgicos o en espacios de innovacin vinculados a las Universidades.

-Demanda potencial de los servicios de la oferta cientfico-tecnolgica de la CAPV.

-Ubicacin en un Centro de Empresas e Innovacin (CEI) y/o posibilidad de titulacin por un CEI de la CAPV.

13.2. Ubicacin en Parques Tecnolgicos

TECNALIA se encuentra ubicada en el Parque Cientfico y Tecnolgico de Gipuzkoa se constituy en el ao 1994 y fue inaugurado en 1997. El principal objeto del Parque es contribuir al desarrollo socio-econmico y, de esta manera, aumentar la calidad de vida de las personas que viven en su entorno. La estrategia se basa en acercar los agentes econmicos que inciden en la generacin de proyectos avanzados desde el punto de vista tecnolgico, proporcionndoles una localizacin y unas infraestructuras adecuadas para que se genere el intercambio de conocimiento y puedan as surgir nuevos proyectos empresariales creadores de empleo y riqueza para el territorio.

Las empresas integradas en estos complejos tecnolgicos encuentran a su disposicin una inmejorable dotacin de servicios en continua evolucin y modernizacin: desde todo tipo de servicios de apoyo, tales como seguridad, mantenimiento, hostelera y ocio, hasta los servicios profesionales ms avanzados para la empresa en telecomunicaciones, apoyo e impulso de la investigacin, desarrollo e innovacin, cooperacin, formacin especializada e incubacin de nuevas empresas de base tecnolgica.

Los Parques Tecnolgicos disponen adems de las ms modernas instalaciones para la organizacin de todo tipo de congresos conferencias y jornadas, hecho que ayuda a la difusin de los resultados de los trabajos realizados. Y las empresas pueden contar con unas instalaciones que cubren en las mejores condiciones tanto sus necesidades presentes como las futuras.

Para que las empresas puedan estar ubicadas en este emplazamiento deben cumplir unas normas:

Empresas no contaminantes.

Empresas tecnolgicamente avanzadas.

Departamentos y centros de I+D.

Otras empresas de inters estratgico.

13.3. Adecuacin de los objetivos del proyecto con el Plan Ciencia Tecnologa Sociedad http://www.trustyou.com/

http://demos.bitext.com/naturalopinions/OpPosNeg.aspx?sector=telcos

http://demos.bitext.com/naturalopinions/

http://api.daedalus.es/sma-info

http://www.opencalais.com/calaisAPI

Haase P, Rudolph S, Wang Y, Brockmans S, 2006. Networked Ontology Model. NeOn Deliverable D1.1.1

C. Allocca, M. D'Aquin, and E. Motta. DOOR - Towards a Formalization of Ontology Relations. In Jan L. G. Dietz, editor, KEOD, pages 13{20. INSTICC Press, 2009.

Sabou M. et al, 2006. NeOn Requirements and Vision Deliverable.

Aquaring W3C Semantic Web use case: http://www.w3.org/2001/sw/sweo/public/UseCases/Aquaring/

http://nlp.lsi.upc.edu/freeling/

Pgina 1 de 1