ESEI::escola superior de enxeñería informática …...2 Índice da Presentación ESEI::Escola...
Transcript of ESEI::escola superior de enxeñería informática …...2 Índice da Presentación ESEI::Escola...
11
ESEI::escola superior de enxeñería informáticadepartamento de informática
universidade de vigocampus de ourense
http://www.ei.uvigo.es
Leiría, 02/06/2009 Florentino Fdez-RiverolaPortugal Departamento de Informática
22
Índice da Presentación
ESEI::Escola Superior de Enxeñería InformáticaEnxeñeiro Técnico en Informática de XestiónEnxeñeiro en Informática
Programa de doutoramento 2008 / 2010Tecnoloxías avanzadas para o desenvolvemento de software intelixente
Grupos de investigaciónDepartamento de Informática
Área de Linguaxes e Sistemas InformáticosÁrea de Ciencias da Computación e Intelixencia Artificial
SING::Sistemas Informáticos de Nova Xeración
Traballos actuais de investigación no grupo
Proxección do grupo de investigación
33
ESEI::ESEI::EscolaEscola Superior de Superior de EnxeEnxeññererííaa InformInformááticatica
Programa de Programa de doutoradodoutorado 2008 / 20102008 / 2010
Grupos de investigaciGrupos de investigacióónn
SING::Sistemas InformSING::Sistemas Informááticos de Nova ticos de Nova XeraciXeracióónn
TraballosTraballos actuaisactuais de investigacide investigacióón no grupon no grupo
ProxecciProxeccióónn do grupo de investigacido grupo de investigacióónn
44
Informática de Xestión (3) + (2) Enxeñería Informática
ESEI::Escola Superior de Enxeñería Informática
++
55
Infraestructura e servicios
ESEI::Escola Superior de Enxeñería Informática
66
+ información
ESEI::Escola Superior de Enxeñería Informática
77
ESEI::ESEI::EscolaEscola Superior de Superior de EnxeEnxeññererííaa InformInformááticatica
Programa de Programa de doutoradodoutorado 2008 / 20102008 / 2010
Grupos de investigaciGrupos de investigacióónn
SING::Sistemas InformSING::Sistemas Informááticos de Nova ticos de Nova XeraciXeracióónn
TraballosTraballos actuaisactuais de investigacide investigacióón no grupon no grupo
ProxecciProxeccióónn do grupo de investigacido grupo de investigacióónn
88
TADSI::Tecnoloxías Avanzadas para o Desenvolvemento de Software Intelixente
Programa de doutorado 2008 / 2010
99
ESEI::ESEI::EscolaEscola Superior de Superior de EnxeEnxeññererííaa InformInformááticatica
Programa de Programa de doutoradodoutorado 2008 / 20102008 / 2010
Grupos de investigaciGrupos de investigacióónn
SING::Sistemas InformSING::Sistemas Informááticos de Nova ticos de Nova XeraciXeracióónn
TraballosTraballos actuaisactuais de investigacide investigacióón no grupon no grupo
ProxecciProxeccióónn do grupo de investigacido grupo de investigacióónn
1010Grupos de Investigación
Departamento de Informática::I+D
Javier Rodeiro Iglesias
SI-06
Grupo de Informática Gráfica
Investigador Principal
Código
Grupo de Investigación
Florentino Fdez-Riverola
SI-04
SING: Sistemas Informáticos de Nueva Generación
Investigador Principal
Código
Grupo de Investigación
1111
ESEI::ESEI::EscolaEscola Superior de Superior de EnxeEnxeññererííaa InformInformááticatica
Programa de Programa de doutoradodoutorado 2008 / 20102008 / 2010
Grupos de investigaciGrupos de investigacióónn
SING::Sistemas InformSING::Sistemas Informááticos de Nova ticos de Nova XeraciXeracióónn
TraballosTraballos actuaisactuais de investigacide investigacióón no grupon no grupo
ProxecciProxeccióónn do grupo de investigacido grupo de investigacióónn
1212
SING::Sistemas Informáticos de Nova Xeración
Membros do grupo
SING::Sistemas Informáticos de Nova Xeración
15 miembros:5 profesores a TC (Ph. D.)2 profesores a TP (Ph. D.)1 profesor Visitante (Ph. D)7 profesores a TP
13 estudiantes 3er ciclo8 alumnos doctorado (2008-2010)5 alumnos doctorado (2009-2011)
becario1 pre-doctoral
1313
SING::Sistemas Informáticos de Nova Xeración
Overview
SING::Sistemas Informáticos de Nova Xeración
CBR (Case-based Reasoning):Sistemas de detección de intrusos (IDS, Intrusion Detection System) [HTTPHUNTING]Análisis del genoma humano, Bioinformática [GENECBR]Filtrado de correo Spam [SPAMHUNTING]
ANN (Artificial Neural Networks)Predicción de mareas rojas [FSfRT]Predicción de caudales en ríos [Galicia, Colombia]
MAS (MultiAgent Systems):MATRIX (Multiagent Architecture for TRaffic Information eXchange)
Text Processing: Information Retrieval & Text MiningAnálisis de publicaciones biomédicas (PubMed, Medline)
Otras técnicas:Rough Sets, Bayesian Networks, Fuzzy Logic
Otras líneas de investigaciónVoIP, QoS en redes TCP/IP
1414
ESEI::ESEI::EscolaEscola Superior de Superior de EnxeEnxeññererííaa InformInformááticatica
Programa de Programa de doutoradodoutorado 2008 / 20102008 / 2010
Grupos de investigaciGrupos de investigacióónn
SING::Sistemas InformSING::Sistemas Informááticos de Nova ticos de Nova XeraciXeracióónn
TraballosTraballos actuaisactuais de investigacide investigacióón no grupon no grupo
ProxecciProxeccióónn do grupo de investigacido grupo de investigacióónn
1515
HTTPHUNTING::Sistemas de Detección de Intrusos [1/5]introducción
SING::Traballos actuais de investigación no grupo
intrusión:acceso o utilización de recursos de una máquina de forma no autorizada por parte de un atacante
tipos de sistemas IDS:detección de utilización incorrecta (misuse detection | signature-based)
detección de patrones de tráfico de red o datos de aplicación sospechosossólo detectan ataques previos conocidos
detección de anomalías (anomaly detection system)reconoce intrusiones identificando contenido diferente al tráfico normal de la redestado normal en función de: carga de tráfico, protocolos, tamaño de paquetes, ...
basados en host (HIDS, Host Intrusion Detection Systems)basados en red (NIDS, Network Intrusion Detection System)IDS pasivos (passive IDS)
detectan una posible violación, registran información y generan una alertaIDS reactivos (reactive IDS)
responden ante una actividad ilegal: expulsando al usuario o reconfigurando firewalls
1616
HTTPHUNTING::Sistemas de Detección de Intrusos [2/5]obtención de datos de proba
SING::Traballos actuais de investigación no grupo
1717
HTTPHUNTING::Sistemas de Detección de Intrusos [3/5]datos dispoñibeis e representación dunha trama
SING::Traballos actuais de investigación no grupo
256.000 streams79% tramas vulnerables21% tramas seguras
representación da información de cada stream en HTTPHUNTING
medidas de similitud utilizadasURIMatch, PathMatch, ResourceMatch, ParamsMatchURILong, PathLong, ResourceLong
1818
HTTPHUNTING::Sistemas de Detección de Intrusos [4/5]modelo proposto
SING::Traballos actuais de investigación no grupo
1919
HTTPHUNTING::Sistemas de Detección de Intrusos [5/5]a ferramenta HTTPHUNTING
SING::Traballos actuais de investigación no grupo
2020
GENECBR.org [1/7]introducción
SING::Traballos actuais de investigación no grupo
todos los organismos conocidos están formados por células:simples: levadura (1 sola célula)complejos: humanos (trillones de células)
en el núcleo de cada célula se encuentra el ADN (ácido desoxirribonucleico):3% genes encargados de la codificación de los distintos cromosomas97% son secuencias de ADN no-codificante
un gen es un segmento de ADN que contiene la secuencia de codificación precisa para cada proteína:
las proteínas determinan el aspecto, metabolismo, conducta, resistencia a infecciones y enfermedades (...) de los organismosen el ser humano se estima que existen entre 30.000 y 45.000 genes
prácticamente todas las células de un organismo tienen los mismos genes, pero su expresión genética puede variar por diversos motivosel estudio de la variación genética proporciona nuevas fuentes de información para la identificación y el control de enfermedades
2121
GENECBR.org [2/7]microarrays de ADN
SING::Traballos actuais de investigación no grupo
características:matriz bidimensional de material genético que permite la automatización simultánea de miles de ensayospermiten obtener una visión “global” a nivel genético de las células:
de diferentes individuosde un mismo individuo en diferentes intervalos de tiempode diferentes tejidos de un mismo individuo
capaces de medir la expresión genética de decenas de miles de genes en un solo experimentoposibilitan el análisis de funciones e interacciones genéticas complejas a escala global
funcionamiento:soporte de silicio con fragmentos de material genético teñido, correspondientes a aproximadamente 40.000 genes (EST, Expressed Sequence Tags)hibridación con material genético procedente de un individuo concretoun escáner mide el grado de fluorescencia de cada celda en el microarray
2222
GENECBR.org [3/7]human genome U133A GeneChip (Affymetrix)
SING::Traballos actuais de investigación no grupo
soporte de silicio
material genético de referencia
muestra de ADN de un paciente
hibridación
medida del grado de fluorescencia
microarray data
2323
GENECBR.org [4/7]bioinformática::áreas de investigación actual
SING::Traballos actuais de investigación no grupo
tres campos de investigación principales:selección de genes (≡ selección de características en IA):
determinar qué genes son relevantes para identificar una determinada patología o para diferenciar entre varias patologías
predicción (≡ clasificación supervisada en IA)a la vista de los datos de un experimento, identificar si se trata de una persona sana o enferma; discriminar el tipo de patología para aplicar una terapia correcta
clustering (≡ clasificación no supervisada o agrupamiento en IA)descubrimiento de nuevos tipos de patología que no se ajustan suficientemente a una patología conocida
tres áreas de investigación paralela:visualización adecuada de experimentos y resultadosdescubrimiento de nuevo conocimiento biológico (interacciones genéticas, ...)análisis de bajo nivel (tratamiento de imágenes, correcciones de nivel, normalización)
el análisis de datos procedentes de microarrays presenta importantes retos:existencia de muchas variables (decenas de miles de genes) y escaso número de observaciones (cientos de experimentos) V.S. data mininggran probabilidad de obtención de falsos positivos con técnicas clásicas de IA
2424
GENECBR.org [5/7]arquitectura de GENECBR
SING::Traballos actuais de investigación no grupo
most relevantgenes = DFP
geneticallysimilar patients
revisedpredictionand final diagnostic
reclassification
gene-CBR
Initialprediction
GeneSelection
Clustering
PredictionKnowledgeDiscovery
2525
GENECBR.org [6/7]a ferramenta GENECBR
SING::Traballos actuais de investigación no grupo
2626
GENECBR.org [7/7]outras ferramentas desenvolvidas
SING::Traballos actuais de investigación no grupo
@Note[http://sysbio.di.uminho.pt/anote.php]
aAutomator[coming soon!]
DistributedAIBench[www.aibench.org/plugins]
GOaAIBench[www.aibench.org/plugins]
BFindIt![coming soon!]
BioSearch[coming soon!]
WhichGenes[www.whichgenes.org]
PathJam[www.pathjam.org]
OptFlux[www.optflux.org]
BioDR[coming soon!]
2727
SPAMHUNTING::Filtrado de correo spam [1/5]o problema do correo spam
SING::Traballos actuais de investigación no grupo
objetivo:aplicación práctica de los sistemas IBR (Instance-Based Reasoning) al problema de la detección de correo basura
corpus disponibles:ling spam: 2.869 (t) / 481 (s)junk-email: 2.236 (t) / 1796 (s)bruceg: 171.706 (s)divmov: 1.247 (s)spamassasin: 9.354 (s)
generación de una base de instancias unificada (formato xml) y un mecanismo de acceso eficiente (xml query)necesidad de corpus propio:
actualmente más de 30.000 mensajesprincipales retos:
compresión/descompresión de texto (≡ 190.000 mensajes)análisis de características relevantes ⇒ definición de una instancia en un sistema IBRnecesidad de operación en “tiempo real”
2828
SPAMHUNTING::Filtrado de correo spam [2/5]representación dos e-mails
SING::Traballos actuais de investigación no grupo
2929
SPAMHUNTING::Filtrado de correo spam [3/5]rede EIRN (Enhaced Instance Retrieval Network)
SING::Traballos actuais de investigación no grupo
11
22
33
44
3030
SPAMHUNTING::Filtrado de correo spam [4/5]visor da rede EIRN
SING::Traballos actuais de investigación no grupo
3131
SPAMHUNTING::Filtrado de correo spam [5/5]modelo proposto
SING::Traballos actuais de investigación no grupo
3232
FSfRT::Predicción da aparición de mareas bermellas [1/5]introducción
SING::Traballos actuais de investigación no grupo
objetivo:aplicación práctica de los sistemas CBR al problema de la predicción de Mareas Rojas
datos disponibles:35 estaciones oceanográficas monitorizadas por el CCCMMinformación del CMT en Galiciaimágenes de satélite
características del problema:proceso estocástico con un elevado número de variablesfalta de conocimiento sobre el problema. Necesario manejar incertidumbredatos de tipo numérico: incompletos, imprecisos, inconsistenciasdinamismo de las variables: problemas de heterocedasticidad y multicolinearidadla predicción debe ser lo suficientemente precisanecesidad de generar explicaciones
3333
FSfRT::Predicción da aparición de mareas bermellas [2/5]datos dispoñibeis
SING::Traballos actuais de investigación no grupo
base de datos de monitorización del CCCMM con información perteneciente a 35 estaciones oceanográficas situadas en la costa gallega desde el año 1992:
• TemperaturaTemperatura
• SalinidadSalinidad
• OxOxíígenogeno
• PHPH
• TransmitanciaTransmitancia
• FluorescenciaFluorescencia
• Recuento de diatomeasRecuento de diatomeas
• Recuento de pseudoRecuento de pseudo--nitzschianitzschia sppspp.
Superficie
5 metros
10 metros
15 metros
periodicidad semanal • termoclina
3434
FSfRT::Predicción da aparición de mareas bermellas [3/5]datos dispoñibeis
SING::Traballos actuais de investigación no grupo
datos procedentes del CMT en Galicia:
• ÍÍndice de afloramientondice de afloramiento(Dietrich et al., 1980)
diariamente (cada 8 horas)
3535
FSfRT::Predicción da aparición de mareas bermellas [4/5]datos dispoñibeis
SING::Traballos actuais de investigación no grupo
fotografías de satélite obtenidas por el sensor AVHRR (Advanced Very HighResolution Radiometer) de la serie NOAA (National Oceanic and AtmosphericAdministration)
• ÍÍndice de temperaturasndice de temperaturas • ÍÍndice de nubosidadndice de nubosidad
3636
FSfRT::Predicción da aparición de mareas bermellas [5/5]a ferramenta FSfRT
SING::Traballos actuais de investigación no grupo
3737
MATRIXMultiagent Architecture for TRaffic Information eXchange
SING::Traballos actuais de investigación no grupo
3838
AIBench.org [1/5]framework de programación de técnicas de Intelixencia Artificial
SING::Traballos actuais de investigación no grupo
3939
AIBench.org [2/5]características do framework
SING::Traballos actuais de investigación no grupo
framework ligero, no intrusivo, basado en MVC que posibilita el desarrollo de aplicaciones Java y permite:
conexión, ejecución e integración de operaciones con una entrada/salida bien definidadiseño default-driven e independiente del problema
el modelo subyacente de programación de operaciones presupone:la lógica puede ser desacoplada de la interfaz de usuariola interconexión de operaciones puede ser modelada utilizando el concepto de experimentosel programador está obligado a pensar antes de programar definiendo operaciones
modelo de operaciones de AIBenchoperación: unidad lógica definida a través de puertos
entradasalidaentrada/salida
elementos de AIBench:core: implementa el modelo de operaciones de AIBenchworkbench: Java Swing GUI (Graphical User Interface)plugins: operaciones, tipos de datos, vistasclipboard: permite la interconexión de plugins
4040
AIBench.org [3/5]interconexión de operacións
SING::Traballos actuais de investigación no grupo
4141
AIBench.org [4/5]arquitectura do framework
SING::Traballos actuais de investigación no grupo
4242
AIBench.org [5/5]aplicacións desenvolvidas
SING::Traballos actuais de investigación no grupo
Peptide-Driven Decision:
A tool for reproducible peptide identification to accurate absolute quantification of proteins in MALDI-TOF-MS experiments
Bacterial Identification:
A tool for rapid identification of Mycobacterium tuberculosis by peptide mass mapping
BioMarker Search:
A tool for biomarker discovery by protein quantification
4343
ESEI::ESEI::EscolaEscola Superior de Superior de EnxeEnxeññererííaa InformInformááticatica
Programa de Programa de doutoradodoutorado 2008 / 20102008 / 2010
Grupos de investigaciGrupos de investigacióónn
SING::Sistemas InformSING::Sistemas Informááticos de Nova ticos de Nova XeraciXeracióónn
TraballosTraballos actuaisactuais de investigacide investigacióón no grupon no grupo
ProxecciProxeccióónn do grupo de investigacido grupo de investigacióónn
4444Proyección do grupo de investigación
SING:Relacións a nivel nacional e internacional
SING::Sistemas Informáticos de Nova Xeración
BISITE::Biomedicina, Sistemas Inteligentes y Tecnología Educativa
UMinho
UTAD
UPorto
Coimbra
UNL
IPB
IPV
IGC
4545Proyección do grupo de investigación
SING:Últimas actividades realizadas
IWPACBB [International Workshop on Practical Applications of ComputationaInternational Workshop on Practical Applications of Computational Biology & Bioinformaticsl Biology & Bioinformatics]2007.1st edition (Universidad de Vigo)2008.2nd edition (Universidad de Salamanca)2009.3rd edition (Universidad de Salamanca)2010.4th edition (Universidade do Minho)
CMBSB [Computational Methods in Bioinformatics and Systems BiologyComputational Methods in Bioinformatics and Systems Biology]2007.1st edition (Universidade do Minho)2009.2nd edition (Universidade de Aveiro)
GPBioInfo [www.gpbioinfo.orgwww.gpbioinfo.org]Galicia-Portugal Bioinformatics
InBIT [www.inbit.orgwww.inbit.org]Grupo de Investigación en Bioinformática Traslacional
4646Proyección do grupo de investigación
IPL Escola Superior de Enxeñería Informática
docencia:ERASMUS
intercambio de alumnos e profesorescursos de doutoramento
investigación:visitas, encontros e seminarios de investigaciónestadías en centros de investigaciónidentificación de áreas comúns de investigaciónorientación de teses de doutoramento
accións integradas [Portugal-España][2010-2011] => 30 acciónsprazo de solicitude: 15 xuño 2009resolución provisional de concesión: decembro 2009resolución definitiva de concesión: febreiro 2010CRUP – Conselho de Reitores das Universidades PortuguesasTel. 21 3602950, e-mail: [email protected]://www.meioclique.com/CRUP/accoes_integradas.htm
4747
CITI:Centro de Investigación, Transferencia e Innovación UVIGO
4848
CITI:Centro de Investigación, Transferencia e Innovación UVIGO
4949
CITI:Centro de Investigación, Transferencia e Innovación UVIGO
5050
ESEI::escola superior de enxeñería informáticadepartamento de informática
universidade de vigocampus de ourense
http://www.ei.uvigo.es
Leiría, 02/06/2009 Florentino Fdez-RiverolaPortugal Departamento de Informática