Ronald
description
Transcript of Ronald
LOGICA FUZZY
U N I V E R S I D A D
L A I C A E L O Y L F A R O
D E M A N I A B I
Ronald Cevallos
SISTEMAS EXPERTOS II
¿QUÉ ES LA LÓGICA DIFUSA?
La lógica difusa es una metodología que proporciona una
manera simple y elegante de obtener una conclusión a
partir de información de entrada vaga, ambigua,
imprecisa, con ruido o incompleta. En general la lógica
difusa imita como una persona toma decisiones basada
en información con las características mencionadas. Una
de las ventajas de la lógica difusa es la posibilidad de
implementar sistemas basados en ella tanto en hardware
como en software o en combinación de ambos. La lógica
difusa es una técnica de la inteligencia computacional
que permite trabajar con información con alto grado de imprecisión, en esto se diferencia de
la lógica convencional que trabaja con información bien definida y precisa.
Es una lógica multivaluada que permite valores intermedios para poder definir evaluaciones
entre si/no, verdadero/falso, negro/blanco, caliente/frío, etc. El concepto de Lógica Difusa fue
concebido por Lofti A. Zaded, profesor de la Universidad de California en Berkeley, quién
inconforme con los conjuntos clásicos (crisp sets) que sólo permiten dos opciones, la
pertenencia o no de un elemento a dicho conjunto, la presentó como una forma de procesar
información permitiendo pertenencias parciales a unos conjuntos, que en contraposición a los
clásicos los denominó Conjuntos Difusos (fuzzy sets).
El concepto de conjunto difuso fue expuesto por Zadeh en un paper del año 1965, hoy
clásico en la literatura de la lógica difusa, titulado "Fuzzy Sets" y que fue publicado en la
revista Information and Control. El mismo Zadeh publica en 1971 el artículo, "Quantitative
Fuzzy Semantics", en donde introduce los elementos formales que acabarían componiendo el
cuerpo de la doctrina de la lógica difusa y sus aplicaciones tal como se conocen en la
actualidad.
Zadeh dice: "La lógica difusa trata de copiar la forma en que los humanos toman decisiones.
Lo curioso es que, aunque baraja información imprecisa, esta lógica es en cierto modo muy
precisa: se puede aparcar un coche en muy poco espacio sin darle al de atrás. Suena a
paradoja, pero es así." El profesor Zadeh menciona que la gente no requiere información
numérica precisa del medio que le rodea para desarrollar tareas de control altamente
adaptables, por ejemplo conducir un automóvil o caminar por una acera sin chocarse con los
postes y las otras personas. Si los controladores convencionales, en esencia realimentados, se
pudieran programar para aceptar entradas con ruido e imprecisas ellos podrían trabajar de una
manera más eficiente y quizás se podrían implementar más fácilmente.
¿QUE SON LOS CONJUNTOS DIFUSOS?
De manera intuitiva se tiene el concepto de conjunto como una colección bien definida de
elementos, en la que es posible determinar para un objeto cualquiera, en un universo dado, si
acaso éste pertenece o no al conjunto. La decisión, naturalmente, es ``sí pertenece'' o bien ``no
pertenece''. Por ejemplo, consideremos como universo a la población económicamente
activa1 en México, es decir, al conjunto formado por las personas residentes en ese país con
una edad entre 18 años (cumplidos) y 66 años (por cumplir). Consideremos un mes
cualquiera, digamos, diciembre de 2000 (y no porque entonces hubiera habido un cambio,
sino porque era ése el último mes del siglo XX). El conjunto de personas empleadas en
México en ese mes, podríamos pensar, está bien determinado: una persona en nuestro
universo que entonces hubiera vendido su fuerza de trabajo, bajo un contrato de empleo, a una
empresa legalmente constituída, sin duda alguna era una persona empleada, y alguien que no
tuvo salario alguno en ese mes y no estuvo vinculado a ningún patrón bajo una relación
contractual, pues no era empleado. El lector observará la sobresimplificación del criterio de
pertenencia enunciado. En efecto, ni falta el funcionario de la Secretaría del Trabajo que dirá:
``Todo ciudadano que haya trabajado al menos una hora en ese mes y por eso haya recibido
un pago, es un empleado'', y tampoco faltará quien diga: ``Qué empleo? No hallé trabajo en
todo el 2000 y sólo en su último mes, mi primo me empleó a destajo para envolver regalos en
su tienda: Yo no soy ningún empleado''. La noción intuitiva de conjunto puede, así, ser muy
estrecha. En un conjunto difuso a cada elemento del universo se le asocia un grado de
pertenencia, que es un número entre 0 y 1, a ese conjunto. Un conjunto difuso es pues una
correspondencia (o función) que a cada elemento del universo le asocia su grado de
pertenencia. Enunciada así esta definición parece ser cíclica, mas no lo es: un conjunto difuso
es una función cuyo dominio es el universo y cuyo contradominio es el intervalo [0,1].
Ejemplo:
“Jhon es alto” . . . verdadero o falso
Altura de Jhon:
h Jhon = 180.0 A(180.0) = 1(verdadero)
h Jhon = 179.5 A(179.5) = 1(falso)
“Jhon es alto” … grado de verdad
Altura de Jhon
hJhon = 180.0 A [180.0] = 0.55
hJhon = 179.5 A [179.5] = 0.5
hJhon = 201.0 A [201.0] = 1
QUE ES LA INFERIENCIA:
Una inferencia es una evaluación que realiza la mente entre proposiciones. En lógica formal,
son expresiones bien formadas (EBF) de un lenguaje formal que, al ser relacionadas, permiten
trazar una línea lógica de condición o implicación lógica entre las diferentes EBF. De esta
forma, parte de lo verdadero a lo falso: posible (como hipótesis)
o conocida (como argumento) de alguna o algunas de ellas, puede deducirse la verdad o
falsedad de alguna o algunas de las otras EBF.
Surge así lo que conocemos como postulado o transformada de una expresión original
conforme a reglas previamente establecidas, que puede enmarcarse en uno o varios contextos
referenciales diversos, obteniéndose en cada uno de ellos un significado como valor de
verdad de equivalente.
Es la operación lógica utilizada en los motores de inferencia de los sistemas expertos.
Inferencia por evidencias
Evidencia inductiva: Surge de la constatación de una misma ocurrencia en una serie de
casos. Observando que muchos lobos tienen la cola larga, infiero que “los lobos tienen la
cola larga”, como una generalización.
Evidencia enumerativa o inducción completa: Cuando se enumeran todos los casos la
inferencia se convierte en una verdad demostrada, como inducción completa. Tal es el
caso de que tras contar a todos y cada uno se pueda inferir: “los alumnos de esta clase son
22”.
Clases de inferencia
Inferir por lógica clásica: Inferencia que sólo admite dos valores: verdadero o falso.
Inferencia trivaluada: Una inferencia de este estilo da como posibles resultados tres
valores.
Inferencia multivaluada: Una inferencia de este estilo da como posibles resultados
múltiples valores.
Inferencia difusa: Una inferencia de este estilo describe todos los casos multivaluados con
exactitud y precisión.
Inferencia probabilística en el sentido de una inducción que permite establecer una verdad
con mayor índice de probabilidad que las demás.
Si bien, cuando el universo posible es de infinitas ocurrencias la probabilidad siempre
será 0. Por lo que algunos establecen para el estatuto de la ciencia el falsacionismo,
como método científico y contrastación de teorías y las lógicas humanas.
Inferencia estadística
Cuando la descripción se aplica a condiciones de certeza, como en las tablas del mercado de
valores en que se muestra un censo de los valores negociados, se convierte en una entidad
metodológica. Sin embargo, en la mayoría de los problemas estadísticos actuales se emplea
más una muestra que un censo, y la descripción se ha convertido simplemente en una
preparación de la siguiente rama de la estadística: inferencia.
Cuando hacemos uso de la inferencia, llegamos a una conclusión o formulamos una
afirmación bajo ciertas condiciones de incertidumbre. La incertidumbre puede ser el resultado
de las condiciones aleatorias, implícitas en el trabajo con muestras, o del desconocimiento de
las leyes aleatorias precisas que son aplicables a una situación específica. No obstante en la
teoría de la conclusión, la incertidumbre sobre la exactitud de la afirmación que se ha hecho o
de la conclusión que se ha sacado se expone simplemente en términos de probabilidad de que
ocurra.
La inferencia trata de dos tipos principales de problemas: la estimación y la contratación de
hipótesis
Inferencia aplicada al conocimiento del comportamiento humano
Se puede inferir todo lo que sea inteligible. Dentro del campo de la inteligencia humana,
encontramos campos muy interesantes, tal como la inteligencia emocional. Dado que el
cerebro humano está sujeto a leyes físicas, existe la posibilidad de que el comportamiento
humano sea potencialmente previsible, con un grado de incertidumbre, al mismo grado que el
resto de ciencias lo pudiera ser, pues todas se basan en la inteligencia del hombre. La
capacidad de inferir el sentimiento humano se llama empatía; cada sentimiento motiva a
actuar de cierta manera. La capacidad de predecir cómo va a actuar cierta persona roza lo
esotérico, pero nada más lejos de la realidad, se pueden generar modelos de comportamientos
humanos y el grado de exactitud de la predicción dependerá de lo empático que sea la persona
(dado que la única máquina capaz de reproducir una mente, hasta la fecha, es
un cerebro humano).
Para que sirven las inferencias
Las inferencias (adivinar, suponer el significa de una palabra) dentro de un texto nos sirven
para enfrentar las palabras desconocidas. Es muy probable que cuando leamos un texto nos
encontremos con palabras desconocidas para las cuales debemos de suponer un significado,
sin que esto haga que detengamos nuestra lectura. Debemos recordar que cuando leemos,
leemos de manera global y no palabra por palabra, por lo cual cuando nos encontrarnos con
una palabra desconocida no debe ser motivo de detener o dejar nuestra lectura. Si sentimos
que dicha palabra es vital para la comprensión del texto y no estamos seguros de que nuestra
suposición sea correcta, entonces debemos acudir a la ayuda de un diccionario.
Controladores difusos:
APLICACIÓN PRÁCTICA DE LA LÓGICA DIFUSA:
Aplicaciones generales
La lógica difusa se utiliza cuando la complejidad del proceso en cuestión es muy alta y no
existen modelos matemáticos precisos, para procesos altamente no lineales y cuando se
envuelven definiciones y conocimiento no estrictamente definido (impreciso o subjetivo).
En cambio, no es una buena idea usarla cuando algún modelo matemático ya soluciona
eficientemente el problema, cuando los problemas son lineales o cuando no tienen solución.
Esta técnica se ha empleado con bastante éxito en la industria, principalmente en Japón,
extendiéndose sus aplicaciones a multitud de campos. La primera vez que se usó de forma
importante fue en el metro japonés, con excelentes resultados. Posteriormente se generalizó
según la teoría de la incertidumbre desarrollada por el matemático y economista
español Jaume Gil Aluja.
A continuación se citan algunos ejemplos de su aplicación:
Sistemas de control de acondicionadores de aire
Sistemas de foco automático en cámaras fotográficas
Electrodomésticos familiares (frigoríficos, lavadoras...)
Optimización de sistemas de control industriales
Sistemas de escritura
Mejora en la eficiencia del uso de combustible en motores
Sistemas expertos del conocimiento (simular el comportamiento de un experto humano)
Tecnología informática
Bases de datos difusas: Almacenar y consultar información imprecisa. Para este punto,
por ejemplo, existe el lenguaje FSQL.
...y, en general, en la gran mayoría de los sistemas de control que no dependen de un
Sí/No.
Ejemplo:
REDES NEURALES ARTIFICIALES
Las redes de neuronas artificiales (denominadas habitualmente como RNA o en inglés como:
"ANN"1 ) son un paradigma de aprendizaje y procesamiento automático inspirado en la forma
en que funciona el sistema nervioso de los animales. Se trata de un sistema de interconexión
de neuronas que colaboran entre sí para producir un estímulo de salida. En inteligencia
artificial es frecuente referirse a ellas como redes de neuronas o redes neuronales.
Propiedades
Una red neuronal se compone de unidades llamadas neuronas. Cada neurona recibe una serie
de entradas a través de interconexiones y emite una salida. Esta salida viene dada por tres
funciones:
1. Una función de propagación (también conocida como función de excitación), que por
lo general consiste en el sumatorio de cada entrada multiplicada por el peso de su
interconexión (valor neto). Si el peso es positivo, la conexión se denomina excitatoria;
si es negativo, se denomina inhibitoria.
2. Una función de activación, que modifica a la anterior. Puede no existir, siendo en este
caso la salida la misma función de propagación.
3. Una función de transferencia, que se aplica al valor devuelto por la función de
activación. Se utiliza para acotar la salida de la neurona y generalmente viene dada
por la interpretación que queramos darle a dichas salidas. Algunas de las más
utilizadas son la función sigmoidea (para obtener valores en el intervalo (0,1)) y
la tangente hiperbólica (para obtener valores en el intervalo (-1,1)).
Aplicaciones prácticas de las redes neuronales artificiales
Redes Neuronales Artificiales (NN) Las NN aplicadas están, en general, inspiradas en las
redes neuronales biológicas, aunque poseen otras funcionalidades y estructuras de conexión
distintas a las vistas desde la perspectiva biológica. Las características principales de las NN
son las siguientes: 1. Auto-Organización y Adaptabilidad: utilizan algoritmos de aprendizaje
adaptativo y auto-organización, por lo que ofrecen mejores posibilidades de procesado
robusto y adaptativo. 2. Procesado no Lineal: aumenta la capacidad de la red para aproximar
funciones, clasificar patrones y aumenta su inmunidad frente al ruido. 3. Procesado Paralelo:
normalmente se usa un gran número de nodos de procesado, con alto nivel de
interconectividad. El elemento básico de computación (modelo de neurona) se le llama
habitualmente nodo o unidad. Recibe un input desde otras unidades o de una fuente externa de
datos. Cada input tiene un peso asociado w, que se va modificando en el llamado proceso de
aprendizaje. Cada unidad aplica una función dada f de la suma de los inputs ponderadas 4
mediante los pesos.
RED NEURONA ARTIFICIAL
Modelos matemáticos, computacionales, artificiales, ideales de una red neuronal empleados
en estadística, psicología cognitiva, e inteligencia artificial.
EJEMPLOS DE APLICACIONES
Análisis Financiero
Procesado de Imágenes
QUE ES MATLAB USOS Y AMBIENTES DE TRABAJO.
QUE ES MATLAB
MATLAB (abreviatura de MATrix LABoratory, "laboratorio de matrices") es una
herramienta de software matemático que ofrece un entorno de desarrollo integrado (IDE) con
un lenguaje de programación propio (lenguaje M). Está disponible para las
plataformas Unix, Windows, Mac OS X y GNU/Linux.
Entre sus prestaciones básicas se hallan: la manipulación de matrices, la representación de
datos y funciones, la implementación de algoritmos, la creación de interfaces de usuario
(GUI) y la comunicación con programas en otros lenguajes y con otros dispositivos hardware.
El paquete MATLAB dispone de dos herramientas adicionales que expanden sus
prestaciones, a saber, Simulink (plataforma de simulación multidominio) y GUIDE (editor de
interfaces de usuario - GUI). Además, se pueden ampliar las capacidades de MATLAB con
las cajas de herramientas (toolboxes); y las de Simulink con los paquetes de bloques
(blocksets).
Es un software muy usado en universidades y centros de investigación y desarrollo. En los
últimos años ha aumentado el número de prestaciones, como la de programar
directamente procesadores digitales de señal o crear código VHDL
AMBIENTE DE TRABAJO
El entorno operativo de Matlab se compone de una serie de ventanas las que presentamos a
continuación. Aunque el reparto de estas ventanas en la pantalla puede cambiarse,
generalmente aparecen en la misma posición.
LAS VENTANAS QUE FORMAN PARTE DEL ENTORNO DE TRABAJO DE
MATLAB SON:
Se utiliza para introducir órdenes directamente por el usuario (seguidas de enter). Los
resultados de las órdenes introducidas se muestran en esta misma pantalla. Cuando las
órdenes se envían desde un programa previamente escrito, que en Matlab recibe el nombre de
M-file, los resultados también aparecen en esta ventana.
CONCLUSIONES
Las Redes Neuronales son un campo muy importante dentro de la Inteligencia Artificial, una
red neuronal es un sistema compuesto de muchos elementos procesadores simples operando
en paralelo, cuya función es determinada por la estructura de la red, fuerza en las conexiones
y el procesamiento realizado por los elementos computacionales en los nodos. Las redes
neuronales artificiales (ANN) imitan su funcionamiento a aquellas que se encuentran en el
ámbito biológico, Son aptas para resolver problemas que no poseen un algoritmo claramente
definido para transformar una entrada en una salida; aprenden, reconocen y aplican relaciones
entre objetos.