Lenguajes YAutomatasII Unidad I

download Lenguajes YAutomatasII Unidad I

of 20

Transcript of Lenguajes YAutomatasII Unidad I

  • 19/09/2013

    1

    MATERIA: LENGUAJES Y AUTMATAS II

    Dra. Miriam Martnez Arroyo

    UNIDAD I.- ANALISIS SEMANTICO

    1.1.- Arboles de expresiones.

    1.2.- Acciones semnticas de un analizador sintctico.

    1.3.- Comprobaciones de tipos en expresiones .

    1.4.- Pila semntica en un analizador sintctico.

    1.5.- Esquema de traduccin.

    1.6.- Generacin de la tabla de smbolo y de direcciones.

    1.7.- Manejo de errores semnticos.

    2

    INTRODUCCIN3

    Introduccin

    El lenguaje es un vehculo por el cual se transmiten instrucciones a unprocesador para que las ejecute y produzca ciertos resultados.

    Es tarea del compilador extraer el contenido semntico incluido en lassentencias del programa.

    Ciertos aspectos relativos a la correccin de un programa no se puedenexpresar claramente mediante el lenguaje de programacin.

    Es necesario dotar al compilador de rutinas auxiliares para captar todo loque no se ha expresado mediante la sintaxis del lenguaje.

    4

    5El compilador hasta ahora

    Anlisis lxico Detecta entradas de tokens legales

    Anlisis Sintctico Detecta entradas con rboles mal formados.

    Anlisis Semntico Detecta todos los errores restantes

    6Introduccin

    Semntica: conjunto de reglas que espe significado de cualquiersentencia sintcticamente correcta y escrita en un determinadolenguaje.

    El anlisis semntico, a diferencia de otras no se realiza claramentediferenciado del resto de las tareas del compilador.

    Fase en la que se obtiene informacin necesaria para la compilacin, trasconocer la estructura sintctica del programa.

    Completa las fases de anlisis lxico y sintctico incorporando comprobacionesque no pueden asimilarse al mero reconocimiento de una cadena dentro de unlenguaje

  • 19/09/2013

    2

    7Objetivo del anlisis semntico

    La semntica del lenguaje forma parte de la especificacin delmismo. Normalmente la semntica de un lenguaje se describe demanera informal.

    El objetivo del anlisis semntico es comprobar si la semntica delprograma que se est compilando cumple las especificaciones de lasemntica del lenguaje fuente.

    8Objetivo del anlisis semntico

    Algunas de estas comprobaciones son:

    Para realizar el anlisis semntico se utilizan gramticas deatributos, que bsicamente, son gramticas independientes delcontexto en las que los smbolos tienen asignados atributos o valoressemnticos.

    Hay dos tipos de atributos: sintetizados: corresponden al no terminal de la parte izquierda de una regla. Se

    calculan a partir de los atributos de los smbolos de la parte derecha de laregla.

    heredados: corresponden a los smbolos de la parte derecha de la regla. Seconstruyen a partir de los atributos de los smbolos de ambas partes de la regla.

    Por qu necesitamos el anlisis semntico

    El analizador sintctico no puede detectar todos los errores.

    Algunos constructores del lenguaje no son libres de contexto Ejemplo: declaracin de identificadores y su uso.

    No puedes utilizar una GLC para describir que alguna palabraparticulares aparezca dos veces en una cadena separada por un textoen medio.

    Una versin abstracta del problema es:

    {wcw | w (a | b)* }

    declaracin uso

    9 Qu hace el anlisis semntico?

    Verificaciones de varias clases, tpicamente: Que todos los identificadores estn declarados.

    Los tipos de las expresiones y la compatibilidad de las asignaciones.

    Invocacin de mtodos compatibles con las declaraciones

    etc

    Los requerimientos dependes del lenguaje.

    10

    11 Se asocia informacin a las construcciones del lenguaje de programacin

    proporcionando atributos a los smbolos de la gramtica.

    Ejemplo:

    el valor de una expresin,

    el tipo de una variable,

    su mbito,

    un trozo de cdigo,

    el nmero de argumentos de una funcin,

    etc.

    Los valores de los atributos se calculan mediante reglas semnticasasociadas a las producciones gramaticales.

    12

    El anlisis semntico incluye:

    La construccin de la Tabla de Smbolos para llevar un seguimiento delsignificado de los identificadores en el programa:

    variables, funciones, tipos, parmetros y mtodos de paso de parmetros en funciones, Etc.

    Realizar la comprobacin e inferencia de tipos en expresiones ysentencias. Por ejemplo:

    que ambos lados de una asignacin tengan tipos adecuados, que no se declaren variables con el mismo nombre, que los parmetros de llamada a una funcin tengan tipos adecuados, nmero de parmetros correcto, Etc.

  • 19/09/2013

    3

    1.1.- Arboles de expresiones. 13

    1.1.-ARBOL DE EXPRESIONES

    Las expresiones regulares que se pueden representar a travs de los

    smbolos contenidos en un alfabeto, tambin se pueden representar

    a travs de rboles, que se denominan rboles de expresiones.

    La informacin contenida en los rboles de expresio-nes tienen las

    siguientes caractersticas.

    Se almacena en forma de estructura jerrquica, porque los

    componentes estn en diferentes niveles.

    14

    La informacin se almacena en forma Dinmica porque su

    forma, tamao y contenido pueden variar durante la

    ejecucin.

    Los datos son almacenados de forma Organizada porque

    importa la forma en que est dispuesto el contenido.

    La consulta de los datos se hace de manera rpida y

    eficiente obteniendo mejores resultados.

    15 Propiedades de los rboles

    Los rboles de expresiones estn compuestos por los

    siguientes elementos:

    Token.- es una Unidad mnima de informacin entendible por

    un compilador. Puede ser un ope-rando o un operador.

    Operandos.- Los operandos pueden ser las hojas de los

    nodos.

    Raz.- La raz de un rbol puede ser cuaquier operador

    aritmtico.

    16

    Reglas para un rbol

    La reglas para representar una expresin mediante un rbol

    son las siguientes:

    1.- Cada hoja est etiquetada con un operando y solo consta de

    ese operando.

    2.- Cada nodo interior n est etiquetado con un solo operador.

    3.- Las hojas estn representadas por los operandos y los nodos

    por la raz de cada rbol.

    17rboles de expresin

    Representan un orden de ejecucin

    para la expresin siguiente:

    (A* B) + C * D + E

    +

    +*

    BA * E

    DC

    18

  • 19/09/2013

    4

    *

    + -

    7 12 9

    Otro ejemplo de rbol sintctico para una expresin

    Aritmtica:

    (7 + 12) * (-9) -171

    19 20

    Ejemplo:

    x=(x+y)*(a-b)

    21 22

    23 24

  • 19/09/2013

    5

    25 26

    27 28

    29 30

  • 19/09/2013

    6

    31 32

    33 34

    http://www.esdebian.org/wiki/interpretprete-funciones-mediante-arbol-binario-expresiones

    35 36

  • 19/09/2013

    7

    37 38

    1.2. Acciones Semnticas de un Analizador Sintctico 39

    1.2. Acciones Semnticas de un Analizador

    Sintctico

    Dependiendo del tipo de sentencias, las acciones

    semnticas pueden agruparse en:

    Sentencias de Declaracin: Se utilizan para completarla seccin de tipos de la Tabla de Smbolos.

    Sentencias ejecutables: Se utilizan para realizarcomprobaciones de tipos entre los operandos implicados.

    40

    41Algunas de estas comprobaciones son:

    comprobacin de tipos en sentencias de asignacin

    comprobacin de tipos en operaciones aritmtico-lgicas

    comprobacin de tipos en las sentencias condicionales

    comprobacin de la declaracin de las variables antes de su uso

    comprobacin de unicidad de identificadores

    comprobacin del indexado de vectores

    Continuacin

    Funciones y procedimientos: Se utilizan paracomprobar el nmero, orden y tipo de los parmetros

    actuales en cada llamada a una funcin o

    procedimiento.

    Identificacin de variables: Se utilizan paracomprobar si un identificador ha sido declarado antes de

    utilizarlo.

    Etiquetas: comprobar si hay etiquetas repetidas yvalidacin.

    42

  • 19/09/2013

    8

    Continuacin

    Constantes: comprobar que no se utilicen en la parteizquierda de una asignacin.

    Conversiones y equivalencias de tipo: realizan laverificacin de las constantes para que stas sean de un

    mismo tipo.

    Sobrecarga de operadores y funciones: en lasfunciones y los procedimientos, se utilizan para detectar

    y solventar la autenticidad de los datos.

    43 mbitos

    Consiste en empatar las declaraciones de identificadores con suuso

    El mbito de un identificador es la porcin del programa en lacual el identificador es accesible.

    El mismo identificador se puede referir a diferentes cosas endiferentes partes del programa.

    mbitos diferentes para el mismo nombre no se sobreponen.

    Un identificador puede tener mbitos restringidos.

    Es decir solo es visible en reas particulares del programa

    44

    mbitos estticos vs dinmicos

    La mayora de los lenguajes tienen mbitos estticos. El mbito slo depende del texto del programa no de la

    conducta en tiempo de ejecucin.

    Java, C, C++, Pascal, Modula, cool, etc. Tienen mbitoesttico.

    Pocos lenguajes tiene mbitos dinmicos Lisp, SNOBOL

    El mbito depende de la ejecucin del programa

    45 Ejemplo de mbito esttico

    int x; -- variable global o campo esttico

    float convert_speed(float y)

    {

    float x; --una x diferente (variable local)

    x=y*1.6

    return x;

    }

    (El uso de x se refiere a la definicin ms cercana )

    46

    mbito en lenguajes OO

    No todas las clases de identificadores siguen la regla del anidamiento ms cercano

    Por ejemplo las definiciones de clases Todas son visibles globalmente

    Declaracin de campos en Java Visibles a todos los mtodos en una clase

    Y algunas veces a otras clases tambin Dependiendo si son pblicas o privadas, etc.

    47 Ms sobre mbito

    Los nombres de mtodos y atributos tienen reglascomplejas.

    Los nombres de campos son globales dentro de cualquierclase.

    Pero los mtodos y campos no necesitan estar definidosen la clase en la cual se estn utilizando, pero si en unaclase padre (herencia)

    Los mtodos se pueden redefinir (sobreescritura)

    48

  • 19/09/2013

    9

    Implementacin de la regla anidada ms cercana

    La mayor parte del anlisis semntico se puede expresarcomo un recorrido descendente recursivo de un rbol oAST.

    Procesa un nodo n

    Procesa los hijos de n

    Finaliza procesando el nodo n

    En cualquier porcin del rbol (contexto en el programa),necesitamos saber que identificadores estn definidos.

    49

    1.3.- Comprobaciones de Tipos en Expresiones50

    La comprobacin de tipos es una forma de asegurar quelos identificadores relacionados sean de tiposcompatibles.

    Dos identificadores son compatibles de acuerdo a losiguiente:

    Cuando forman el lado izquierdo y el lado derecho de un operador.

    Cuando forman el lado izquierdo y el lado derecho de una proposicin deasignacin.

    Cuando sean parmetros reales y formales.

    511.3.-Comprobacin de tipos en Expresiones 52Las comprobaciones de consistencia que se efectan

    antes de la ejecucin del programa fuente, sedenominan comprobaciones estticas.

    Las comprobaciones que se realizan durante laejecucin del programa objeto se denominancomprobaciones dinmicas.

    La revisin de la sintaxis de un programa fuente esun ejemplo de comprobacin esttica,

    mientras que la comprobacin de tipos, es un ejemplo de comprobacin que con frecuencia puede efectuarse en forma esttica y que en ocasiones debe realizarse dinmicamente.

    Tipos

    Qu es un tipo? La nocin vara de lenguaje a lenguaje.

    Consenso Un conjunto de valores

    Un conjunto de operadores sobre los valores

    Las clases son una instanciacin moderna de la nocin de tipo

    53

    Ciertas Operaciones son legales para cada tipo No tiene sentido sumar un apuntador a funcin y un entero en C

    Tiene sentido sumar dos enteros

    Pero ambos tienen la misma implementacin en lenguaje ensamblador!

    Tipos y operaciones 54

  • 19/09/2013

    10

    Sistema de tipos

    Un sistema de tipos de un lenguaje especifica las operaciones que son vlidas para cada tipo.

    La meta de la verificacin de tipos es asegurar que las operaciones se utilizan con los tipos correctos.

    Hace cumplir la interpretacin de los valores.

    Algunas veces puede realizar conversiones automticas cuando el lenguaje permite modos mezclados y promocin de tipos.

    El sistema de tipos provee una formalizacin concisa de las reglas de verificacin semntica.

    55 Traslacin dirigida por la sintaxis

    La mayora de los compiladores son de mltiples pasadas.

    Recorre el AST (rbol de anlisis sintctico) para el anlisissemntico, verificacin de tipos.

    Recorre este otra vez para optimizacin.

    y generacin de cdigo

    .. etc.

    56

    Compilacin de una pasada

    Bajo ciertas circunstancias, es posible construir uncompilador completo de una sola pasada.

    Es posible con ciertas condiciones del lenguaje Particularmente cuando se declara antes de que se use.

    Esto requiere que la traslacin se realice durante unrecorrido del rbol en profundidad.

    La forma en que el analizador sintctico se mueve a travs delrbol

    57

    Verificacin de tipos

    Existen aspectos a considerar en la verificacin de tipos de un compilador

    Procesar las declaraciones y mantener una tabla de smbolos.

    Almacenar el tipo de cada identificador en la tabla de smbolos.

    Realizar la verificacin de tipos y hacer cumplir las reglas semnticas en expresiones y otros elementos del lenguaje (e.g.Lista de argumentos, etc.)

    Buscar el tipo de los identificadores usados.

    Inferir los tipos de constantes

    Calcular el tipo de los nodos que denotan expresiones.

    58

    Verificacin de tipos con aseveraciones

    En cada regla declaramos la aseveracin que se debe cumplir si el programa es vlido.

    ASSERT(condicin) mensaje significa: La condicin se supone debe cumplirse Si no es verdadera, imprime mensaje.

    Assert (Visual Studio 2012 ) Prueba una asercin de software en tiempo de compilacin. Si la expresin constante

    especificada es false, el compilador muestra el mensaje especificado y la compilacin emite un error; si no, la declaracin no tiene ningn efecto.

    Puede usarse una macro en C para este propsito#define ASSERT(x,y) if (!x) printf(line %d: %s\n,lineno, (y))

    59

    static_assert( constant-expression, string-literal );

    Ejemplo de verificacin de tipos (un ejemplo similar esta en la Sec. 6.4.4 de Kenneth) 60

  • 19/09/2013

    11

    Verificacin de tipos en Bison 61 Verificacin de tipos (Cont.) 62

    Expresiones de Tipos

    El tipo de una construccin de un lenguaje se denotarmediante una Expresin de tipo.

    Una expresin de tipo es, o bien un tipo bsico o seforma aplicando un operador llamado constructor detipos a otras expresiones de tipos.

    Los conjuntos de tipos y construcciones bsicasdependen del lenguaje que deba comprobarse.

    63 Se utilizar la siguiente definicin de expresiones de tipos:

    1. Un tipo bsico es una expresin de tipo. Entre los tiposbsicos se encuentran bolean, char, integer y real. Un tipobsico especial, la funcin error_tipo(), sealar un errordurante la com-probacin de tipos.

    2- Como se puede dar nombre a las expresiones de tipos, elnombre de un tipo es una expresin de tipo.

    64

    65

    3.-Un constructor de tipos aplicado a expresiones de tipos es unaexpresin de tipo. Los constructores incluyen:

    Matrices, Productos, Registros, apuntadores y funciones).

    a) Matrices. Si T es una expresin de tipo, entonces array (I, T) es unaexpresin de tipo que indica el tipo de una matriz con elementos detipo T y conjunto de ndices I, I con frecuencia es un rango de enteros.

    Por ejemplo, la declaracin en Pascal

    Var A: array[1..10] of integer;

    Asocia la expresin de tipo array(1..10, integer) con A.

    66b) Productos. Si T1 y T2 son expresiones de tipo, entonces su producto

    cartesiano T1 x T2 es una expresin de tipo. Se supone que x esasociativa por la izquierda.

    c) Registros. La diferencia entre un registro y un producto es que loscampos de un registro tienen nombres. El constructor de tiposrecord se aplicar a un conjunto ordenado formado con nombres decampos y tipos de campos. Por ejemplo, el fragmento de programaen Pascal:

    Type fila = record

    Direccin: integer;

    Lexema: array [1..15] of char

    end;

    var tabla: array [1..10] of fila;

  • 19/09/2013

    12

    67Declara que el nombre de tipo fila representa la expresin de tipo.

    Record (direccin x integer ) x (lexema x array (1..15, char))

    Y que la variable tabla es una matriz de registro de este tipo.

    d) Apuntadores.- Si T es una funcin de tipo, entonces pointer (T) es una expresin de tipo que indica el tipo apuntador a un objeto de T.

    Por ejemplo, en Pascal, la declaracin

    Var pila: fila

    Declara que la variable pila tiene tipo pointer (fila)

    68

    e) Funciones.- matemticamente una funcin transforma loselementos de un conjunto, el dominio, a elementos de otroconjunto, el rango. Se pueden considerar las funciones dentro de loslenguajes de programacin como transformaciones de un dominio detipo D a un rango tipo R. La expresin tipo D R indica el tipo dedicha funcin.

    Por ejemplo, la funcin predefinida mod de Pascal tiene un dominiode tipo int x int, es decir, un par de enteros, y rango de tipo int. Deesta forma, se dice que mod tiene el tipo1.

    int x int int

    69

    Con frecuencia existen, por razones de implantacin, limitaciones queen cuanto al tipo que una funcin puede devolver; por ejemplo,matrices o funciones.

    Sin embargo existen lenguajes que permiten que las funcionesdevuelvan objetos de tipos arbitrarios, as que se puede definir unafuncin g de tipo

    (integer integer); (integer integer)

    Es decir, g toma como argumento una funcin que transforma unentero en un entero y g produce como resultado otra funcin delmismo tipo.

    704.- Las expresiones de tipo pueden contener variables cuyos

    valores son expresiones de tipos.

    Una manera conveniente de representar expresiones detipo es utilizando un grafo.

    Con el enfoque de la traduccin dirigida por la sintaxis sepuede construir un rbol o un GDA para una expresin detipo, con nodos interiores para los constructores de tipos yhojas para los tipos bsicos, nombres de tipos, y variablesde tipos.

    71

    Por ejemplo, consideremos la siguiente declaracin:

    Str : array [0..80] of char;

    I : integer;

    Estticamente puede que no se cumpla la condicin: 0

  • 19/09/2013

    13

    73E T (* TipoE := TipoT; *)

    E1 E2 + T (* TipoE1 := ifTipoE2 = integer end

    TipoT = integer then integer

    else error_tipo; *)

    T F (* TipoT := TipoF *)

    T1 T2 * F (* TipoT1 := ifTipoT2 = integer end

    TipoF = integer then integer

    else error_tipo; *)

    F x (* TipoF := buscar_Tipo(x); *)

    F y (* TipoF := buscar_Tipo(y); *)

    F ( E (* TipoF := TipoE; *)

    74 El procedimiento buscar Tipo(...) se utiliza para determinar el tipo

    de un identificador por medio de la revisin de la tabla de smbolos.

    Por ejemplo, el tipo de una expresin formada donde se aplica eloperador + a una subexpresin y un trmino, es entero, si el tipode la subexpresin y el trmino es entero; en caso contrario ser unerror de tipo.

    La formulacin de reglas para semnticas (tipo Pascal), queestablecen, por ejemplo, que Entero * Real genera un resultado detipo Real, es obvia y puede verse cmo se propagar un tipo.

    De esta forma, durante el proceso de anlisis semntico, se

    puede determinar donde se requieren cambios forzados de

    tipo y qu operadores deben relacionarse (por ejemplo,

    multiplicacin entera o de punto flotante).

    Se debe sealar que no todos los lenguajes de

    programacin permiten una comprobacin esttica de tipos

    como la que se acaba de exponer, para ello se tiene que

    implementar en su diseo, para que pueda ser considerada.

    75

    1.4.- Pila Semntica en un Analizador Sintctico76

    Pila semntica en un ASem

    La pila juega un papel fundamental en el desarrollo de cualquier analizador semntico. Dentro de cada elemento de la pila se guardan los valores que pueden tener una expresin.

    Admon. Tabla de Smbolos

    La tabla de smbolos tambin recibe el nombre de ambiente.

    Un ambiente contiene un conjunto de parmetros que slo son visibles en ese ambiente.

    La tabla de smbolos se mantiene durante todo el proceso de traduccin agregando elementos especficos en cada paso.

  • 19/09/2013

    14

    Tabla de smbolos

    Funcionalidades bsicas:

    Inserta(smbolo)

    Existe(nombre)

    Se agrega una primitiva ms: Tipo (nombre)

    El anlisis lxico crea la tabla de smbolos?

    No

    Tabla de Smbolos

    Cmo se agrega la semntica al analizador sintctico?

    Declaracin TIPO {tipo=obtengo(yytext());} listavar PYC

    listavar var {inserta(smbolo);} | var {inserta(simbolo);}

    var ID {simbolo=yytext; smbolo.tipo=tipo; simbolo.amb=ambito;}

    Tabla de Smbolos

    Exprlog PI exprlog{A=A;} PD |

    NOT exprlog {A=A;} |

    exprlog {A1=A;} OPLOG exprlog {

    A2=A

    if(A1==INT && A2==INT)

    A=INT;

    else

    A=ERROR_TIPO;

    }

    int a;

    a = (int) 10.1;

    Tabla de Smbolos

    Una tabla de smbolos es una estructura de datos empleada para registrar las declaraciones de identificadores.

    Los identificadores se almacenan cuando se declaran Con atributos

    Nombres de clases, mtodos, variables, etc

    Y sub-atributos public, private, integer, float, static, array, etc Su localizacin en la pila si es variable local

    La tabla de smbolos se consulta para cualquier uso. Verificacin semntica y generacin de cdigo.

    83

    Implementacin de la tabla de smbolos

    La estructura es una pila O una lista ligada que opera como pila

    Operaciones add_symbol(x) inserta x y la informacin asociada, tal como el

    tipo, en la pila.

    find_symbol(x) busca en la pila, comenzando del tope de la pila.Regresa el primer x encontrado o NULL si no se encontro.

    remove_symbol() saca elemento de la pila

    84

  • 19/09/2013

    15

    Una tabla de smbolos ms elaborada

    enter_scope() comenzar un nuevo mbito anidado

    find_symbol(x) encuentra el x actual (o null)

    add_symbol(x) agrega un smbolo x a la tabla

    check_scope(x) verdadero si x esta definido en el mbito

    actual (verificar declaraciones mltiples)

    exit_scope() salir del mbito Descartar todos los smbolos del mbito reciente

    85

    Definicin de clase

    Los nombres de clases se pueden usar antes de que seandefinidos.

    Usualmente no se puede verificar esto para los nombresde clases.

    Usando una tabla de smbolos (compilacin separada?)

    O en una pasada (a menos que se requieran prototipos)

    86

    Definicin de clase

    Solucin usual Fase 1: Junta todos los nombres de clases (+ otras cosas)

    Fase 2: Realiza la verificacin

    El anlisis semntico completo requiere varias pasadas. Probablemente ms de una

    La mayora de compiladores en JAVA busca por archivos de clases previamente compiladas.

    87Implementacin de una Tabla de Smbolos simple 88

    89

    Anlisis semntico esttico:

    se realiza en tiempo de compilation, no de execution.

    1. Cmo vamos a especificar (describir) la estructura semnticade un lenguaje? Mediante gramticas de atributos.

    2. Cmo vamos a implementar la estructura semntica de unlenguaje? A partir de la construccin del rbol de anlisis sintctico, lo recorreremos

    en un determinado orden y calcularemos en cada nodo la informacinsemntica necesaria (el valor de una expresin, el tipo de una variable, sumbito de declaracin, el nmero de argumentos de una funcin, etc).

    1.5.- Esquemas de Traduccin

    Los programas de aplicacin, los videojuegos y otras

    herramientas que se ejecutan en las computadoras,

    generalmente se realizan en lenguajes de alto nivel.

    Estos programas escritos en lenguajes de alto nivel ne-

    cesitan ser traducidos a un lenguaje que sea entendible

    por la computadora, este lenguaje es el lenguaje de bajo

    nivel.

    90

  • 19/09/2013

    16

    1.4.- Pila Semntica en un Analizador Sintctico91

    1.3.- Comprobaciones de Tipos en Expresiones

    Sistemas de Tipos.

    El diseo de un comprobador de tipos para un lenguaje se basa eninformacin acerca de las construcciones sintcticas del lenguaje, lanocin de tipos y las reglas para asignar tipos a las construcciones delenguajes.

    Los siguientes extractos de Pascal y del manual de referencia de C,respectivamente, son ejemplos de la informacin con la que el diseadorde un compilador podra verse obligado a comenzar.

    92

    Si ambos operandos de los operadores aritmticos desuma, sustraccin y multiplicacin son de tipo entero,entonces el resultado es de tipo entero.

    El resultado del operando unario & es un apuntador haciael objeto al que se refiere el operando. Si el tipo deloperando es Un Arreglo, o el tipo del resultado esapuntador a .

    En los anteriores extractos se encuentra implcita la ideade que cada expresin tiene asociado un tipo.

    93En los lenguajes Pascal y C, los tipos de datos son

    bsicos o construidos. Los tipos bsicos son los tiposatmicos sin estructura interna por lo que concierne alprogramador.

    En Pascal, los tipos bsicos son bolean, carcter, integery real.

    Los tipos de subrango, como 1..10, y los tiposenumerados, como:

    (Violeta, azul, verde, amarillo, naranja, rojo)

    Se pueden considerar como tipos bsicos.

    94

    El lenguaje Pascal admite que un programador construya

    tipos a partir de tipos bsicos y otros tipos construidos,

    como por ejemplo, las matrices o arreglos (array), los

    registros (record) y los conjuntos (set).

    Adems, los apuntadores y las funciones tambin pueden

    considerarse como tipos construidos.

    Estos son algunos ejemplos de tipos de datos construidos

    que se pueden realizar con los lenguajes de alto nivel.

    95Todos los programas escritos en lenguajes de alto nivel

    deben ser traducidos a lenguaje de mquina mediante un

    traductor.

    La funcin de un traductor de un lenguaje de pro-

    gramacin, es traducir programas escritos en un lenguaje

    de alto nivel a programas equivalentes, expresados en

    lenguaje mquina.

    Despus del proceso de traduccin, los programas pueden

    ejecutarse en cualquier computadora a travs de un

    intrprete microprogramado

    96

  • 19/09/2013

    17

    La siguiente figura muestra el funcionamiento de un traductor

    mediante un compilador de cuatro pasos con las dems

    actividades que intervienen durante la compilacin de un

    programa hasta llegar a convertir el programa escrito en

    lenguaje de alto nivel a un programa escrito en lenguaje

    ensamblador o lenguaje binario, para que posteriormente se

    convierta en programa objeto:

    97 98

    Tipos de Traduccin de lenguajes.

    Interpretados.- Este tipo de traduccin lee y ejecu-ta

    instruccin por instruccin. LIPS, Prolog, Basic y Smalltalk, se

    suelen implementar a travs del uso de un interprete .

    En esta clase de lenguajes, el traductor no procede cdigo de

    mquina para la computadora que s esta utilizando.

    En su lugar, el traductor produce alguna forma inter-media

    del programa cuya ejecucin es ms fcil que la forma del

    programa original, pero que es distinta del cdigo mquina.

    99

    Compilados.- Los lenguajes por lo general como el C,

    Pascal, java, son lenguajes que se compilan.

    Esto significa que los programas en estos lenguajes se

    traducen ordinariamente al lenguaje mquina de la

    computadora real que s esta usando antes que inicie la

    ejecucin,

    y la simulacin est confinada a un con-junto de rutinas de

    apoyo en tiempos de ejecucin que simulan operaciones

    primitivas en el lenguaje fuente para las cuales no existe

    un anlogo cercano en el lenguaje mquina.

    100

    Existe otro tipo de traduccin que se realiza directa-mente

    por el procesador, esta traduccin se describe a

    continuacin:

    Ensamblador.-Es un traductor cuyo lenguaje objeto es

    tambin alguna variedad de lenguaje mquina para una

    computadora real pero cuyo lenguaje fuente, un lenguaje

    ensamblador constituye en gran medida una representacin

    simblica del cdigo de mquina objeto.

    Casi todas las instrucciones en el lenguaje fuente se

    traducen una por una a cada instruccin del lenguaje

    objeto.

    101

    Cargador.- es un traductor cuyo lenguaje objeto es un

    cdigo de mquina real y cuyo lenguaje fuente es casi

    idntico; y est compuesto por lo general de programas en

    lenguaje mquina en forma reubicable junto con tablas de

    datos que especifican puntos donde el cdigo reubicable se

    debe codificar para volverlo automticamente ejecutable.

    102

    Preprocesador o Macroprocesador.- es un tra-ductor cuyo

    lenguaje fuente es una forma ampliada de un lenguaje de

    alto nivel cuyo lenguaje objeto es la forma estndar del

    mismo lenguaje.

  • 19/09/2013

    18

    1.6.- Generacin de la Tabla de Smbolos y de Direcciones.

    103

    1.6.- Generacin de la Tabla de Smbolos y

    de Direcciones.

    Una tabla de smbolos es una estructura de datos que contiene una

    entrada para cada identificador encontrado en el programa fuente.

    Con el objeto de que el compilador pueda llevar un control de la

    informacin sobre el mbito y el enlace de los nombres de datos que

    intervienen en el progra-ma fuente.

    Los campos de cada entrada en la tabla de sm-bolos corresponden a

    los atributos de cada i-dentificador. (Tipo, valor, direccin,

    parmetros, etc.).

    104

    Durante la compilacin de un programa, cada vez que se encuentra un

    identificador en la ta-bla de smbolos, se puede realizar lo siguiente:

    La tabla puede ser consultada para ver si es necesario dar de alta el nuevoidentificador.

    En la tabla se puede completar los atributos faltantes de un identificador yaexistente.

    Se pueden recuperar los atributo de un iden-tificador ya existente en la tablade smbolos.

    Un mecanismo de tabla de smbolos debe permitir aadir nuevas

    entradas y encontrar las entradas existentes de un analizador lxico

    eficientemente.

    105 Los dos mecanismos para tablas de smbolos presentadas a

    continuacin son listas lineales y tablas de dispersin.

    Cada uno de estos mecanismos se evala basn-dose en el tiemponecesario para aadir n entra-das y realizar e consultas.

    Una lista lineal es lo ms fcil de implantar, pero su rendimientoes pobre cuando e y n se vuelven ms grandes.

    Las tablas de dispersin proporcionan un mayor rendimiento conesfuerzo algo mayor de programacin y gasto de espacio.

    Ambos mecanismos pueden adaptarse rpida-mente parafuncionar las reglas del anidamiento ms cercano.

    106

    107 Un compilador debe ser capaz de aumentar dinmicamente la tabla

    de smbolos durante la compilacin.

    Si la tabla de smbolos tiene tamao fijo al escribir el compilador,entonces el tamao debe de ser lo suficientemente grande comopara almacenar cualquier programa fuente.

    Es muy probable que dicho tamao sea demasiado grande para lamayora de los programa e inadecuado para algunos.

    Para mantener uniformes los registros de la tabla de smbolos, esconveniente guardar una parte de la informacin de un nombre fuerade la entrada de la tabla, almacenando en el registro slo unapuntador a esta infor-macin, para hacer referencia a l.

    Administracin de la Tabla de Smbolos.

    Cada entrada de la tabla de smbolos corresponde a ladeclaracin de un nombre. El formato de las entradas no tieneque ser uniforme porque la informacin de un nombre dependedel uso de dicho nombre.

    Cada entrada se puede implantar como un registro que constede una secuencia de palabras consecutivas de memoria.

    No toda la informacin se introduce en la tabla de smbolos.

    Las palabras clave se introducen, al inicio. El analizador lxicobusca secuencias de letras y dgitos en la tabla de smbolos paradeterminar si se ha encontrado una palabra clave o un nombre.

    108

  • 19/09/2013

    19

    Fig. Una tabla de smbolos separada en dos partes,

    utilizando una parte como apuntador a dicha tabla para

    hacer referencia a los nombres almacenados en ella.

    109 110

    Las palabras clave deben estar en la tabla de smbolos antes de quecomience el anlisis lxico.

    Si el analizador lxico reconoce las palabras clave, entonces nonecesitan aparecer en la tabla de smbolos.

    Si el lenguaje no convierte en palabras reservadas las palabras clave,entonces es indispensable que las palabras clave se introduzcan en latabla de smbolos advirtiendo su posible uso como palabras clave.

    La entrada misma de la tabla de smbolos puede establecerse cuandose aclara el papel de un nombre, y se llenan los valores de losatributos cuando se dispone de la informacin.

    En algunos casos, el analizador lxico puede iniciar la entrada encuanto aparezca un nombre en los datos de entrada.

    Un nombre puede indicar varios objetos distintos, quizs incluso en el

    mismo bloque o procedimiento.

    Por ejemplo, las declaraciones en C.

    int x;

    struct x { float y, z; } ;

    Utilizan x como entero y como etiqueta de una estructura con dos

    campos.

    En ambos casos, el analizador lxico slo puede devolver al analizador

    sintctico el nombre solo (o un apuntador al lexema que forma dicho

    nombre), en lugar de un apuntador a la entrada en la tabla de

    smbolos.

    111 112

    Se crea el registro en la tabla de smbolos cuando se descubre elpapel sintctico que desempea este nombre.

    Para las declaraciones de la expresin, se crearan dos entradas enla tabla de smbolos para x; una con x como entero y otra comoestructura.

    Los atributos de un nombre se introducen en respuesta a lasdeclaraciones, que pueden ser implcitas.

    Las etiquetas son identificadores seguidos de dos puntos, as que unaaccin asociada con el reconocimiento de dicho identifica-dor puedeser introducir este hecho en la tabla de smbolos.

    La sintaxis de las declaraciones de los procedimientos especificanque algunos identificadores son parmetros formales.

    1.7.- Manejo de Errores Semnticos113

    1.7.- Manejo de Errores Semnticos

    Los errores que puede detectar el Analizador Sintcticoson aquellos que no cumplen las reglas de una gramticaindependiente del contexto.

    Una de las caractersticas de un lenguaje deprogramacin es que no puede enunciarse con las reglasindependientes del contexto, ya que dependen de l; porejemplo, la restriccin de que los identificadores debendeclararse previamente antes de ser utilizados.

    114

  • 19/09/2013

    20

    Por tanto, los principales errores semnticos son

    los siguientes:

    a).-Identificadores no definidos;

    b).-Operadores y operandos incompatibles;

    Es mucho ms difcil introducir mtodos formales

    para la recuperacin de errores semnticos que

    para la recuperacin de errores sintcticos, ya que

    con frecuencia la recuperacin es ambigua.

    115 116

    No obstante, puede requerirse que, por lo menos,el error semntico sea informado al programador,que se le ignore y que, por tanto, se suprimir lageneracin de cdigo.

    Sin embargo, la mayora de los errores semnticospueden ser detectados mediante la revisin de latabla de smbolos.

    FUENTES DE INFORMACION

    1. Aho, Sethi, Ullman. Compiladores Principios, tcnicas y herramientas. Ed. Addison Wesley.

    2. Lemone Karen A. , Fundamentos de Compiladores Cmo traducir al lenguaje de computadora. Ed.

    Compaa Editorial Continental.

    3. Kenneth C. Louden. Construccin de compiladores Principios y prctica. Ed. Thomson.

    4. Martin John, Lenguajes Formales y Teora de la Computacin, ED. Mc Graw Hill.

    5. Hopcroft John E., Introduccin a la Teora de Autmatas, Lenguajes y Computacin, ED. Addison Wesley

    6. Guerra Crespo. Hector. Compiladores. Ed. Tecnolgica Didctica.

    7. Ronald Mark. Writing Compilers and Interpreters. Ed. Wiley Computer Publishing.

    8. Fischer, LeBlanc. Crafting a compiler with C. Ed. Cummings Publishing Company, Inc.

    9. Salas Parrilla, Jess. Sistemas Operativos y Compiladores. Ed. McGraw Hill.

    117

    10. Beck. Software de Sistemas, Introduccin a la programacin de Sistemas. Ed. Addison-WesleyIberoamericana.

    11. Teufel, Schmidt, Teufel. Compiladores Conceptos Fundamentales. Ed. Addison-Wesley Iberoamericana.

    12. C. Louden, Kenneth. Lenguajes de programacin Principios y prctica. Ed. Thomson.

    13. Levine Gutirrez, Guillermo. Computacin y programacin moderna Perspectiva integral de la

    informtica. Ed. Pearson Educacin.

    14. Abel, Peter. Lenguaje ensamblador y programacin para PC IBM y compatibles. Ed. PearsonEducacin.

    15. Mak, Ronald. Writing compilers and interpreters. Wiley Computer. Ed. Publishing.

    16. Pittman, Thomas, Peters, James. The art of compiler design Theory and prctice. Prentice Hall.

    FUENTES DE INFORMACION 118

    Dudas???? 119