- 1 - Extracción de relaciones entre adjetivos y verbos ...lcots/recerca/extraccion.pdf · - 1 -...
Transcript of - 1 - Extracción de relaciones entre adjetivos y verbos ...lcots/recerca/extraccion.pdf · - 1 -...
- 1 -
Extracción de relacionesentre adjetivos y verbos
usando patrones de
definición
Lluís M. Cots Serra
Trabajo de investigación para el DEA
6 créditos
Dirección:
Irene Castellón Masalles
Universitat de Barcelona
Departament de Lingüística General
Septiembre 2004
- 3 -
Índice
1. INTRODUCCIÓN.................................................................................................................5
1.1. MARCO .......................................................................................................................5 1.2. OBJETIVOS ..................................................................................................................8 1.3. METODOLOGÍA .........................................................................................................10
2. EXTRACCIÓN Y BÚSQUEDA DE PATRONES............................................................13
2.1. CONSIDERACIONES GENERALES......................................................................................13 2.2. EXTRACCIÓN A PARTIR DE SUFIJOS .................................................................................14
2.2.1. –ble: .......................................................................................................................15 2.2.2. -dor: .......................................................................................................................17 2.2.3. –ivo: .......................................................................................................................18 2.2.4 –nte: ........................................................................................................................19 2.2.5. –orio:......................................................................................................................20
2.3. PATRONES EXTRAÍDOS....................................................................................................20
3. APLICACIÓN EN EL DICCIONARIO............................................................................23
3.1. TANTEO O EXPLORACIÓN INICIAL ...................................................................................23 3.2. DATOS EXTRAÍDOS DE LAS MUESTRAS A- Y M- ..............................................................25
3.2.1. Con la letra A-........................................................................................................25 3.2.2. Con la letra M-.......................................................................................................33
3.3. CUANTIFICACIÓN DE LOS DATOS PARA A-, M- Y P- ........................................................35
- 4 -
3.3.1. Para la letra A-...................................................................................................... 36 3.3.2. Comparación con los resultados de M- ................................................................. 37 3.3.3. Validación de los resultados con P- ...................................................................... 39 3.3.4. Comparación de resultados................................................................................... 40
3.4. LIMITACIONES DEL PROCESO DE EXTRACCIÓN................................................................ 41
4. DISEÑO DE UNA GRAMÁTICA DE DEFINICIONES ............................................ 45
5. PROYECCIÓN A EWN ..................................................................................................... 49
5.1. RELACIONES ADJETIVO ! VERBO EN EWN .................................................................. 50 5.2. RESULTADOS DE LA INVESTIGACIÓN EN EWN ............................................................... 52
5.2.1. Datos cuantitativos ................................................................................................ 53 5.2.2. Clarificaciones sobre las relaciones...................................................................... 55
6. CONCLUSIONES............................................................................................................... 59
BIBLIOGRAFÍA..................................................................................................................... 63
- 5 -
1. Introducción
1.1. Marco
El presente trabajo se encuadra dentro del marco que plantea el Procesamiento
del Lenguaje Natural (a partir de ahora PLN), o más específicamente de la
Lexicografía Computacional. Concretamente en el ámbito del proyecto Meaning
(REF Developing Multilingual Web-Scale Language Technologies IST- 2001-
34460) que tiene como uno de sus objetivos el desarrollo de métodos de adquisición
lingüística: léxica, sintáctica y semántica. Algunos de los temas que deben resolverse
son la obtención de información y conocimiento útiles y pertinentes para su uso y la
definición y perfeccionamiento de los procesos para su obtención. Éste no es un
proceso cerrado, sino que debe perfeccionarse y alimentarse continuamente. Nuevas
fuentes, nuevos métodos y nuevos datos se integrarán en las estructuras modulares
existentes estableciendo nuevas relaciones léxicas y semánticas (Rigau 1998)
Se han señalado tres tipos de fuentes para la información léxica: las
introspectivas, a partir del propio conocimiento de las estructuras y mecanismos de
- 6 - 1. Introducción
funcionamiento del idioma; las no estructuradas, como los corpus no organizados; y
las fuentes estructuradas, como diccionarios, thesaurus, enciclopedias, guías
telefónicas, etc. En este trabajo intentaremos investigar la viabilidad y el rendimiento
de la obtención de cierto tipo de información y por determinados procedimientos de
algunas de estas últimas fuentes, en concreto de los diccionarios preexistentes
tratados adecuadamente para poder ser leídos por medios informáticos. En concreto,
abordaremos una metodología para la extracción de información con el propósito de
conseguir el enriquecimiento semántico a través de relaciones llamadas XPOS o
entre categorías gramaticales. Con ello atacamos otro problema: el alto coste de la
introducción manual de datos que conduce a la búsqueda de metodologías para la
adquisición automática y masiva de estos conocimientos léxicos. La construcción de
recursos para el PLN requiere un gran esfuerzo en personas y tiempo, y por
consiguiente en dinero. La adquisición automática de información, desde esta
perspectiva, permite la construcción de recursos con un bajo coste. Además, el
componente léxico es uno de los que plantea mayor trabajo y dificultades, y también
uno de los más dinámicos, en el sentido de que siempre está en continua evolución, y
por lo tanto el desarrollo de técnicas de adquisición léxica puede ayudar a mantener
estos recursos.
Existen abundantes situaciones, las potencialmente más numerosas, en las que
no se dan las condiciones ideales de control y restricción del lenguaje para su
procesamiento. Los dominios pueden ser abiertos, los materiales mezclados, el
vocabulario creciente, las condiciones de intervención humana poco limitadas, los
objetivos abiertos a múltiples aplicaciones. Los recursos que deben desarrollarse para
estas nuevas exigencias han recibido el nombre de métodos robustos para el análisis
del lenguaje.
Entre los problemas con que se encuentran los sistemas de comprensión de los
lenguajes naturales para adquirir robustez, Alshawi (1989) ha señalado la falta de
vocabulario y la construcción de sistemas de comprensión parcial cuando no es
posible un análisis completo. Entre los elementos que pueden aportar una cierta
1. Introducción - 7 -
mejora cita el procesamiento de las definiciones de los diccionarios y su posterior
implementación en los analizadores robustos.
Por otra parte, hemos tomado en consideración el proyecto EuroWordNet (a
partir de ahora EWN, Vossen 2003), que desarrolla una base de datos léxica
multilingüe en cuyo núcleo se teje una red de relaciones entre significados y entre
palabras de cada uno de los idiomas del proyecto, interrelacionados a su vez a través
de estos significados. EWN establece una amplia tipología de relaciones entre
palabras, tanto de igual como de distinta categoría.
EWN es una base de datos léxico-semántica multilingüe que comprende
lenguas como el inglés, el italiano, el holandés, el español, el catalán y el euskera.
EWN se estructura en base a la unidad synset, una unidad conceptual a la que se
asocian palabras de diferentes lenguas que realizan dicha categoría conceptual, es
decir, conjuntos de sinónimos. La organización de EWN se basa en las relaciones de
hiponimia e hiperonimia, es decir, todo synset tiene al menos una de estas relaciones.
Además EWN tiene otro tipo de relaciones como la meronimia, la antonimia y
algunos argumentos típicos (‘role’ y ‘envolved’). Las categorías morfosintácticas de
las palabras que incluye EWN son verbos, nombres, adjetivos y adverbios.
En principio, como ya hemos comentado, las relaciones más típicas, tanto en
EWN como en las definiciones de los diccionarios, son las de hiponimia e
hiperonimia entre elementos de la misma categoría gramatical (Cruse 2000) Estas
relaciones permiten estructurar una gran parte del vocabulario y establecen la base de
la estructuración léxica.
Las relaciones entre palabras de distinta categoría han sido denominadas, en el
proyecto EWN, relaciones XPOS. De este tipo, hay diferentes relaciones, pero
podemos hacer dos grupos: las que provienen de un proceso derivativo, y por lo tanto
tienen una raíz morfológica común, y las que no comparten una raíz morfológica.
Las primeras resultan bastante inmediatas y se pueden buscar recursos para
generarlas a partir de la propia gramática de cada una de las lenguas.
La búsqueda de relaciones XPOS entre palabras con lexema distinto resulta
algo más problemática. De las categorías tratadas, la categoría Adjetivo se ha
- 8 - 1. Introducción
trabajado menos porque presenta una mayor complejidad al establecimiento de
relaciones intercategoriales, mucho más que el Nombre y el Verbo (Aguirre, 2001,
realiza un trabajo similar en varios aspectos y circunscrito a varios sufijos). El
objetivo básico de nuestro trabajo ha consistido en la exploración de relaciones Adj
! V utilizando las definiciones de un diccionario. Partimos de la hipótesis de que
para definir las entradas léxicas los diccionarios suelen usar repetitivamente ciertos
esquemas que llamaremos patrones de definición. De todos modos, hemos de tener
en cuenta que los diccionarios no han sido creados bajo este presupuesto y por ello
no podemos saber a priori la calidad de los resultados.
1.2. Objetivos
En nuestro trabajo intentaremos establecer una metodología para la extracción
de relaciones Adj ! V en las definiciones de los diccionarios y en las cuales la
entrada es un adjetivo y la salida es un patrón definitorio con una forma verbal.
Exploraremos la existencia de estos patrones, las relaciones Adj ! V que se
establecen, su cuantificación, su viabilidad y nos detendremos especialmente en
aquellas que no comparten base morfológica. Si la búsqueda se corona con un nivel
de éxito relevante, pretendemos que los resultados puedan servir para el
enriquecimiento de sistemas de extracción de información semántica a partir de
diccionarios (Rigau 1998) Finalmente, estas palabras analizadas podrán incluirse en
una red de sentidos como EWN.
Volviendo a EWN, en ocasiones se establecen relaciones cerradas entre
palabras sin que puedan llegar a intercambiarse ni compartan hiperónimo. Sería el
caso de palabras como herramienta e instrumento, que pueden identificarse en un
1. Introducción - 9 -
cierto sentido, pero nunca diremos que un piano es una herramienta o un
destornillador un instrumento. Para este tipo de relaciones EWN ha propuesto la
relación NEAR_SYNONYMY. Las relaciones entre palabras de categoría gramatical
distinta siempre presentaran sutiles diferencias, incluso cuando sean derivacionales, y
en este caso se las denomina XPOS_NEAR_SYNONYMY (Vossen 2003)
El trabajo plantea algunos problemas ya señalados por varios autores. Por
ejemplo, en ocasiones precisar bien el significado requiere analizar elementos del
contorno como modificadores, complementos o cláusulas (Alshawi 1989). El sentido
puede depender tanto de estos elementos como de la propia palabra que encabeza la
definición. El inicio de la definición, en el caso que sea un elemento relevante, puede
sufrir más o menos restricciones posteriores. Las referencias cruzadas, que nosotros
no hemos encontrado, también pueden dificultar la tarea. Las definiciones
lexicográficas deben pertenecer, en principio, a la misma categoría sintáctica de la
palabra definida, aunque puede variar el patrón por otro segmento equivalente
paradigmáticamente (Castellón 1992). En nuestro caso nos hemos encontrado
frecuentemente con definiciones de adjetivos a través de oraciones de relativo con un
antecedente muy general y elidido.
Se da incluso el caso de definiciones con un núcleo que desplaza todo el
sentido a otra parte de la definición (Vossen y al. 1989), con lo cual las relaciones
semánticas habrían de desplazarse más allá. Pero pueden darse estructuras similares
en las que el núcleo sea significativo y no un mero enlace a otra parte de la
definición. Vossen denomina shunters (derivadores o cambiadores) a los núcleos de
la definición que cambian la categoría gramatical de la interpretación (por ejemplo:
“Trabajador: persona que trabaja” desplaza el significado de la definición del núcleo
nominal al verbo). Oraciones de relativo o sintagmas preposicionales pueden asumir
también el significado central que podría esperarse encontrar en el núcleo de la
definición. Anotamos ya, a raíz de este ejemplo, que en ocasiones el diccionario
categoriza como “adjetivo / sustantivo” definiciones procedentes de palabras que
parecería que sólo pueden clasificarse como sustantivos a partir del principio
lexicográfico que palabra definida y núcleo definidor deben pertenecer a la misma
- 10 - 1. Introducción
categoría. En estos casos hemos seguido la notación del diccionario y hemos
considerado estas entradas también como adjetivos.
Por consiguiente, nuestra investigación intenta identificar relaciones
XPOS_NEAR_SYNONYMY entre adjetivos y verbos a través de la localización en
diccionarios de entradas adjetivas y definiciones con patrones que derivan el núcleo
significativo a un verbo. El sistema debería ser útil para su posible implementación
posterior en sistemas de extracción automática de información con diccionarios
como fuentes, por lo que expresaremos los resultados de la investigación en una
gramática de definiciones.
1.3. Metodología
En este trabajo hemos utilizado parcialmente un diccionario de la Lengua
Castellana (DICC 1996). Dado que el objetivo del trabajo es probar una metodología
de extracción hemos trabajado con un subconjunto del diccionario, concretamente,
hemos hecho uso de las entradas con las letras A, M y P, cada una de ellas con un
uso y con unos fines distintos. La investigación ha tenido un carácter incremental. En
primer lugar, se han detectado las entradas adjetivas con elementos verbales en la
definición y se han extraído los patrones existentes en estas definiciones. Más
adelante se han aplicado estos patrones en las entradas del diccionario para extraer
las relaciones Adj ! V existentes. Hasta aquí se ha trabajado con la letra A inicial.
Se ha prestado especial atención a las relaciones con lexema distinto entre los dos
elementos y por ello se han enriquecido los resultados con la extracción de relaciones
de este tipo con adjetivos con M inicial. Se ha utilizado también la letra P del
diccionario para cuantificar el número de relaciones y confirmar o no su estabilidad.
1. Introducción - 11 -
Después de valorar los resultados, se ha realizado una propuesta de representación
formal en una gramática de los patrones encontrados. Finalmente, se han proyectado
estos resultados sobre EWN para contrastar su riqueza con los datos de nuestra
investigación.
- 13 -
2. Extracción y búsqueda de patrones
2.1. Consideraciones generales
Partimos de la hipótesis de la existencia de patrones de definición con alguna
forma verbal en las entradas adjetivas, pero ignoramos su magnitud y su posible
sistematicidad. Para intentar iniciar la configuración de un método de búsqueda,
empezamos sondeando algo más de un centenar de definiciones. Inicialmente en este
estudio observamos varias cuestiones: existen definiciones potencialmente
susceptibles de operar con esquemas de patrón nominal y otras con esquemas de
patrón verbal, por ejemplo,
“Abismal: Del abismo” como patrón nominal o
“Abatible: Que se puede abatir” como patrón verbal,
En este primer estudio se observó que el elemento verbal puede tener igual o
distinto lexema que la entrada adjetiva y que ciertas terminaciones adjetivas parecen
- 14 - 2. Extracción y búsqueda de patrones
recurrir en bastantes ocasiones a esquemas de definición (Aguirre 2001 ya parte
inicialmente de este supuesto). Decidimos iniciar una primera aproximación
sistemática en esta vía. Empezamos localizando una serie de sufijos adjetivos que
derivan a partir de una base verbal porque pensamos que a partir de las entradas
adjetivas que tienen dichos sufijos podremos extraer patrones o esquemas de
definición seguidos de un elemento verbal.
2.2. Extracción a partir de sufijos
La búsqueda de adjetivos considerados derivados posverbales de acuerdo con
su sufijo se realiza con las entradas en A- hasta localizar todos los casos.
Previamente se ha efectuado una selección de terminaciones con las que trabajar. Son
las siguientes, acompañadas cada una de ellas de un ejemplo adjetivo:
-BLE (aceptable) -BUNDO (tremebundo),
-DERO (pagadero), -DOR (amador),
-DO (airado), -EGO (andariego),
-EÑO (halagüeño), -ICIO (alimenticio),
-IL (servil), -IVO (alusivo),
-NDO (doctorando), -NTE (amante),
-ORIO (absolutorio).
Una de las primeras observaciones fue que bastantes de estos sufijos no aportan
resultados significativos. Sólo se consideraron interesantes para nuestro objetivo los
adjetivos acabados en –ble, -dor, -ivo, -nte y –orio.
2.Extracción y búsqueda de patrones - 15 -
Presentamos en el siguiente apartado los resultados de la búsqueda en las
entradas adjetivas de las terminaciones indicadas más arriba. En las definiciones
aparecen tres formas verbales que abreviamos del siguiente modo: VMN cuando se
trata de un infinitivo, VMP cuando estamos ante un participio y VMIP3S si se trata
de la tercera persona del singular del presente de indicativo. De hecho, seguimos la
codificación de PAROLE y EAGLES. Con el cuadradillo (#) señalamos la posición
de dicha forma verbal.
2.2.1. –ble:
Se trata de adjetivos del tipo aceptable, armonizable... El número de adjetivos
en la letra A con la terminación –ble es de 39. Sondeamos los significados y
encontramos los posibles parámetros siguientes:
a) Que se puede VMN
b) Que es susceptible de VMNse
c) Que puede VMNse
d) Que es susceptible de ser VMP
e) Que puede ser VMP
f) Que es digno de ser VMP
Decidimos discriminar los patrones iniciales de definición y los intermedios
con la utilización o no de mayúsculas iniciales respectivamente. Aplicamos los
patrones señalados más arriba, que quedarán abiertos a otras terminaciones, y
obtenemos los siguientes resultados que se presentan en la tabla 1:
- 16 - 2. Extracción y búsqueda de patrones
Patrón Forma verbal Casos
-ble e igual
lexema
-ble y distinto lexema
otros adjetivos
formas no
adjetivas a) Que se puede VMN 13 1 4 b) que se puede VMN 1 7 c) Que es susceptible de VMNse 1 d) que es susceptible de VMNse e) Que puede VMNse 1 2 1 f) que puede VMNse 1 3 g) Que es susceptible de ser VMP 2 1 h) que es susceptible de ser VMP 1 i) Que puede ser VMP 1 5 1 j) que puede ser VMP 1 3 k) Que es digno de ser VMP 1 l) que es digno de ser VMP
Total 21 11 6 13 Tabla 1
La leyenda de los casos indica, en la primera columna, los adjetivos acabados
en –ble que comparten lexema con el verbo del patrón, en el segundo caso esta
terminación adjetiva con cambio de lexema, en la tercera columna el número de
adjetivos con otras terminaciones y en la última, formas no adjetivas que han
aparecido en esta búsqueda.
Los resultados son altamente significativos:
a) Los patrones están presentes en 51 entradas o acepciones y 32
corresponden a adjetivos en –ble (63%).
b) Los patrones funcionan en 32 de los 39 casos de adjetivos en –ble
(82%).
c) El 66% de estos casos empiezan la definición del significado con el
patrón.
d) Sólo aparecen 6 formas adjetivas con otras terminaciones de un total
de 51 (12%).
e) Todas las formas no adjetivas que tienen estos patrones lo empiezan
en minúscula, es decir, el patrón no da comienzo a la definición.
2.Extracción y búsqueda de patrones - 17 -
f) Estas formas no adjetivas suman 13 de 51 casos (25%)
Las formas encontradas son las siguientes:
" Adjetivos en -ble e igual lexema: abatible, aceptable, acumulable,
aguantable, aislable, alienable, alterable, amortizable, ampliable,
aplacable, aplazable, armonizable, asociable; aconsejable; adaptable;
asimilable; admisible, aprovechable; alcanzable; apreciable;
abominable.
" Adjetivos en -ble y distinto lexema: asequible; audible; asimilable,
autorregulable; accesible, apreciable, arbitrable, asequible; amovible.
" Otros adjetivos: acomodadizo, ahogadizo aditivo, ambivalente;
adhesivo; arrastradizo. " Formas no adjetivas: 13 casos.
2.2.2. -dor:
El resultado del análisis de las acepciones de adjetivos con esta terminación es
el siguiente (tabla 2):
Patrón Etiqueta Casos
Que # VMIP3S 43
(...) que # VMIP3S 2
Que # (con cambio lexema) VMIP3S 1
Adjetivos no sometibles a patrón 9
Otras categorías 19
Tabla 2
- 18 - 2. Extracción y búsqueda de patrones
Vemos que en este caso domina claramente el patrón “Que”, preferentemente
al inicio de la definición, seguido de la forma verbal, normalmente con el mismo
lexema que la entrada adjetiva. Más tarde veremos que este patrón, aunque
aparentemente muy productivo, resultará bastante problemático para utilizar.
2.2.3. –ivo:
Se localizan y analizan 42 adjetivos con el sufijo –ivo (frente a 7 nombres
terminados así). La definición del significado no parece asimilable a un patrón en 11
casos (26,2 %). 14 casos (33,3 %) son susceptibles de patrón nominal. Las
definiciones susceptibles de patrón verbal ascienden a 17 casos (40,5 %). Estos
adjetivos apuntan posibles patrones que deberán estudiarse con muestras mucho
mayores. Se trata de las entradas siguientes:
a) Con VMIP3S (9 casos):
" Que # (acreditativo, alusivo, agresivo, atractivo, ahorrativo,
asociativo, aseverativo, aumentativo).
" Que se # (afectivo).
b) Con VMN (7 casos):
" Que se puede o debe # (aditivo (añadir)).
" Que hace # (abortivo).
" Que puede #se (adhesivo).
" Que sirve para # (adquisitivo, auditivo (oír)).
" De la facultad mental de # (aprehensivo).
" Que tiene capacidad de # (aprehensivo).
c) Con VMP (1 caso):
" Se aplica a la persona o cosa que es # (adoptivo).
2.Extracción y búsqueda de patrones - 19 -
Comentamos que vuelve a funcionar el patrón “Que VMI” (se trata de una
definición a base de una oración de relativo con un antecedente genérico elidido) y
que se observan algunos cambios de raíz entre adjetivo y verbo.
2.2.4 –nte:
Localizamos 81 adjetivos con este sufijo frente a 23 entradas con otras
categorías gramaticales terminadas así. No se han contabilizado los adverbios
acabados en –mente. Presentamos los resultados del análisis como en el apartado
anterior.
Las definiciones de adjetivos no susceptibles de ser sometidas a patrones
ascienden a 37 (45,7 %). Las definiciones con patrón nominal son 7 (8,6 %).
Finalmente, las definiciones con patrón verbal, todas ellas bajo la forma VMIP3S,
alcanzan 37 casos (45,7 %). Se trata de los esquemas siguientes:
" Que # (27 casos: amante, afluente, aislante, ardiente, atacante...)
" (...) que # (abundante, agravante, asistente, absorbente, anunciante,
astringente)
" Persona que # (ayudante).
" Que (se) # (3 casos con cambio de lexema: anuente (consiente),
aferente (lleva), aparente (muestra).
Remarcamos que el patrón “Persona que”, que luego encontraremos más
abundantemente, respondería, en sentido estricto, a una definición nominal (de
acuerdo con el principio lexicográfico ya comentado de que el término definido y
núcleo de la definición deben corresponder a la misma categoría gramatical o a algo
paradigmáticamente asimilable), pero que el propio diccionario categoriza estas
acepciones como adjetivo y sustantivo. Señalamos también como vuelve a aparecer
- 20 - 2. Extracción y búsqueda de patrones
abundantemente el patrón “Que / (...) que #” y como en este sufijo no ha aparecido la
forma VMN en la definición.
2.2.5. –orio:
A pesar de tratarse de un adjetivo derivado posverbal, se han encontrado más
casos con un sustantivo como núcleo de la definición que con un verbo. Los
adjetivos con este sufijo tampoco son muy abundantes: se han localizado 13
adjetivos empezados con a- y con este sufijo frente a 7 palabras pertenecientes a
otras categorías.
Los casos que nos interesan, adjetivos con patrón verbal, se limitan a 4:
a) Con VMIP3S:
" Que # (absolutorio, aclaratorio)
" Que # (con cambio de raíz: admonitorio (amonesta))
b) Con VMN:
• Que tiene capacidad de # (auditorio (oír))
2.3. Patrones extraídos
Después de esta búsqueda sistemática de patrones, las variaciones sobre
algunos de ellos (por ejemplo, “se aplica a la persona o cosa” puede dar lugar a “se
aplica a la persona”, “se aplica a la cosa”...) y la introducción de otros directamente
2.Extracción y búsqueda de patrones - 21 -
gracias a ciertos indicios, confeccionamos la lista de patrones sobre los que
iniciaremos la búsqueda.
Convenimos que tendrán número impar aquellos patrones que inician la
definición y que, por lo tanto, empiezan en mayúscula y número par e inicio en
minúscula aquellos que se encuentran insertos en el interior.
Los patrones recogidos son los siguientes:
1. Que se puede VMN 3. Que puede VMN 5. Que puede ser VMP 7. Que es susceptible de VMN 9. Que es susceptible de ser VMP 11. Que es digno de ser VMP 13. Que se puede o debe VMN 15. Que se debe VMN 17. Que hace VMN 19. Que sirve para VMN 21. De la facultad mental de VMN 23. Que tiene capacidad de VMN 25. Se aplica a la persona o cosa que es VMP 27. Se aplica a la persona que es VMP 29. Se aplica a la cosa que es VMP 31. Persona que VMI 33. Que VMI 35. Que se VMI 37 Que está pensado para ser VMP 39 Que es apto para ser VMP 41 Que puede o debe ser VMP 43 Que debe VMN 45 Que debe ser VMP 47 Que debe o puede ser VMP
2. que se puede VMN 4. que puede VMN 6. que puede ser VMP 8. que es susceptible de VMN 10. que es susceptible de ser VMP 12. que es digno de ser VMP 14. que se puede o debe VMN 16. que se debe VMN 18. que hace VMN 20. que sirve para VMN 22. de la facultad mental de VMN 24. que tiene capacidad de VMN 26. se aplica a la persona o cosa que es VMP 28. se aplica a la persona que es VMP 30. se aplica a la cosa que es VMP 32. persona que VMI 34. que VMI 36. que se VMI 38 que está pensado para ser 40 que es apto para ser 42 que puede o debe ser 44 que debe 46 que debe ser 48 que debe o puede ser
Con estos patrones hemos realizado y seguiremos realizando búsquedas.
Anticipamos que algunos de ellos no nos parecerán, finalmente, aprovechables, como
por ejemplo del 33 al 36.
- 23 -
3. Aplicación en el diccionario.
3.1. Tanteo o exploración inicial
Como hemos visto en el apartado anterior, hemos localizado una serie de
patrones mediante la observación sistemática y exhaustiva de las entradas con la letra
A en varios grupos de adjetivos. Éstos se han elegido según ciertas terminaciones.
Creemos que este criterio resulta semánticamente significativo y, por consiguiente,
presumiblemente relevante para la localización de dichos patrones en los
diccionarios.
Ahora intentaremos el proceso inverso, es decir, la búsqueda de adjetivos que
ajusten su perfil definitorio a estos patrones. No debemos olvidar que la localización
de patrones no está necesariamente acabada: pueden existir otros que no hayamos
identificado, aunque hemos creído conveniente detenernos ahí. Después podremos
observar también si extienden su utilidad a otras terminaciones adjetivas.
Consideramos sólo relevantes, ya que de esto se trata en este trabajo, los patrones
que acogen elementos verbales en la definición, y no los abundantes casos con
elemento nominal en la explicación del significado, incluso en adjetivos
considerados posverbales. Sin embargo, contabilizaremos algunos de estos casos, lo
- 24 - 3. Aplicación en el diccionario
que nos permitirá apreciar la importancia de los patrones con elemento verbal o no
verbal en las definiciones de los adjetivos y tener otra variable para considerar su
fiabilidad.
Ya hemos señalado que entendemos como distintos los patrones que empiezan
en mayúscula y en minúscula. En el primer caso se entiende que arrancan la
definición (y que puede continuar o no) y en el segundo que están insertados dentro
de un texto más amplio y que no son iniciales en la definición.
Clasificaremos las entradas/definiciones de adjetivo encontrados en cinco
grupos:
a) El adjetivo definido y el elemento verbal del patrón de la definición son de
igual lexema (IL). Por ejemplo: Asociable: Que se puede asociar.
b) El adjetivo definido y el elemento verbal del patrón de la definición son, el
primero, de igual lexema, seguido de otro u otros elementos verbales de distinto
lexema unidos en yuxtaposición, copulativamente o mediante disyunción (IDL). Por
ejemplo: Aplazable: Que se puede aplazar o retardar.
c) El adjetivo definido y el elemento verbal del patrón de la definición son de
distinto lexema (DL). Por ejemplo: Asequible: Que se puede comprender.
d) Entradas no adjetivas cumplen el patrón (NA). Por ejemplo: “Acopio: (...)
que se puede necesitar” o “Adjunto: (...) que se puede prescindir”.
e) Otros casos (OC). Por ejemplo: “Ambiguo: Que tiene ambigüedad”,
contiene uno de los patrones estudiados pero no va seguido de ningún elemento
verbal.
Entenderemos como significativos para el trabajo los tres primeros grupos y la
cantidad de entradas de los otros será relevante para determinar el peso de cada
patrón.
3 Aplicación en el diccionario - 25 -
3.2. Datos extraídos de las muestras A- y M-
Una vez definidos los patrones con los que trabajaremos y establecidos los
criterios de clasificación de los datos localizados, a continuación procederemos a
tomar como muestra todas las entradas del diccionario con las letras A- y M-.
Expondremos y comentaremos los datos con mayor detalle para la primera de estas
dos iniciales, ya que nos servirá para ir reflexionando y sacando conclusiones sobre
las particularidades de las definiciones y su posible utilidad para localizar en ellas
patrones que permitan relacionar adjetivos con verbos.
3.2.1. Con la letra A-
Procederemos con esta muestra patrón a patrón, expondremos los datos
extraídos e iremos comentando las particularidades que encontremos cuando estas lo
requieran. Señalamos el número de patrón entre paréntesis, el patrón mismo y la
forma verbal que lo sigue. El primero de ellos es el siguiente:
(1) Que se puede VMN
que nos suministra las relaciones adjetivo ! verbo siguientes:
IL IDL DL aceptable acomodadizo
aceptar acomodar
abatible acumulable
abatir acumular
hacer bajar amontonar
aditivo ambivalente
añadir interpretar
- 26 - 3. Aplicación en el diccionario
IL IDL DL aguantable ahogadizo amortizable ampliable armonizable asociable
aguantar ahogar amortizar ampliar armonizar asociar
aislable alienable alterable aplacable aplazable
aislar alienar alterar aplacar aplazar
separar enajenar modificar calmar retardar
asequible. comprender
8 7 3
Las relaciones del grupo de las dos primeras columnas (IL o igual lexema)
debe entenderse que responden a definiciones que podemos reconstruir
perfectamente con el cuadro y el patrón. Por ejemplo: “Aceptable: Que se puede
aceptar”.
En el segundo grupo (IDL o igual y distinto lexema), los datos están extraídos
de definiciones como “Abatible: Que se puede abatir o hacer bajar”. El último
verbo de esta definición introduce el caso de entradas y definiciones con una
considerable distancia semántica entre el adjetivo y el verbo, en este caso más por
imprecisión semántica del verbo que por distancia entre las dos palabras. Este
fenómeno ocurrirá muy acusadamente, como veremos, con el patrón “Que VMIP3”.
En muchos casos, el núcleo significativo se desplazará del verbo a otros elementos
de la definición hasta tal punto que hará de dudosa utilidad dicho patrón, a pesar de
su abundancia. De hecho, bastantes de los patrones utilizados son una extensión de
aquél (Que se puede, que puede...)
El tercer grupo de relaciones (DL o distinto lexema) responde a la extracción
de datos de definiciones del tipo: “Aditivo: Que se puede añadir” o “Ambivalente:
Que se puede interpretar...” Este último es uno de los varios ejemplos en que la
definición no termina con el verbo, dato que deberemos analizar más adelante a la
luz de más ejemplos. En este mismo caso podría incluirse la definición de Abatible,
ya comentada por otra razón.
En este patrón de definición no hemos encontrado ejemplos de definiciones
que lo contuvieran con una entrada no adjetiva (casos NA) ni definiciones con el
patrón pero sin ir seguido por un elemento verbal (grupo OC u otros casos).
3 Aplicación en el diccionario - 27 -
Los siguientes patrones proporcionan estos datos:
(2) que se puede VMN
IL NA aconsejable aconsejar
1 7
(3) Que puede VMN
IL IDL DL asimilable asimilarse adhesivo adherirse pegarse alible
asimilable autorregulable
alimentar nutrir comprenderseregularse
1 1 3
En este último cuadro vemos el caso de “Alible: Que puede alimentar o nutrir”
donde aparece un primer ejemplo de verbos en disyunción dentro de la definición.
(4) que puede VMN
DL NA acromático alcaloideo anaerobio anfibio anfibio anfótero árbitro
transmitir combinarse vivir desarrollarse funcionar vivir reaccionar hacer
7 11
En esta tabla ya se apunta una posible conclusión: los patrones que se
encuentran al inicio de la definición suelen resultar mucho más significativos que los
que aparecen intercalados. Obsérvese como prácticamente todos los verbos de los
patrones impares (1 y 3) expresan el mismo concepto o uno de muy similar al de los
adjetivos respectivos, mientras que esto no sucede en la mayoría de los ejemplos de
los patrones pares (2 y 4). En el primer caso, el de los patrones impares, estaríamos,
dentro del marco de EWN, ante posibles relaciones XPOS_NEAR_SYNONYMY;
- 28 - 3. Aplicación en el diccionario
en el segundo caso, el de los patrones pares, cabría la posibilidad de estudiar una
posible hiperonimia entendida en un sentido muy amplio o de preguntarse por una
posible y difusa relación tipo fuzzynym (VOSSEN 2003).
(5) Que puede ser VMP
IL IDL DL arrastradizo arrastrado apreciable apreciado percibido accesible
apreciable arbitrable asequible
comprendido alcanzado conseguido valorado tasado resuelto decidido alcanzado conseguido
1 1 4
Aquí, igual que en el patrón (3), pero ahora con participios, encontramos
definiciones con dos o tres elementos verbales relacionados disyuntivamente. Por
ejemplo: “Accesible: Que puede ser comprendido, alcanzado o conseguido”.
(6) que puede ser VMP
DL NA OC amovible apartado
1 3 1
Aparece el primer ejemplo del grupo OC (otros casos). Se trata del adjetivo
ambiguo, que contiene el patrón pero no va seguido de ningún elemento verbal.
(7) Que es susceptible de VMN
IDL adaptable adaptarse ajustarse
1
(8) que es susceptible de VMN: 0 casos.
3 Aplicación en el diccionario - 29 -
Con este patrón se han iniciado una serie de ellos que, aunque utilizados
inicialmente en la extracción de datos, no han ofrecido ningún resultado positivo.
(9) Que es susceptible de ser VMP
IL DL admisible aprovechable
admitido aprovechado
audible oído
2 1 (10) que es susceptible de ser VMP
IL alcalnzable alcalcanzado
1 (11) Que es digno de ser VMP
IL abominable abominado
1
(12) que es digno de ser VMP
IL OC admirable admirado
1 1
(13) Que se puede o debe VMN
DL aditivo añadir
1
(14) que se puede o debe VMN: 0 casos.
(15) Que se debe VMN: 0 casos.
(16) que se debe VMN: NA, 1 caso.
- 30 - 3. Aplicación en el diccionario
(17) Que hace VMN
IL OC abortivo abortar
1 2
(18) que hace VMN: NA: 24 casos.
(19) Que sirve para VMN
IL DL aguzadero aguzar adquisitivo
anodino antitanque aperitivo auditivo
adquirir calmar destruir abrir oír
1 5
En este patrón se nos plantean algunos casos en los que el verbo orienta bien el
significado, pero en un sentido tan amplio que resulta insuficiente para delimitarlo un
mínimo y poder establecer una cierta relación adjetivo ! verbo como las que
estamos buscando. Por ejemplo: “Antitanque: Que sirve para destruir (...)” o
“Aperitivo: Que sirve para abrir (...)”
(20) que sirve para VMN
IL DL alargador
alisador
alargar alisar
abrazadera adhesivo aglomerante aguadero ambulatorio
dividir pegar unir protegerse andar
2 5
3 Aplicación en el diccionario - 31 -
(21) De la facultad mental de VMN
IL aprehensivo aprehender
1
(22) de la facultad mental de VMN: 0 casos.
(23) Que tiene capacidad de VMN
IL DL aprehensivo aprehender audible oír
1 1
(24) que tiene capacidad de VMN: 0 casos.
(25) Se aplica a la persona o cosa que es VMP
IL adoptivo adoptada
1
(26) se aplica a la persona o cosa que es VMP: 0 casos.
(27) Se aplica a la persona que es VMP
DL OC animado divertida
1 3
Los casos del grupo OC hacen referencia a adjetivos como entrada en el
diccionario, que cumplen el patrón en la definición, pero que éste va seguido de una
forma adjetiva, y no de una forma verbal. Un ejemplo es: “Astroso: Se aplica a la
persona que es vil”.
(28) se aplica a la persona que es VMP: 0 casos.
- 32 - 3. Aplicación en el diccionario
(29) Se aplica a la cosa que es VMP: 0 casos.
(30) se aplica a la cosa que es VMP: 0 casos.
Existen varios patrones más que nos han dado algún resultado positivo (IL o
DL), pero muchos más en la definición de otras categorías, particularmente nombres
(NA), o que responden correctamente a la primera parte del patrón, pero luego van
seguidos de otras categorías (OC). Incluso se da el caso de deficiciones con cambio
en el lexema, pero con un resultado poco significativo, ya que la forma verbal
inmediata no tiene un contenido semántico clarificador del significado y precisa de
los complementos que siguen. Este podría ser el caso de:
(31) Persona que VMI
IL DL NA OC abusón abusa adepto
adjunto agnónico andador anticlerical árbitro asesor
ha llegado ejerce está especializado lleva defiende puede tiene
1 7 180 1
Vemos aquí como para un caso útil a nuestros propósitos, tenemos 180 casos
en que el patrón actúa en la definición de palabras no adjetivas (muy
mayoritariamente nombres) y los casos de defición de adjetivos con cambio de
lexema en el patrón verbal tienen una relación muy tenue y poco relevante
significativamente con la entrada del diccionario.
Independientemente de lo señalado, el patrón (31) responde a la definición de
un nombre y no de un adjetivo. Sin embargo, el diccionario anota para estas
acepciones las categorías adj. / s. m. Con ello incidimos en un tema que ha merecido
3 Aplicación en el diccionario - 33 -
discusión en algunos momentos: el carácter funcional de la gramática. En nuestro
caso y en otros similares, vistas las aplicaciones que debe tener el análisis lingüístico,
podría ser más útil una gramática poco fina en los matices del análisis, pero más
práctica para su implementación en otros procesos.
Hemos explorado otros patrones posibles con resultados poco satisfactorios:
(32) Que VMI
(33) Que se VMI
Todos ellos aparecen en muchas ocasiones e indican siempre adjetivos, pero el
elemento verbal puede ser muy variado y en la mayoría de las ocasiones poco
relevante. Se requeriría, en todo caso, entrar más en la definición y extender la
amplitud del patrón. Nos estamos refiriendo a casos como:
(32’) Que (tiene/está/es/causa/produce/puede/...)
(33’) Que se (hace/comporta con/puede/obtiene por/...)
Estos mismos patrones dentro de la definición, es decir, en minúscula, todavía
dan resultados más incontrolables.
3.2.2. Con la letra M-
Con las entradas en la letra M- hemos procedido igual que con la letra A-:
búsqueda patrón a patrón de todas las entradas adjetivas que lo contenían en la
- 34 - 3. Aplicación en el diccionario
definición seguidos, obviamente, de una forma verbal. Habiendo valorado ya que los
elementos extraídos que ofrecían más interés en sus relaciones eran aquellos que
suponían un cambio en el lexema entre el adjetivo y el verbo, hemos cuantificado
todos los casos, pero sólo hemos anotado las formas adjetivas o verbales cuando se
establecía una relación IDL o DL.
Exponemos aquí las relaciones adjetivo ! verbo con cambio de lexema y con
el patrón definitorio de donde han sido extraídas y retomaremos más adelante los
elementos cuantitativos.
Patrón Entrada Verbos en el patrón de la definición 1 maleable
manual manual marcesible medicable mejorable molificable
trabajar moldear manejar entender marchitar tratar superar ablandar
2 máximo mobiliario
llegar mover
3 miscible modélico molar mórbido movible
mezclarse servir triturar producir variar
cambiar
4 maleable milésimo millonésimo milmillonésimo monómero
batirse dividirse dividirse dividirse formar
extenderse
5 maleable mascado mensurable micrómetro mudable mueble
educado comprendido mesurado medido cambiado movido
influenciado medido
11 miserando ayudado perdonado 17 morlón ver 19 mensural medir
3 Aplicación en el diccionario - 35 -
Patrón Entrada Verbos en el patrón de la definición mnotécnico monitorio
ayudar avisar
amonestar
20 masetero melodreño
mover amolar
27 mandria mísero
apocada desgraciada
desdichada
31 macarra marrano
recibe (se) comporta
32 muerto mordedor
(es )aburrida maldice
(poco) animada satiriza
murmura
3.3. Cuantificación de los datos para A-, M- y P-
Analizaremos a continuación los datos numéricos de todas las relaciones y
cada uno de sus tipos para poder sacar algunas conclusiones sobre la posibilidad y
riqueza de la extracción de relaciones adjetivo ! verbo de los diccionarios a través
de patrones de definición.
Partiremos de la letra A-, los contrastaremos con la letra M-, de la que también
hemos tomado muestras de relaciones, y utilizaremos la letra P- con una finalidad
meramente cuantitativa para comprobar la estabilidad de los datos anteriores.
- 36 - 3. Aplicación en el diccionario
3.3.1. Para la letra A-
Contabilizamos las acepciones (y definiciones) adjetivas que aparecen como
adj. o adj/s. en la letra A- del diccionario. Suman un total de 2252 acepciones. De
acuerdo con ello obtenemos estos datos:
Grupo Casos Porcent. Casos Porcent. Porcentaje sobre 2252 acepciones
IL 23 24% 1.021%IDL 10 11% 0.444%DL 33 35% 66 70% 1.465% 2.930% NA 21 22% OC 7 7 28 30%Total 94
Vemos como localizamos estos patrones de definición en 94 casos, de los
cuales el 70% corresponden a definiciones adjetivas. Estos modelos cubren el
2.930% de las acepciones de los adjetivos o adjetivos / sustantivos. Pensamos que se
trata de unos resultados quizá no muy altos numéricamente (no tenemos por que dar,
de momento, por concluida la búsqueda de patrones), pero bastante fieles (de hecho,
los que no respondían bien por poco fieles al modelo entrada adjetiva – definición
con verbo, aunque quizá más rentables, se han desechado). Además, el valor
cuantitativo radica más en el uso potencial de estos mismos esquemas de búsqueda
de relaciones en otras muchas fuentes estructuradas de información léxica.
El grupo IDL participa de elementos del grupo IL y DL. Si sumamos aquél a IL
obtendremos un número de casos similar (33 casos que mantienen el lexema de la
entrada en el verbo de la definición frente a otros 33 en que esta coincidencia no
aparece). Si lo sumamos a DL tendremos bastantes más casos en los que las
definiciones contienen elementos verbales con lexema distinto al del adjetivo
definido frente a los que no tienen ningún lexema compartido (43 casos frente a 23).
De todos modos, podemos decir que son más los verbos definidores de distinto
3 Aplicación en el diccionario - 37 -
lexema del adjetivo definido que coincidente (43 casos frente a 33, resultado de
sumar IDL tanto a IL como a DL, si bien éste podría incrementarse aún más con los
casos de IDL o DL con más de un lexema distinto).
3.3.2. Comparación con los resultados de M-
Contrastamos, como intento de validación, estos resultados con los que
obtenemos con la letra M- del mismo diccionario. En este caso, salvo para algunos
comentarios, no tomamos nota exhaustiva de cada uno de los adjetivos y del verbo
que aparece en la matriz.
En esta letra se han filtrado previamente sólo las entradas que contienen en
alguna de sus acepciones la categorización adj. o adj/s. Por lo tanto, no se pueden
cuantificar los casos de NA. También se han desechado los casos de OC. El número
de los patrones corresponde a la clasificación del segundo capítulo de este trabajo.
Patrones
Grupos 1 2 3 4 5 6 11 17 19 20 27 Totales
IL 6 8 1 1 16 16IDL 4 1 1 6 22 DL 4 1 5 4 2 4 1 1 5 4 1 32 32 38Totales 14 2 5 4 11 4 1 2 6 4 1 54
Si tenemos en cuenta que las acepciones adjetivas con la letra M- son 1906
obtendremos los resultados que aparecen en esta tabla:
- 38 - 3. Aplicación en el diccionario
Grupo Casos Porcent. Porcentaje sobre
1906 acepciones IL 16 29.6% 0.839%IDL 6 11.1% 0.315%DL 32 59.3% 1.679%Total 54 100% 2.833%
Si presentamos los datos obtenidos con A- en una tabla similar nos
encontramos con lo siguiente:
Grupo Casos Porcent. Porcentaje sobre
2252 acepciones IL 23 34.8% 1.021%IDL 10 15.2% 0.444%DL 33 50.0% 1.465%Total 66 100% 2.930%
Los resultados son bastante similares y muestran unas claras tendencias. Los
adjetivos que responden a los patrones se acercan al 3%. Alrededor de dos tercios
tienen algún cambio de lexema entre el adjetivo definido y el verbo del patrón de la
definición. La mayor parte cambia lexema y una cantidad menor, pero significativa,
lo mantiene. El grupo que tiene más de un elemento verbal en la definición y uno de
ellos de igual lexema que el adjetivo es bastante menor y puede entenderse que
incrementa los otros dos.
3 Aplicación en el diccionario - 39 -
3.3.3. Validación de los resultados con P-
Ya hemos visto que A- y M- dan unos porcentajes similares. Los adjetivos con
P- nos servirán, finalmente, para comprobar la estabilidad de las cantidades y
afinarlas, en su caso. Esta inicial nos ha proporcionado estos resultados:
Patrones
Grupos 1 2 3 4 5 6 17 19 27 43 44 46 47 Total % de 2792
acepcionesIL 3 1 0 0 18 0 0 1 1 0 1 0 1 26 0.930%IDL 4 1 0 0 6 0 0 1 0 1 0 0 0 13 0.465%DL 6 9 9 6 24 3 1 1 0 0 6 2 0 67 2.396%Total 13 11 9 6 48 3 1 3 1 1 7 2 1 106 3.791%Otros 0 15 0 44 2 0 13 0 0 9 2 0
Podemos observar como los patrones se cumplen para un 3,97% de las
definiciones adjetivas, resultado significativamente algo superior a las letras
anteriores. Obsérvese también que hemos obtenido rendimiento de 4 patrones que no
habían dado resultado con las otras dos iniciales. Se trata concretamente de los
siguientes:
43 Que debe
44 que debe(n)
46 que debe ser
47 Que puede o debe ser
Aunque individualmente no presentan un gran resultado, sí son útiles
incorporados en algún o algunos formalismos que los recojan todos.
- 40 - 3. Aplicación en el diccionario
3.3.4. Comparación de resultados
Nos puede ser útil para valorar la productividad de cada patrón, recoger en una
sola tabla las definiciones con IL, IDL y DL para cada una de las letras iniciales
exploradas:
Patrones
Entradas en 1 2 3 4 5 6 7 9 10 11 12 13 17 19
A- 18 1 5 7 6 1 1 3 1 1 1 1 1 6M- 14 2 5 4 11 4 0 0 0 1 0 0 2 6P- 13 11 9 6 48 3 0 0 0 0 0 0 1 3Total 45 14 19 18 65 8 1 3 1 2 1 1 4 15
Patrones
Entradas en 20 21 23 25 27 43 44 46 47 Total % sobre
acepciones A- 7 1 2 1 1 67 2.930 M- 4 0 0 0 1 54 2.833 P- 0 0 0 0 1 1 7 2 1 106 3.791 Total 11 1 2 1 3 1 7 2 1 227 3.266
De acuerdo con estos datos los patrones más productivos son:
(5) Que puede ser VMP
(1) Que se puede VMN
También destacan:
(2) que se puede VMN
(3) Que puede VMN
(4) que puede VMN
(20) que sirve para VMN
Menos, aunque también relevantes:
(6) que puede ser VMP
(44) que debe VMN
3 Aplicación en el diccionario - 41 -
El resto de los patrones son poco potentes individualmente, pero muy útiles
tomados en su conjunto.
Vemos que las acepciones adjetivas que utilizan los patrones identificados en
este trabajo superan ligeramente el 3% de media. Podemos formarnos una idea de la
rentabilidad global de este sistema de extracción de relaciones adjetivo ! verbo si
tenemos en cuenta que el número de acepciones adjetivas de todo el diccionario es de
27.148 (un 3% representan 814; un 4%, 1.083). Téngase en cuenta que esta
extracción debería realizarse a través de medios automáticos, con lo cual resultaría
tremendamente rápida. Su riqueza dependería más de la transportabilidad de estos
patrones para la búsqueda en otros diccionarios e, incluso, en otros idiomas, previa
traducción o adaptación.
3.4. Limitaciones del proceso de extracción
Recordemos que estamos en el marco de EWN, que establece relaciones casi
sinonímicas entre palabras de distinta categoría (XPOS_NEAR_SYNONYMY). Una
primera condición muy significativa para la relevancia de las relaciones entre
adjetivo ! verbo a través de patrones de definición en los diccionarios es la posición
del patrón en el seno de la definición. Constatamos que la seguridad de la relevancia
de dicha relación puede ser bastante incierta cuando el patrón no inicia la explicación
del significado. Por ejemplo, para (2) “que se puede” encontramos:
Máximo: Que es o está en el límite o grado superior al que se puede
LLEGAR.
- 42 - 3. Aplicación en el diccionario
La relación Máximo ! LLEGAR no es, desde luego, casi sinonímica. Esto,
sin ser lo habitual, no es algo extraño en los patrones no situados al inicio de la
definición.
En cambio, cuando el patrón inicia la definición, el resultado suele ser mejor.
Por ejemplo, para (1) “Que se puede” podemos citar:
Mobiliario: Que se puede MOVER o TRASLADAR
donde hemos podido identificar dos relaciones adjetivo ! verbo válidas para
nuestros propósitos: Mobiliario ! MOVER y Mobiliario ! TRASLADAR.
Un segundo tipo de limitación en el proceso de localización de relaciones
válidas nos lo hemos encontrado en algunas ocasiones cuando el verbo presenta una
significación amplia o imprecisa que aporta poco al significado del adjetivo sin su
correspondiente complemento. Esto sucede en algunos de los verbos que cambian el
lexema respecto al adjetivo. Dicho fenómeno plantea una doble problemática:
" La necesidad o no de validar manualmente estas sinonimias entre palabras
de distinta categoría.
" La posibilidad de ampliar el concepto de patrón hasta incluir alguna
función sintáctica tras el verbo.
Las funciones sintácticas tras el verbo, necesarias para precisar el significado
de éste, que hemos encontrado en las definiciones de adjetivos en M- han sido las
siguientes:
" Complemento Circunstancial (de Modo, Instrumento, Compañía o Lugar)
en adjetivos como micrómetro, marrano, mutro, monigote o montonero.
Por ejemplo:
Micrométrico: Que puede ser MEDIDO con el micrómetro
" Complemento de Régimen Verbal en adjetivos como modélico o muerto.
Por ejemplo:
3 Aplicación en el diccionario - 43 -
Modélico: Que puede SERVIR de modelo.
" Complemento Directo en adjetivos como mórbido, monómero, morlón,
mnotécnico, macarra o multimillonario. Por ejemplo:
Mórbido: Que puede PRODUCIR una enfermedad.
Uno de los casos especialmente claros es el patrón 32, “persona que VMIP3S”,
que cuenta con algunos de los ejemplos citados anteriormente y llega hasta 46
acepciones con esta problemática.
Una posible solución estaría en la posibilidad de disponer de una lista de
verbos vacíos (tener, haber, ser, hacer) que cuando fuesen localizados en la
definición tras el patrón trasladasen la búsqueda a algún complemento. Ahora bien,
en este caso habríamos sustituido la relación Adjetivo ! Verbo por Adjetivo !
Nombre. Además, existe la problemática de definir dicha lista. Por ejemplo, de
acuerdo con los dos últimos adjetivos citados más arriba cabría la posibilidad de
incluir en esta lista los verbos “servir” y “producir”, pero ello entorpecería la
localización de una hipotética relación Útil ! SERVIR o Trabajador !
PRODUCIR.
- 45 -
4. Diseño de una gramática de
definiciones
Condensaremos los patrones en una gramática que sea fácilmente
implementable. Así, una posible búsqueda automática reducirá las entradas y
aumentará las salidas para cada uno de ellos. Nos ha parecido válido agruparlos por
la morfología verbal. Incluimos, de momento, sólo los patrones impares (es decir,
aquellos que inician la definición y van, por consiguiente, en mayúscula), y que han
obtenido un mínimo de rentabilidad en la exploración inicial. En la notación hemos
puesto paréntesis , (), para indicar opcionalidad y llaves, {}, para señalar alternancia.
Con VMN (Verbo Principal en Infinitivo):
1. Que se puede VMN
3. Que puede VMN
7. Que es susceptible de VMN
13. Que se puede o debe VMN
15. Que se debe VMN
- 46 - 4. Reducción de los patrones a formalismo
17. Que hace VMN
19. Que sirve para VMN
21. De la facultad mental de VMN
23. Que tiene capacidad de VMN
43 Que debe VMN
1ª regla:
Que (se) +
puede debe puede o debe es susceptible de hace sirve para tiene capacidad de
+ VMN
Con VMP (Verbo Principal en Participio):
5. Que puede ser VMP
9. Que es susceptible de ser VMP
11. Que es digno de ser VMP
25. Se aplica a la persona o cosa que es VMP
27. Se aplica a la persona que es VMP
29. Se aplica a la cosa que es VMP
37 Que está pensado para ser VMP
39 Que es apto para ser VMP
41 Que puede o debe ser VMP
43 Que debe VMI
45 Que debe ser VMP
47 Que debe o puede ser VMP
4. Reducción de los patrones a formalismos - 47 -
2ª regla:
puede debe puede o debe debe o puede
es susceptible digno de ser
Que +
es apto para está pensado para
+ VMP
3ª regla:
Se aplica a la +
persona o cosa
persona
cosa
+ que es VMP
Con VMI (Verbo Principal en Indicativo, tercera personal del singular):
31. Persona que VMI
4ª regla:
“Persona que” + VMI
De momento hemos reducido los patrones a 4 formalismos. Para incluir los
patrones pares, es decir, los que no inician la definición, sólo se debería añadir la
alternativa mayúscula / minúscula en el primer carácter.
- 49 -
5. Proyección a EWN
Concluiremos el presente trabajo analizando como se proyectan nuestros
resultados, es decir, las relaciones adjetivo ! verbo extraídas de los diccionarios a
través de patrones de definición, en EWN. En primer lugar, reflexionaremos sobre el
encaje de nuestra investigación en el EWN General Document final (2003). En
segundo lugar, después de analizar exhaustivamente los adjetivos y verbos extraídos
en el propio EWN, veremos la riqueza del sistema respecto a nuestros resultados y
como estos se acoplan en él, tanto cuantitativa como cualitativamente. Para ello
hemos utilizado la versión en Internet disponible en el momento de la investigación
en http://nipadio.lsi.upc.es/cgi-bin/wei/public/wei.consult.perl
- 50 - 5. Proyección en EWN
5.1. Relaciones Adjetivo ! Verbo en EWN
EWN (VOSSEN et al., 2003) establece una larga serie de relaciones internas
del lenguaje entre significados (synsets). Uno de estos tipos de relaciones es el
llamado XPOS_NEAR_SYNONYMY o relaciones casi sinonímicas entre
categorías gramaticales distintas. Según el documento, éstas pueden establecerse
entre N ↔ V, N ↔ AdjAdv y V ↔ AdjAdv.
En nuestro caso hemos estudiado una parte del tercer tipo de relación, esto es,
la relación Adj ! V, donde el adjetivo aparece como una entrada de diccionario y el
verbo forma parte del final de un patrón que interviene en la definición del adjetivo.
Las relaciones inversas, esto es, V ! Adj, entrada de verbo y definición con patrones
en la que intervienen adjetivos, han sido observadas y nos han parecido irrelevantes
para su extracción de diccionarios.
Aunque las parejas Adjetivo ! Verbo XPOS_NEAR_SYNONYMY
localizadas lo hayan sido en este orden, dicha relación es reversible. Para comprobar
estas relaciones, en Vossen et al. (2003) se ha diseñado una serie de tests en los que
figuran las proposiciones y condiciones que deben cumplir estas palabras para poder
establecer dicha relación. En nuestro caso nos afecta el test 8.
Test 8 XPOS_CASI_SINONIMIA entre situaciones denotando verbos y adjetivos/adverbios
Sí a si alguien o algo X, entonces alguien o algo es Y Sí b si alguien o algo es Y, entonces alguien o algo X Condiciones: " X es un verbo en tercera persona del singular
" Y es un adjetivo " no hay pronombres personales a quien aplicar las frases X o Y " preferiblemente hay una relación morfológica entre el adjetivo
y el verbo Ejemplo: a
b si alguien vive, entonces alguien está vivo si alguien está vivo, entonces alguien vive
Efecto: vivir (X) XPOS_CASI_SINONIMIA vivo (Y)
5. Proyección en EWN - 51 -
vivo (Y) XPOS_CASI_SINONIMIA vivir (X)
En este trabajo hemos considerado más interesantes aquellas relaciones entre
palabras que no comparten lexema, es decir, que no cumplen la condición de relación
morfológica, y hemos intentado identificar el mayor número de ellas.
Aplicamos dicho test a varios adjetivos y nos encontramos con estos
resultados:
" Adjetivos y verbos con igual lexema (grupo IL):
a) si alguien ACEPTA, entonces alguien es ACEPTADO
si alguien es ACEPTADO, entonces alguien ACEPTA
b) si algo AMORTIZA, entonces algo es AMORTIZADO
si algo es AMORTIZADO, entonces algo AMORTIZA
" Adjetivos y verbos con distinto lexema (grupo DL):
c) si alguien CALMA, entonces alguien es APLACADO
si alguien es APLACADO, entonces alguien CALMA
d) si algo ENAJENA, entonces algo es ALIENABLE
si algo es ALIENABLE, entonces algo ENAJENA
e) si alguien VIVE, entonces alguien es ANAEROBIO
si alguien es ANAEROBIO, entonces alguien VIVE
f) si algo TRANSMITE, entonces algo es ACROMÁTICO
si algo es ACROMÁTICO, entonces algo TRANSMITE
Los casos a y b ejemplifican como el modelo funciona cuando verbo y adjetivo
comparten lexema, una condición que el test da como preferible, aunque nosotros
consideramos menos interesante. Aceptado y aceptar o amortizado y amortizar
cumplen una relación XPOS_NEAR_SYNONYMY.
No sucede siempre así cuando el lexema no es compartido. Aplacado y calmar
y alienable y enajenar, modelos c y d, funcionan, es decir, cumplen la relación casi
- 52 - 5. Proyección en EWN
sinonímica entre categorías distintas. Los otros dos ejemplos, e y f, relacionan
anaerobio con vivir y acromático con transmitir. Se observa claramente que la
relación de sinonimia no se cumple y que se precisaría de la complementación verbal
para delimitar de modo similar los significados. Se confirma un fenómeno ya
observado y expuesto en este trabajo en el punto 3.4. Limitaciones del proceso de
extracción.
5.2. Resultados de la investigación en EWN
La búsqueda automática a través de EWN permite una cantidad de
posibilidades muy amplia y en múltiples direcciones. Por ello, nuestra tarea ha estado
limitada y sólo constituye una exploración en EWN de las relaciones adjetivo !
verbo que nosotros hemos podido establecer a través de la metodología que ha sido
objeto de investigación en este trabajo.
Hemos acotado la búsqueda a las entradas en A- y M- y a los adjetivos y
verbos relacionados a través de patrones y que no comparten lexema, ya que se han
determinado como más interesantes dado que dichas relaciones no se pueden generar
a través de mecanismos de derivación. Se ha tomado nota tanto cuantitativa como
cualitativa de los resultados y se ha llegado a sistematizar algunos datos que nos
pueden ofrecer tanto algunas conclusiones como ciertas posibles líneas de trabajo
futuras.
5. Proyección en EWN - 53 -
5.2.1. Datos cuantitativos
Los patrones de definición identificados nos han permitido, en el diccionario
con el que hemos trabajado y para las entradas en A-, relacionar 42 adjetivos con 49
verbos, que podían aparecer en las definiciones en infinitivo, en participio o en
alguna forma personal. De estos 42 adjetivos, sólo 26 (un 62%) aparecen en EWN.
Los 49 verbos, en cambio, figuran todos (un 100%) en EWN.
Todos los adjetivos presentes en EWN tienen también los verbos que se
relacionaron con ellos en el diccionario, algo que no podrá suceder en sentido
contrario dados estos números (de las parejas alterable ! modificar y aislable !
separar, la primera está completa en EWN y en la segunda falta el adjetivo).
Algunos cuentan además con el verbo de la misma familia léxica que el adjetivo,
aunque en ocasiones no esté el propio adjetivo (por ejemplo, el diccionario relaciona
alienable ! enajenar y en EWN aparecen alienar y enajenar, pero no alienable).
Finalmente, en el caso de verbos que aparecen en la definición del mismo adjetivo,
en la mitad de los casos EWN establece relación sinonímica entre ellos (por ejemplo,
en alible ! alimentar, nutrir EWN estable sinonimia entre los verbos, algo que no
sucede con los verbos de accesible ! comprender, alcanzar, conseguir, aunque los
tres figuren en EWN).
Las entradas en M- confirman esta mayor riqueza cuantitativa y esta mayor
granularidad de los verbos frente a los adjetivos en dicha red lexico-semàntica. En
nuestra búsqueda, 37 adjetivos se han relacionado con 47 verbos con distinto lexema
al del adjetivo de entrada. 20 adjetivos (54%) se localizan en EWN frente a 45
verbos (96%).
Para esta entrada hemos realizado búsquedas exhaustivas de acepciones o
synsets y sinónimos de todos los adjetivos y verbos relacionados a través de patrones
de definición en el diccionario (recuérdese que a este nivel estamos trabajando sólo
- 54 - 5. Proyección en EWN
con adjetivos y verbos relacionados, pero con distinto lexema). Podemos, por ello,
presentar unos datos significativos y más precisos.
En el caso de los adjetivos, para 17 entradas presentes tenemos:
" 36 acepciones o synsets,
" 42 sinónimos si buscamos a través de los 36 synsets y
" 78 adjetivos si sumamos los synsets y los adjetivos sinónimos al que ha
originado la búsqueda.
Por ello, para cada adjetivo tenemos de promedio:
" 2,12 acepciones,
" 2,47 sinónimos,
" 1,17 sinónimos por acepción y
" 4,59 voces para cada adjetivo si sumamos los synsets y los sinónimos de
cada uno de ellos.
Estos mismos datos, para los 45 verbos objeto de nuestra búsqueda, dan estas
cifras:
" 216 acepciones o synsets,
" 250 sinónimos si buscamos a través de los 36 synsets y
" 466 verbos si sumamos los synsets y los verbos sinónimos al que ha
originado la búsqueda.
Cada verbo nos da el siguiente promedio:
" 4,8 acepciones,
" 5,7 sinónimos,
" 1,16 sinónimos por acepción y
" 10,36 voces para cada verbo si sumamos los synsets y los sinónimos de
cada uno de ellos.
Se confirma claramente, a nivel cuantitativo, la mayor riqueza de EWN en la
categoría verbo tanto en el volumen absoluto de datos (número de verbos frente a
número de adjetivos) como en el detalle de las relaciones internas en el seno de cada
categoría (acepciones y sinónimos para cada adjetivo y verbo).
5. Proyección en EWN - 55 -
5.2.2. Clarificaciones sobre las relaciones
En el apartado anterior ya se ha podido adivinar que los adjetivos y verbos
relacionados a través de patrones de definición en los diccionarios presentan en
EWN una gran variedad de situaciones a pesar de la relativa escasez de palabras.
Expondremos ahora con más detalle toda esta casuística, aunque no podemos en este
momento y con el volumen de datos de que disponemos valorar su importancia
relativa dentro de lo que representa EWN en su conjunto.
La búsqueda de todas las palabras relacionadas a través de los patrones de
definición nos dará bastantes ejemplos de presencia tanto de los adjetivos como de
los verbos correspondientes (por ejemplo, en adhesivo ! unir o auditiva ! oír
aparecen los términos de ambas categorías). Otro de los casos más frecuente es la
presencia del verbo y la ausencia del adjetivo (por ejemplo: ambulatorio ! andar o
aglomerante ! unir). Muy excepcional, ya que el verbo figura casi siempre en
EWN, es la falta de ambas palabras (por ejemplo: mensurable ! mesurar, aunque sí
aparece medir, también relacionado con mensurable). No se da nunca el caso de
aparición del adjetivo y ausencia del verbo.
Estas situaciones se pueden enriquecer con la confirmación o no de la
presencia del verbo con la misma raíz que el adjetivo de la pareja; por ejemplo, para
la relación aislable ! separar buscaremos en EWN, además de aislable y separar,
aislar. A este respecto, hemos identificado tres situaciones. Primero, pueden
encontrarse los tres elementos: adjetivo, verbo y verbo con la raíz del adjetivo; por
ejemplo, a partir de la relación en el diccionario apreciable ! percibido hemos
identificado en EWN las relaciones apreciable, percibir, apreciar. Segundo,
localizamos el verbo de la pareja relacionada en el diccionario y el verbo con la raíz
- 56 - 5. Proyección en EWN
del adjetivo, pero no el propio adjetivo; por ejemplo, a partir de alienable !
enajenar vemos que el sistema cuenta con enajenar y alienar, pero no con alienable.
Y tercero, identificamos adjetivo y verbo, pero no el verbo con la raíz del adjetivo;
por ejemplo, en alterable ! modificar existen ambas palabras, pero no alterar.
Un caso particular que debe tenerse en cuenta es la existencia de relaciones con
verbos pronominales; por ejemplo, pegarse o comprenderse se relacionan a través
del diccionario con adhesivo o asimilable respectivamente.
Hemos buscado también la presencia o no en EWN de relaciones sinonímicas
entre los verbos identificados a través de las relaciones. También aquí nos
encontramos una tipología bien diversa. Un caso es el de la existencia de sinonimias
entre verbos que han aparecido en las mismas definiciones (ejemplo: alimentar y
nutrir). Otro, la inexistencia de esta relación aunque en el diccionario puedan figurar
disyuntivamente en la definición del adjetivo (ejemplo: alcanzar y conseguir).
Finalmente, puede darse incluso relación de sinónimos entre el verbo de la definición
y el verbo derivado del adjetivo de la entrada (por ejemplo, el diccionario relaciona
arbitrable ! resuelto, decidido, y establece como sinónimos no sólo resolver y
decidir, sino también arbitrar).
Otro terreno en el que cabría profundizar, pero en el que no hemos entrado por
la necesidad de ir acotando el trabajo, y que por ello presentamos más como una
posibilidad futura, es el grado de validez de las relaciones adjetivo ! verbo
establecidas. Podemos apuntar que existen relaciones claramente válidas como
aislable ! separar o auditivo ! oír. Otras son incompletas (antitanque ! destruir)
o manifiestamente vacías (árbitro ! hacer) por el truncamiento que se produce de
elementos complementarios, pero imprescindibles, de la definición. En algunos casos
el resultado es equívoco (como en arrojadizo ! tirar, donde el verbo tiene un
significado claramente activo, mientras el adjetivo suele entenderse pasivamente,
“que se puede tirar con facilidad”, aunque también puede interpretarse al revés, “que
se tira con facilidad”). Existen también aquellas relaciones que remiten a más de una
acepción, algunas o todas ellas secundarias (con el adjetivo maleable hemos llegado
5. Proyección en EWN - 57 -
a batirse, extenderse, educar, influenciar, algunos de cuyos verbos no corresponden
claramente con la acepción principal del adjetivo).
- 59 -
6. Conclusiones
En este trabajo hemos presentado un método para la extracción de relaciones
Adjetivo ! Verbo a través de patrones de definición de los diccionarios. Para ello
hemos procedido a la localización de estos patrones mediante la búsqueda de las
definiciones de determinados adjetivos seleccionados de acuerdo con unos sufijos
que aparecen frecuentemente en derivados posverbales. Se han seleccionado algunos
de estos patrones para proceder a una búsqueda más exhaustiva. Los patrones
desechados para la búsqueda posterior habían presentado durante el tanteo relaciones
mayoritariamente vacías o con formas no verbales en la definición.
Se han clasificado las relaciones encontradas según la coincidencia o no de los
lexemas del adjetivo y el verbo relacionados. Se han considerado más interesantes
aquellas relaciones que no comparten lexema entre los dos términos y por esto se han
extraído nuevas relaciones en entradas del diccionario con otra letra inicial. A partir
de este material se ha desarrollado una gramática para la extracción. Finalmente, se
han explorado las formas localizadas en el diccionario a través de patrones de
definición en EWN y se ha observado con claridad la mayor riqueza de la categoría
verbal. Por esto, la extracción de estas relaciones y su implementación en EWN
podrían enriquecer especialmente la categoría Adjetivo.
- 60 - 6. Conclusiones
Queremos señalar que no se pueden considerar exhaustivos los resultados de
este trabajo. En primer lugar, podrían localizarse algunos otros patrones en este
mismo diccionario, algo que pensamos como posible, aunque no creemos que pueda
llegar a alterar nuestros resultados de modo significativo. En segundo lugar,
búsquedas futuras en otros diccionarios y en otros idiomas sí pueden llegar a ampliar
significativamente el número de patrones de definición identificados. A pesar de
esto, los resultados resultan claramente indicativos de las posibilidades de extracción
de relaciones intercategoriales en los diccionarios para enriquecer estas relaciones
léxicas.
Hemos obtenido unos resultados que rondan el 3%, según la letra inicial que
tomemos como entrada. Es decir, en nuestro trabajo, un 3% de los adjetivos del
diccionario permiten que este adjetivo se relacione con un verbo que aparece en la
definición tras un patrón. No es una rentabilidad muy alta. Ahora bien, su cobertura
se muestra claramente susceptible de ampliación. Por una parte, podemos proseguir
la búsqueda en el mismo diccionario. Por otra, podemos abordar otros diccionarios,
lo que nos dará un incremento de patrones aún mayor. Además, existe la posibilidad
de recurrir a otros idiomas, tanto para comprobar la utilidad de los patrones
existentes como para incrementarlos.
Entre las particularidades de este sistema de extracción de información están su
potencial utilización modular y la posibilidad de ir incrementándolo con nuevos
patrones. Por ello, a la hora de evaluar su rendimiento, podremos considerarlo en sí
mismo, dentro del conjunto en que se integra y en función de su ampliación futura.
Se ha realizado un principio de formalización. de los patrones de extracción de
información identificados. Se consigue así integrar en una pocas reglas un conjunto
bastante amplio de patrones. Algunos patrones son altamente rentables; otros, muy
poco. Con estas reglas, los patrones de bajo rendimiento se integran en conjuntos
más amplios y de mayor utilidad.
Ya se ha subrayado que al explorar la proyección de nuestros resultados en
EWN, se ha puesto de relieve la mayor riqueza de la categoría verbal frente al
6. Conclusiones - 61 -
adjetivo. Por ello, la captura de relaciones adjetivo ! verbo podría enriquecer al
primero a través del segundo.
Nuestra investigación abre diversas posibilidades a trabajos futuros, tanto por
las cuestiones que quedan pendientes de resolver como por las nuevas que se
derivan. Se ha señalado en el trabajo como, además de numerosas relaciones muy
válidas, existen otras vacías o incompletas, equívocas o referidas a acepciones
secundarias. Debería investigarse algún sistema para validar estas relaciones y filtrar
los elementos que generan ruido.
Se encuentra otra posibilidad de investigación en la ampliación de los patrones
con otras funciones sintácticas. Hemos identificado diversas relaciones que requieren
el reconocimiento de ciertos complementos verbales, particularmente
circunstanciales, directos o de régimen verbal, para precisar semánticamente la
relación.
Ya hemos comentado la posibilidad de comparar nuestros patrones en otros
diccionarios y con otros idiomas y la de incrementarlos en estas mismas fuentes.
Finalmente, apuntamos investigar la aplicación de esta metodología a les
relaciones Nombre ! Adjetivo, Nombre ! Verbo y Adjetivo ! Adverbio.
- 63 -
Bibliografía
AGUIRRE, E y M. LERSUNDI. 2001, Extracción de relaciones léxico-semánticas a partir
de palabras derivadas usando patrones de definición. Procesamiento del Lenguaje
Natural 27: 165-172.
ALSHAWI, H. 1989. Analysing the dictionary definitions dins Computacional
Lexicography for Natural Language Processing, Briscoe, E. and Boguraev, B. (Ed.),
Longman, Harlow and London: 153-169.
CASTELLÓN, I. 1992. Lexicografía computacional: extracción de información léxica.
Tesis Doctoral. Univesitat de Barcelona.
DICC. 1996. Diccionario General de la Lengua Española. Larousse-Planeta.
EAGLES. Introducción a las etiquetas EAGLES. Disponible en
http://www.lsi.upc.es/~nlp/freeling/parole-es.pdf
MARTÍ, M. A. 2001. Les tecnologies del llenguatge. UOC. Barcelona.
PAROLE. PAROLE part-of-speech tags for Spanish. Disponible en
http://www.lsi.upc.es/~nlp/tools/parole-eng.html
RIGAU, G. 1998. Automatic Acquisition of Lexical Knowledg from MRDs. Tesi Doctoral.
Universitat Politècnica de Catalunya.
VOSSEN, P. 2003. EuroWordNet General Document (v. 3, Final). Amsterdam University.
Disponible en http://www.hum.uva.nl/~ewn
VOSSEN, P., W. MEIJS y M. den BROEDER. 1989. Meaning and structure in dictionary
definitions dins Computacional Lexicography for Natural Language Processing,
Briscoe, E. and Boguraev, B. (Ed.), Longman, Harlow and London: 171-192.