Rello, Luz-CORAL

Transcription

Rello, Luz-CORAL
C.O.R.A.L.
Construcción de Objetos Representacional Aplicada al Lenguaje
Luz Rello
Ninguna invención es perfecta al nacer.
Cicerón
L. Rello — CORAL: Construcción de Objetos Representacional Aplicada al Lenguaje
3
Índice
1. MOTIVACIÓN
5
2. OBJETIVOS
11
3. DATOS
13
4. METODOLOGÍA
18
5. CONCLUSIONES
21
5.1 El lenguaje como apuntador de objetos
21
5.1.1 Concepción del lenguaje
21
5.1.2 Objeto
22
5.1.3 Referencia a objeto
23
5.2 La naturaleza de la sentencia
25
5.2.1 Sentencia
25
5.2.2 Modelo genérico de sentencia
27
5.2.3 Funciones semánticas en argumentos y objetos
27
5.2.4 Funciones sintácticas en argumentos y objetos
28
5.3 Moldes lingüísticos o tipos de estructura de sentencia
30
5.3.1 Estructuras normales
31
5.3.2 Estructuras especiales
31
E.1: <objeto, ob> <vb. copulativo> <objeto, ob>
31
E.2: <hay> <objeto, ob>
32
L. Rello — CORAL: Construcción de Objetos Representacional Aplicada al Lenguaje
4
E.3: <objeto, ob> <tener> <objeto, ob>
32
E.4: <hace> <objeto, ob>
32
E.5: <objeto> <más> <objeto> <que> <objeto>
33
E.6: <decir> <que> <objeto>
33
E.7: <es> <objeto> <que> <subjuntivo>
34
E.8: <si> <objeto,oración>, <objeto,oración>
34
5.3.3 Formas no personales
34
5.4 Valoración final
6. BIBLIOGRAFÍA
35
38
6.1 Documentos impresos
38
6.2 Textos electrónicos
40
ANEXO I
41
Funciones léxicas de Mel’čuk y relaciones léxico-semánticas.
41
Otras relaciones léxico-semánticas
45
ANEXO II
47
Verbos dicendi
ANEXO III
47
48
Expresiones que rigen subjuntivo
48
Verbos que rigen subjuntivo
48
Conjunciones más subjuntivo
49
ANEXO IV
50
Formas perifrásticas más frecuentes
50
Significación progresiva
50
Significación durativa
50
Significación perfectiva
50
L. Rello — CORAL: Construcción de Objetos Representacional Aplicada al Lenguaje
5
1. Motivación
La modelización del lenguaje natural es una de la áreas de investigación más prometedoras de la actualidad. De hecho, lo ha venido siendo desde el principio del estudio científico documentado que podríamos fijar en la
antigua Grecia hasta nuestros días.
Gran parte de esa fascinación se debe a la doble naturaleza del lenguaje, como construcción artificial del ser humano para algunos, o como producto natural de la evolución del mismo, sin olvidar su cercanía con el pensamiento y las profundas reflexiones que esto conlleva.
Este interés se ha visto acrecentado en los últimos cien años, en los que
los grandes filósofos del siglo XIX y principios del XX se han llegado a obsesionar con su estudio, como en el caso de Wittgenstein y sus dos principales
obras Tractatus e Investigaciones filosóficas, o Frege cuyo interés llevó a la
formalización de la lógica.
Además de estos intentos por parte de los filósofos que tratan de hacerse matemáticos para modelizar el lenguaje, encontramos los lógico-matemáticos como Montague, que tratan de hacerse filósofos para modelizarlo, desarrollando modelos lógicos para este propósito, sin olvidar a Chomsky y su
formalización.
La ventaja es que hoy disponemos de una herramienta para este propósito que ninguno de los grandes investigadores ha tenido: sus propias investigaciones que nos guían en las nuestras y los ordenadores y su formidable
capacidad de cálculo, y más recientemente, lo que considero la mayor herramienta: un corpus de millones de textos para analizar, estudiar y procesar: Internet, que con la ayuda de los ordenadores, permite crear modelos y
comprobarlos en innumerables textos en un plazo mínimo.
Todo esto hace que estemos viviendo un momento especialmente importante para este campo, lo que me lleva a estudiarlo y a desarrollar un
propio modelo, CORAL: Construcción de Objetos Representacional Aplicada
al Lenguaje.
L. Rello — CORAL: Construcción de Objetos Representacional Aplicada al Lenguaje
6
se enmarca —y al mismo tiempo se explica— por las siguientes
circunstancias: la inadecuación de los lenguajes formales cuando se enfrentan a las complejidades propias de los lenguajes naturales, la falta de multidisciplinariedad tan requerida en esta materia, y la necesidad social a la que
nos enfrentamos de gestionar cantidades inabordables de información que
requiere una mejora en la interfaz hombre-máquina.
En primer lugar trataremos la situación de los modelizadores actuales
del lenguaje que intentan superar el nivel palabra.
Hasta el momento se ha gestionado con éxito las palabras entendidas
como cadena de caracteres, basta con pensar en Google; sin embargo, existen otros intentos de superar este nivel en el lenguaje: los lenguajes formales, que se han creado precisamente a partir de los intentos de formalización
de las sintaxis gramatical.1
Su utilización en el Procesamiento del Lenguaje Natural (PLN) ha ofrecido algunas ventajas iniciales, pero están resultado ineficaces al tratar con
lenguajes naturales.
Esta inadecuación se debe a varios aspectos, fundamentalmente al hecho de que su valor fundamental es la determinación de estruturas sintácticas correctas.
En los lenguajes matemáticos y computacionales, las estructuras correctas están claramente diferenciadas de las incorrectas, pero en los lenguajes naturales se emplean —especialmente en el lenguaje literario— estructuras que no son estrictamente correctas ni incorrectas: las figuras retóricas,
ya identificadas por Nebrija.
CORAL
1
Entendemos lenguaje formal en sentido estricto como un conjunto de palabras
infinitas, formadas a partir de un conjunto de caracteres finito (alfabeto), que se
rige por reglas (gramática) y consta de interpretación semántica.
Si establecemos una jerarquía de los diferentes tipos de lenguajes según su grado
de abstracción, estos tipos de lenguajes formales se encuentran un paso más allá de
los lenguajes lógicos, las matemáticas o los lenguajes de programación sin punteros,
y un paso más atrás de los lenguajes naturales que son capaces de hacerse referencia a sí mismos. Los lenguajes de programación con punteros quedan a medio camino entre estos dos extremos, al igual que los lenguajes formales que tratamos, porque mediante los punteros los lenguajes de programación pueden hacerse referencia
a sí mismos, aunque esta referencia no es total, porque se realiza mediante dos
áreas de la memoria —procedimientos y datos—, que en el ordenador se estructuran en diferentes lugares.
L. Rello — CORAL: Construcción de Objetos Representacional Aplicada al Lenguaje
7
Si queremos adecuar las estructuras formales para identificar como correctas las figuras, entonces aparecen dentro de las estructuras correctas un
gran número de estructuras de dudosa corrección y de escaso uso.
Además de otras limitaciones, el resultado final de la aplicación de los
lenguajes formales sería la identificación de estructuras correctas. Esto parece un esfuerzo excesivo para los escasos resultados obtenidos, por eso
pienso que los sistemas de procesamiento de los lenguajes naturales deberían centrarse en las estructuras entendibles más que en las estructuras correctas.
Nos centraremos a continuación en los fines y en los medios con los
que cuentan algunos de los lenguajes formales que más interesan al caso,
para poder apreciar posteriormente la singularidad de CORAL.
Los lenguajes formales orientados al PLN se han utilizado para diferentes fines: desde confeccionar agentes de diálogo, que simulan la compresión
del lenguaje natural, con el fin de mantener diálogos convincentes entre máquina y humano, hasta, como propone Chomsky (N. CHOMSKY 1981) ofrecer una explicación última a la facultad humana del lenguaje a través de
una gramática formal.
La disparidad de estos objetivos no impide que todos estos lenguajes
formales se hayan de servir de un componente fundamental: la sintaxis o las
reglas en que se estructuran, en la que generalmente se integra un lexicón
etiquetado de algún modo.
Para la elaboración de esta sintaxis, los diferentes intentos de modelización han seguido diferentes corrientes gramaticales, desde modelos gramaticales más formalistas en su comienzo a la aplicación de gramáticas de restricciones o enfoques funcionalistas (S. DIK 1992) utilizando diversos lenguajes de programación declarativa como LISP (G. GAZDAR 1989) o PROLOG
(S. DIK 1992). En la actualidad, en Denis Diderot, Paris VII, se están poniendo en práctica las gramáticas generativas no transformacionales (HeadDriven Phrase Structure Grammar, Lexical Functional Grammar, etc.) o la
Teoría sentido-texto para la creación de los nuevos robots de tercera generación (O. GARCÍA MARCHENA).2
No obstante, la aplicación rigurosa de una única teoría lingüística no
está exenta de riegos: porque aunque estos lenguajes formales son eficaces
2
En futura publicación: GARCÍA MARCHENA, OSCAR, “Lingüística española e
Inteligencia Artificial: Aplicación informática de gramáticas de restricciones para la
confección de agentes de diálogo”, Interlingüística, Actas de XXII Congreso Internacional de la Asociación de Jóvenes Lingüistas (AJL), Sevilla, 2007.
L. Rello — CORAL: Construcción de Objetos Representacional Aplicada al Lenguaje
8
para caracterizar lenguajes y para comprobar si una estructura es válida o
no, en cambio crean muchas sentencias sin existencia real y sufren para representar algunas estructuras simplificadas o reorganizadas.
Algunos ejemplos de ello los podemos encontrar al analizar el funcionamiento y los resultados de algunos de los más actuales analizadores sintácticos del español como HISPAL, FreeLing, SUP y Connexor que están basados en diferentes formalismos gramaticales con importantes diferencias a
nivel morfológico, sintáctico y oracional. Estos analizadores ejemplifican
problemas (TINKOVA TINCHEVA)3 aún insalvables de los lenguajes formales,
por ejemplo: la falsa identificación de funciones sintácticas en (1) Papel fundamental han desempeñado en esta recuperación los evangelios…, oración en
la que FreeLing identifica los evangelios con el objeto directo; el erróneo reconocimiento —por parte de Connexor— del objeto directo precedido de la
preposición a en su segunda aparición en la oración en (2) El colmo es ver a
Lucio subiendo al ataque; o la heterogeneidad que se da en el tratamiento
de lexías o nombres formados por varias palabras entre espacios en blanco:
así HISPAL, en la oración (3) Ángel Amor se llama el individuo, no identifica
el nombre propio Ángel Amor como un todo, quizá porque Amor coincide
con el nombre común de amor.
Éstas son sólo algunas de las dificultades más simples a las que se enfrenta un analizador sintáctico, razón por la cual gran parte de los esfuerzos
dedicados en PLN de los últimos años se hayan centrado en la desambiguación de los análisis sintácticos que crean estos modelos.
Asimismo, las bases sobre las cuales se construyen estas modelizaciones
para el PLN son conjuntos de datos que se presentan, o bien en forma de
corpus elaborados ad hoc, o bien como herramientas de reciente creación,
que gestionan grandes cantidades de datos, como los diccionarios ACQUILEX,
ACQUILEX II, WORDNET y EURONET.
El proyecto que presento, CORAL, se diferencia de todas estas modelizaciones tanto en los objetivos como en los medios. CORAL no aspira a dar
una explicación del lenguaje ni a caracterizarlo tal como haría una buena
gramática. CORAL no es normativo, no pretende determinar lo que es correcto e incorrecto, y tampoco parte de un corpus cerrado, diferenciándose del
resto desde su base.
3
En futura publicación: TINKOVA TINCHEVA, NEVENA, “Estado actual del análisis
sintáctico español”, Interlingüística, Actas de XXII Congreso Internacional de la
Asociación de Jóvenes Lingüistas (AJL), Sevilla, 2007.
L. Rello — CORAL: Construcción de Objetos Representacional Aplicada al Lenguaje
9
tiene a su disposición —ya verán cómo— el corpus más vivo,
rico y extenso del planeta: Internet. Y no modeliza la gramática del español,
sino que trabaja con estruturas o moldes que transmiten información, superando el nivel palabra, independientemente de la corrección o incorrección
de las estructuras, tomándolas tal como plantean las estadísticas de su aparición en Internet.
Se podría pensar que CORAL no repara en el funcionamiento del lenguaje para su desarrollo, sino todo lo contrario: que no tenga la pretensión
de explicarlo no significa que no deje de nutrirse de los avances de la lingüística, como sucede desde su nacimiento.
El segundo motivo que plateaba como razón para la creación de CORAL
era la falta de multidisciplinariedad en nuestras universidades en un campo
que lo requiere tanto como el PLN. Por un lado encontramos programas realizados por programadores geniales que saben poco de lengua y por otro
lado programas bastante deficientes realizados, no sin esfuerzo, por parte de
atrevidos lingüistas.
Seguramente comiencen pronto en nuestras universidades grupos de
PLN formados por dos tercios de informáticos y un tercio de lingüistas, como
en Stanford, tal como me comentaba Dan Jurafsky, profesor de PLN de esa
universidad. Pero este pensamiento optimista necesita ayuda y necesita proyectos como CORAL.
CORAL aboga desde su comienzo por la pluridisciplinariedad, porque la
necesita, ya que sin una perspectiva multidisciplinar, CORAL no sería posible: CORAL no puede ser planteado sin un lingüista, ni puede ser desarrollado sin un informático. Ambas disciplinas se auxilian, se complementan, y al
combinar las posibilidades, cada una con las de otra, éstas fuerzas se multiplican.
Finalmente, la tercera motivación que ha llevado a la creación de este
proyecto es práctica, porque CORAL intenta responder a una necesidad social y empresarial.
Estamos en un momento en el que ha aparecido un medio que ha revolucionado la comunicación entre las personas, poniendo a disposición de cada ser humano una cantidad inabordable de información. Es mucho más
necesario el desarrollo de una tecnología que filtre la información disponible
y la digiera, dando respuestas concretas a preguntas concretas, que la propuesta de una serie de páginas en las que encontrar la información.
Basta recordar que la empresa que mayor crecimiento ha experimentado en el mundo, que hasta hace 9 años no existía y tiene unos ingresos
CORAL
L. Rello — CORAL: Construcción de Objetos Representacional Aplicada al Lenguaje 10
anuales de 5.264 millones de Euros —en el año 2006—, se dedica fundamentalmente a procesar la información.
Hasta el momento, Google, gestiona las palabras como cadenas de caracteres, así que si fuéramos capaces de ir un paso más allá, procesando la
información, el beneficio para la humanidad sería enorme.
Pensamos que CORAL puede ser una línea de desarrollo muy esperanzadora en este sentido, sobre todo porque trata —como detallaremos más adelante— de extraer de los diferentes moldes o estructuras lingüísticas la información que podrían aportar, a partir de planteamientos propios y sin
centrarse en una única corriente lingüística.
L. Rello — CORAL: Construcción de Objetos Representacional Aplicada al Lenguaje 11
2. Objetivos
El objetivo de CORAL es dar un paso más allá en el procesamiento de
información. Hasta el momento esta gestión se ha realizado con éxito a nivel
palabra, entendiendo la palabra como una cadena de caracteres, siendo esta
forma de procesamiento únicamente estadística, no de conocimiento.
En este paradigma se persigue identificar la información contenida en
expresiones compuestas de varias palabras, en lo que hemos llamado nivel
sentencia o nivel estructurado compuesto de referencias a objetos y de elementos estructuradores (v. CONCLUSIONES, § 5.1.3). Para ello no hemos utilizado los criterios usados con anterioridad en otros modelos, precisamente para evitar los fallos que éstos producen, sin poder evitar que surjan otros nuevos (v. METODOLOGÍA).
Es por esta razón, por la que el paradigma que presento se preocupa más
por identificar la información contenida en cada expresión, que su posible corrección o incorrección, además de obtener como resultado del análisis información relevante para la compresión de la misma.
Como adelantamos con anterioridad, CORAL se diferencia del resto de los
intentos de modelización en tres aspectos fundamentales: objetivos, metodología y datos en los que se basa.
El objetivo de CORAL es el procesamiento de la información que transmiten estructuras del lenguaje superando el nivel palabra, entendida como cadena de caracteres. Estas estructuras con las que trabaja CORAL no coinciden
con las estructuras de las gramáticas ni son explicativas del lenguaje. Estas
estructuras son concebidas (v. CONCLUSIONES, § 5.2.1) como sentencias, como
moldes que transmiten información por poseer una estructura que CORAL ha
definido y por relacionar objetos mediante los elementos estructuradores. Como se explicará, el cuerpo teórico que fundamenta y estructura CORAL se basa precisamente en la naturaleza de sentencia que plantea y la concepción del
lenguaje como apuntador de objetos (v. CONCLUSIONES, § 5.2.1).
El objetivo de CORAL aspira a ser: realista, efectivo y perdurable.
L. Rello — CORAL: Construcción de Objetos Representacional Aplicada al Lenguaje 12
Con realista me refiero a que persigo que CORAL se ajuste a la realidad
del lenguaje y no que el lenguaje se ajuste al modelo, como ocurre con los
corpus creados ad hoc. Esta es la razón por la que CORAL se nutre, no de un
corpus limitado o cerrado, sino del corpus de datos más vivo, variado y extenso posible: Internet.
Mientras que el realismo afecta a los datos con los que CORAL trabaja (v.
DATOS), la búsqueda de la efectividad y de la perdurabilidad ha influido en la
metodología (v. METODOLOGÍA).
La pretensión de perdurabilidad de los resultados ha hecho que la metodología que CORAL sea especial: en vez de determinar reglas —mediante las
cuales supuestamente se rige el lenguaje—, y crear un modelo que genere y
analice oraciones —cuyos resultados se estiman a corto plazo—, lo que persigue es abordar el lenguaje natural, seleccionando las estruturas más sencillas
y procesarlas, y una vez reconocidas éstas, pasar a las más sencillas de las
restantes. Este proceso se realiza siguiendo un método hipotético deductivo.
Para que la modelización sea lo más efectiva posible he creado planteamientos propios, y en ocasiones, he tomado parámetros de los paradigmas
lingüísticos que mejor se ajustaban a las necesidades de cada caso que planteaba el español para su modelización.
Así, CORAL no pretende ser una explicación o una simulación del posible
funcionamiento gramatical. Sus pretensiones son más humildes: tan sólo pretende que la entrada y la salida de la información en la máquina coincida con
la der ser humano, ya que nuestro objetivo es que la máquina entienda el lenguaje humano, no estudiar el modo en el que el ser humano procesa el lenguaje.
También CORAL funciona con independencia de la normatividad del lenguaje. Si una estructura que transmite información se da en la realidad de un
modo representativo estadísticamente, esta estructura será considerada por
CORAL.
No obstante, aunque CORAL no pretende ser un modelo del funcionamiento del lenguaje, sí se han tenido en cuenta las conclusiones de las investigaciones lingüísticas para la creación de CORAL.
En la práctica la potencial aplicación de CORAL es múltiple, porque el
procesamiento de la información a nivel sentencia implica la posibilidad de
manipular, extraer, modificar y transformar información, de tal modo que las
posibilidades de aplicación de CORAL en PLN son variadas y afectan muchos
campos relacionados con los auxiliadores en la interfaz hombre-máquina: como los buscadores en bases de datos, consultas en bases de datos, ayuda al
procesamiento de textos, reconocimiento de voz, o traducción automática.
L. Rello — CORAL: Construcción de Objetos Representacional Aplicada al Lenguaje 13
3. Datos
parte de los datos que le aporta PLANKTON: un modelo léxicomorfológico que viene siendo desarrollado desde el año 2001 por Eduardo
Basterrechea y sus alumnos de PLN de la licenciatura de Lingüística de la
Universidad Complutense de Madrid.
Como PLANKTON cuenta con una fuente inagotable de textos que procesa —Internet—, en principio, CORAL tendría a su disposición un corpus
total.
Sin embargo, CORAL no aspira, en un primer momento, a tener un afán
totalizador y a dar cabida a todos los tipos de sentencias posibles, sino ir
reconociendo estructuras más sencillas y recursivas, y poco a poco, y una
vez modelizado lo simple, pasar a considerar las siguientes estructuras que
volverán a ser las más simples dentro de las complejas.
PLANKTON es un repositorio de textos en el que se integra un lexicón.
Cada palabra de este lexicón sufre una serie de procesos en cada uno de los
módulos constitutivos de PLANKTON. Tras estos procedimientos, cada palabra es identificada de manera única mediante el binomio (a) cadena de caracteres (stream) y (b) significado, de modo que una palabra con dos significados tendrá dos representaciones en nuestro sistema, más una representación por cada categoría en la que exista una palabra representada por esa
misma cadena de caracteres. Cada categoría se caracteriza por una serie de
rasgos y se evitan desde el principio problemas de ambigüedad e identificación como sucedía con el analizador sintáctico HISPAL, gracias a la función
etiquetadora para palabras polisémicas y palabras con las misma grafía que
realiza Krill, un módulo de PLANKTON.
Veamos a continuación cómo PLANKTON consigue ese milagro: partir de
la maraña de textos de Internet, modelizar el stream o cadena de caracteres
y devolver a CORAL palabras etiquetadas que serán los datos con los que
CORAL trabajará.
CORAL
L. Rello — CORAL: Construcción de Objetos Representacional Aplicada al Lenguaje 14
PLAKTON
Internet
araña
enlaces
camaleón
textos
cocodrilo
Palabras
desconocido
pez
Krill(En,1,1,1)
Krill(un,1,1,2)
Krill(lugar,1,1,3)
rémora
lexicón
hormiga
vaca
Los cilindros representan almacenes de información mientras que procesos están recuadrados.
El camaleón es una navegador que funciona de manera automática: recibe la página html y divide la página entre lo que son los enlaces y lo que
es el texto. Los textos van al cilindro de textos y los enlaces al de enlaces. El
camaleón también hace un filtrado de textos en otros idiomas, o de textos
que no interesen.
La araña toma la información de enlaces y los utiliza para pedir más
paginas html a Internet, que van a pasar al camaleón donde se vuelve a repetir el mismo proceso. De esta manera se van rastreando y adquiriendo
textos procedentes de Internet.
El cocodrilo es un procesador que recoge los textos y los descompone en
palabras. Cada palabra está asociada al texto donde se localiza. De esta
manera se podrán reconocer y saber cómo están estructuradas para la futura incursión de CORAL. Esta manera de asociar palabras al texto se llama
Krill. Por ejemplo: (4) En un lugar de la mancha.
L. Rello — CORAL: Construcción de Objetos Representacional Aplicada al Lenguaje 15
Krill(En,1,1,1)
Krill(un,1,1,2)
Krill(lugar,1,1,3)
Palabras
Texto
Frase
Posición
Estos módulos —camaleón, araña, enlaces, textos, cocodrilo y krill—
han sido desarrollados en su totalidad y funcionan. Los procesos que describiremos a continuación se encargan de procesar la información de las palabras y están siendo desarrollados en la actualidad con resultados satisfactorios en las partes que ya funcionan.
El papel del pez afecta sobretodo al plano morfológico. El pez trabaja
sobre las palabras: su trabajo es leer la información del krill y aportar nueva información morfológica al krill. Para llevar esto a cabo el pez se sirve del
lexicón, un diccionario, que auxiliará al pez en su segunda tarea que es ir
identificando las palabras que van apareciendo en el Krill con las del lexicón. A medida que se vayan identificando más palabras el lexicón irá aumentando. Cada vez irán apareciendo menos palabras nuevas porque habrá
cada vez más palabras identificadas. Por ejemplo: el pez puede reconocer
una palabra como adjetivo o nombre si lleva las terminaciones –o,–a, –os y
–as, facilitando su identificación en el lexicón.
Cada vez que una palabra haya sido identificada por el pez, éste debe
de notificar necesariamente al krill qué palabra es.
Este paso es fundamental para evitar algunos casos de ambigüedad,
considerada como uno de los mayores problemas de PLN. Así, las palabras
polisémicas tendrán varias entradas en el lexicón, por ejemplo:
(5) palabra(mono, animal, …).
(6) palabra(mono, traje, …).
(7) palabra(mono, bonito, …).
El lexicón no está estructurado como el krill, en donde todos los hechos
son iguales. Dentro del lexicón hay diferentes tipos de palabras y cada clase
de palabras se caracteriza de una manara diferente. Para cada palabra hay
un único esquema o entrada. Por ejemplo la entrada (8) palabra(id_palabra, mono, animal) será única, es decir, sólo hay una palabra que tiene
estos argumentos. A esta palabra se le asigna un número correlativo, de esta
manera, una palabra determinada puede ser identificada de manera única.
L. Rello — CORAL: Construcción de Objetos Representacional Aplicada al Lenguaje 16
El hecho de trabajar con números encuentra su explicación en la optimización informática que un único número posibilita en comparación a una
cadena de caracteres de dos líneas, que es lo que viene a ocupar cada palabra.
Para cada categoría se ha creado un índice propio ya que cada categoría se explica con hechos diferentes. Mostramos a continuación la modelización de cada clase:
palabra(id_categoría, palabra, categoría,
id_dentrocategoría).
sustantivo(id_dentrocategoría, palabra, género, número,
significado).
adjetivo(id_dentrocategoría, palabra, género, número, grado,
significado).
adverbio(id_dentrocategoría, palabra, tipo, significado).
adverbiomente(id_dentrocategoría, palabra, significado).
propio(id_dentrocategoría, palabra, tipo de complemento,
significado).
conjunción(id_dentrocategoría, palabra, tipo de oración,
significado).
interjección(id_dentrocategoría, palabra, significado).
pronombre(id_dentrocategoría, palabra, tipo, número, persona,
género, significado).
deternimante(id_dentrocategoría, palabra, tipo, número,
género, significado).
verbo(id_dentrocategoría, palabra [infinitivo], personal,
regular, conjugación, trasitivo/intransitivo, complementos
[categoría obligatorias y categorías opcionales],
significado).
forma_verbal(id_dentrocategoría, id_dentro_categoría_verbal,
palabra, modo, tiempo, persona, número, voz, regular/
irregular).
La hormiga está todavía por definir, utiliza aspectos sintácticos y semánticos para realizar la misma labor que realiza el pez: buscar los aspectos
sintácticos y semánticos para tratar de determinar con más detalle las palabras.
En el cilindro desconocido van a parar todas las palabras que no las
puede encontrar el pez en el lexicón. Estas palabras se definen con el siguiente índice: desconocido(palabra, número_apariciones).
Es la rémora la que intenta averiguar algo más sobre estas palabras de
desconocido, preguntando a otros recursos como un conjugador verbal —
otro módulo independiente en proceso de elaboración que traba ja con
PLANKTON—, otros diccionarios como el DRAE, Google, páginas lematizadoras, etc. Si una palabra de desconocido se encuentra satisfecha por alguno
L. Rello — CORAL: Construcción de Objetos Representacional Aplicada al Lenguaje 17
de estos recursos, pasa a ser añadida al lexicón y deja de formar parte de
desconocido.
Finalmente, la vaca toma y desarrolla las palabras del lexicón, que luego vuelve a añadir al lexicón una vez que han sido desarrolladas. Un ejemplo de palabra desarrollada que devuelve la vaca es cualquier verbo conjugado en su totalidad, de modo que, cuando aparezca alguna otra forma de
ese verbo en el lexicón, ésta ya esté identificada.
L. Rello — CORAL: Construcción de Objetos Representacional Aplicada al Lenguaje 18
4. Metodología
Adoptando siempre el método hipotético deductivo, el tratamiento automático del lenguaje natural puede orientarse desde dos puntos de vista
diferentes: (a) entendiendo el lenguaje como una secuencia lineal de caracteres o stream y (b) desde la idea a transmitir.
Dependiendo del punto de partida que se tome en el proceso de la realización del lenguaje: o bien la noción abstracta de la que parte el hablante
(b), o bien de la materialización final, el stream (a).
En el primer caso (a) se parte del lenguaje —como cadena de caracteres— hasta la idea a transmitir, pasando por diferentes grados de abstracción creciente: carácter < palabra < grupo < sentencia < sentencia compleja < párrafo < texto.
El stream se divide en palabras, éstas habrán de ser clasificadas en
grupos de palabras, y éstos a su vez formarán sentencias, y así sucesivamente hasta llegar al texto.
Como se observa, estos niveles no se corresponden con los niveles del
lenguaje: fonético, fonológico, morfológico, sintáctico, semántico, pragmático
y textual.
PLANKTON esta siendo desarrollado siguiendo esta aproximación: una
modelización ascendente.
Oraciones
Grupos de palabras
Palabras
Stream
L. Rello — CORAL: Construcción de Objetos Representacional Aplicada al Lenguaje 19
La segunda posibilidad (b) es sobre la que versa este estudio: CORAL.
Se trata de una modelización descendente, desde la noción de lo que se pretende transmitir hasta el mensaje concreto. Se entiende que la mejor aproximación metodológica al problema sería desarrollar ambas líneas hasta llegar al punto de encuentro.
Para llegar a ello, CORAL, además de los planteamientos originales en
los que se basa —el lenguaje como apuntador de objetos y la naturaleza de
la sentencia y sus tipos—, se ha servido de los principales enfoques lingüísticos —formalistas y funcionalistas— del momento, que se rigen también
por métodos hipotéticos deductivos, siendo las diferencias entre ellos tales
como la concepción que puedan tener del lenguaje, un diferente grado de
formalización y la mayor o menor flexibilidad de sus planteamientos que
dependerá de los parámetros —objetivos o relativos— que utilicen para determinarlos.
CORAL se servirá de herramientas valiosas, producto de las investigaciones de estas corrientes, siempre que éstas sean consideradas las más efectivas para el tratamiento de los aspectos del lenguaje escrito del que está
compuesto Internet y no crearan contradicción en el aparato teórico de CORAL, es decir, siempre que sean efectivas y consistentes.
Consecuentemente, podemos considerar este proyecto en parte funcionalista: por la asunción de una correspondencia no arbitraria entre la forma
gramatical y la función que desempeñan, y por la relevancia que adquieren
las funciones gramaticales en este modelo, aunque estas funciones son entendidas en CORAL de un modo original, adecuadas a sus objetivos.
Por otro lado, CORAL, como todas las modelizaciones, es formal en el
sentido en el que utiliza un sistema notacional matemáticamente preciso
para materializar las generalizaciones e implicaciones del lenguaje. Pero no
es formal si se entiende formal como oposición al significado y al uso del
lenguaje. Asimismo, CORAL no quiere caer en la excesiva abstracción de los
datos reales, como se critica a algunos modelos formalistas, sino que pretende mantenerse cerca de la realidad del lenguaje, por este motivo no tendrá
sentido hablar de un modelo normativo, aunque reconocerá las estruturas
mal formadas considerando un parámetro ± correcto. Esto no será relevante
en comparación al valor del que se inviste una sentencia debido a su uso, a
su capacidad de comunicar, y así se puede inferir un tipo de modelo de estructura a partir de esa sentencia.
Además de estos factores habrá que añadir a nuestra metodología una
variable que juega un papel fundamental en CORAL: la estadística. Porque
en el desarrollo teórico de CORAL —en el que se determinan los diferentes
L. Rello — CORAL: Construcción de Objetos Representacional Aplicada al Lenguaje 20
moldes o estructuras de información—, las primeras formas en ser considerados serán las más frecuentes en el lenguaje de Internet que nos facilita
PLANKTON.
Sobre la metodología es necesario añadir que CORAL no sólo aboga por
el método hipotético deductivo, basándose en los datos empíricos que le
aporta PLANKTON, sino que es consciente de no querer adoptar un enfoque
normativo —generalmente inductivos— por dos razones: en primer lugar
porque CORAL aspira a acercarse al procesamiento del lenguaje real —no del
ideal—, porque sólo así, tomando Internet, se podrá avanzar en la práctica
del PLN, buscando resultados útiles y aplicables no sólo en la teoría; y en
segundo lugar, porque no quiere caer en la inadecuación de los modelos anteriores, que han intentado superar el nivel palabra en el PLN, como vimos
con los analizadores sintácticos (v. MOTIVACIÓN).
Del trabajo con el lenguaje natural, siguiendo esta metodología, irán
surgiendo sencillas estructuras seleccionadas o “moldes de significación”: las
sentencias.
Los criterios para determinar las estruturas que se van seleccionando
son tres: el criterio estadístico, es decir, se tendrán más en cuenta el tipo de
estruturas que más aparecen; la posibilidad de reconocimiento de la estructura dentro del corpus; y en tercer lugar la facilidad que presente la estructura de ser incluida en los objetos y, por extensión, su coherencia dentro del
cuerpo teórico de CORAL.
Estas sentencias serán comprobadas empíricamente en su existencia, en
su uso y su posible identificación en el corpus. Después de este proceso se
realizará lo mismo con la siguiente sentencia de modo que su existencia, uso
e identificación sean compatibles y, en la medida de los posible, complementarias con las sentencias comprobadas con anterioridad que ya forman parte
de CORAL, pero que son susceptibles de sufrir cambios en el caso de descubrir nuevos comportamientos del lenguaje que obligue a cambiar los planteamientos. Es por esto por lo que CORAL se remodela y se perfecciona
constantemente a medida que avanza la investigación.
L. Rello — CORAL: Construcción de Objetos Representacional Aplicada al Lenguaje 21
5. Conclusiones
El resultado de esta investigación ha dado lugar a la creación teórica de
CORAL —más relacionada con la rama de la lingüística—, pensada para la
aplicación de la informática, que por falta de recursos, no ha podido ser llevada acabo, pero que es posible, ya que durante la creación del planteamiento teórico de CORAL siempre se ha tenido en cuenta la viabilidad del
proyecto que se ha ido asegurando gracias a las consultas realizadas a expertos en informática.
CORAL se fundamenta en dos ideas originales principales: la concepción
del lenguaje como apuntador de objetos y la naturaleza de la sentencia.
5.1 El lenguaje como apuntador de objetos
5.1.1 Concepción del lenguaje
El lenguaje es un instrumento de interacción social (S. DIK 1997: 5)
cuya principal razón es establecer comunicación entre los seres humanos, y
gran parte de esto se consigue mediante la expresión del pensamiento a través del lenguaje, matizando así a Chomsky (1985: 15-16) quien mantiene
que la función del lenguaje será principalmente la expresión del pensamiento. Así como el lenguaje, grosso modo, transmite ideas entre dos seres humanos, necesitamos tener alguna noción de lo que un ser humano quiere
transmitir.
Se parte de que en la mente de cada persona hay un universo de objetos relacionados entre sí. Estos objetos no tienen que estar basados necesariamente en referentes procedentes de la realidad extralingüística. En base a
esto, si se considera que el lenguaje hace referencia o apunta a objetos, en-
L. Rello — CORAL: Construcción de Objetos Representacional Aplicada al Lenguaje 22
tonces cada sentencia estará formada por apuntadores de objetos,4 es decir,
el contenido de cada mensaje sería entonces una serie de apuntadores a estos objetos sobre una estructura concreta. Algunas de estas estructuras concretas pueden ser recurrentes en la forma de relacionar objetos, lo que permite su sistematización por parte de CORAL.
5.1.2 Objeto
Un objeto sería una noción inaprensible, que al ser realizada en una
cadena de caracteres, más que representar al objeto representaría un aspecto
de éste, es decir, una realización del mismo.
Así palabras sinónimas representarían aspectos diferentes pero próximos de los mismos objetos. La palabra (9) banco y la palabra (10) entidad
financiera apuntan o refieren al mismo objeto pero a aspectos diferentes. La
misma parte del objeto cuando son sustituibles (sinónimos) y diferente parte, si no son sustituibles.
Es importante resaltar que la misma cadena de caracteres puede apuntar a dos objetos totalmente diferentes. En este sentido, la palabra (9) banco
apunta a varios objetos diferentes: asiento; mesa de carpintero; conjunto de
peces; entidad financiera; o almacén de órganos, tejidos o líquidos fisiológicos humanos. Para poder diferenciar estos streams —compuestos por los
mismo caracteres, pero que apuntan hacia objetos diferentes— nosotros utilizamos un identificador, que será un significado del stream que permita diferenciarlo de los demás. Cada palabra tendrá tantas representaciones en
nuestro sistema como significados tenga (11):
palabra(banco,
palabra(banco,
palabra(banco,
palabra(banco,
palabra(banco,
24389), sustantivo
76896), sustantivo
2344), sustantivo
6786), sustantivo
9808), sustantivo
sustantivo(24389, masculino, singular, asiento).
sustantivo(76896, masculino, singular, mesa_carpintero).
sustantivo(2344, masculino, singular, conjunto_peces).
sustantivo(6786, masculino, singular, entidad_financiera).
4
No existe un paralelismo entre la relación existente entre lenguaje y objetos, que
se plantea aquí, y la relación entre palabra y referencia, ya que esta última relación
se establece entre una expresión nominal y la cosa u objeto real o conceptual, al
que se alude (J. Lyons 1984: 145), mientras que los objetos que proponemos son
más amplios.
L. Rello — CORAL: Construcción de Objetos Representacional Aplicada al Lenguaje 23
sustantivo(9808, masculino, singular, almacén_órganos_
tejidos-líquidos_fisiológicos_humanos).
5.1.3 Referencia a objeto
Una referencia a objeto está formada por (a) una cadena de caracteres
más (b) su significado (B. PARTEE 1990). Por ejemplo, la palabra montaña:
(12) sustantivo[id_dentro de categoría, montaña (palabra), femenino, singular, elevación del terreno (significado). El objeto por tanto
no tiene ninguna representación concreta, sino que tiene múltiples realizaciones o manejadores —handlers—:
A0 - montañoso
A1 - montañés
Funciones sintácticas
Plus - cordillera,
cadena montañosa
Gender - accidente
geográfico
Si - montañero
Culm - pico
Contr - planicie
Process - escalar
Part - ladera, base, pico
Llevar a cabo la modelización de los objetos sería similar a querer realizar una representación del conocimiento, y nuestro objetivo no es representar el conocimiento sino el lenguaje: es tratar de identificar dentro del lenguaje cuáles son las referencias a objetos.
No obstante, un esbozo posible para la estructuración de los objetos
estaría relacionado con la teoría propuesta por Mel’čuk (L. WANNER 1996:
145) sobre las funciones léxicas. Estas funciones léxicas cubren, en todas las
lenguas, las relaciones sintagmáticas que se dan —intensificadores, verbos
soporte…—, así como las relaciones paradigmáticas entre las lexías —sinónimos, antónimos, derivados…— (V. ANEXO I). Se han realizado algunas
aplicaciones de esta teoría al español en grupos de palabras reducidos, que
demuestran el potencial de esta teoría en esta lengua, como por ejemplo el
grupo de términos que designan color y sus derivados (L. RELLO 2007).
Como se representa a continuación, también los objetos deberían recoger al igual que las entradas del diccionario todas las formas morfológicas
posibles de la palabra y sus funciones sintácticas. En (13) A mí me gusta el
L. Rello — CORAL: Construcción de Objetos Representacional Aplicada al Lenguaje 24
agua de la montaña, encontramos tres referencias a objetos: gustar, agua y
montaña.
A0 - acuoso
A0 - gustoso
A1 - aguado
A1 - gustado
Able - soluble
Anti - disgustar
V - gustar
Funciones
sintácticas
S0 - gusto
Magn - encantar,
adorar
Funciones
sintácticas
Excess - inundación
Vb - aguar
Figur - vida
Abv - *aguadamente,
*acuosamente
Unit - gota
A0 - montañoso
A1 - montañés
Funciones sintácticas
Plus - cordillera,
cadena montañosa
Gender - accidente
geográfico
Si - montañero
Culm - pico
Contr - planicie
Process - escalar
Part - ladera, base, pico
Las sentencias se forman a partir de las referencias a objetos más los
elementos estructurales.
Concebimos elementos estructurales de forma aproximada a como las
diferentes corrientes gramaticales han venido definiendo a las palabras vacías, palabras gramaticales o palabras funcionales, siendo palabras cuyo significado es gramatical, o sea, palabras cuyo significado exprese una relación
o la pertenencia a una clase. Por ejemplo en la oración (14) Klir es Plon.
Klir y Plon son referencias a objetos y es es un estructurador que indica
que nos encontramos ante una Estructura 0 (E.0, como veremos más adelante). El ordenador no sabe lo que es Klir o Plon, pero sí que Plon o Klir
son referencias a objetos. Una vez que identificamos los esquemas de referenciación de los objetos, podremos entrar a manejar su contenido semántico.
L. Rello — CORAL: Construcción de Objetos Representacional Aplicada al Lenguaje 25
palabras
elementos estructuradores
5.2 La naturaleza de la sentencia
5.2.1 Sentencia
La sentencia es entendida como una estructura en la que entran en relación los objetos.
La sentencia está relacionada conceptualmente con la oración —más
propia del paradigma tradicional y el formalista— y con la cláusula —de
concepción funcionalista—. La sentencia comparte con la oración que es
autónoma desde un punto de vista sintáctico, que es autosuficiente como
unidad comunicativa en un contexto concreto, y que es la realización concreta de una estructura más abstracta. En cambio toma la sentencia de la
cláusula la idea de que las funciones sintácticas estén relacionadas en torno
al verbo.
La naturaleza de la sentencia que mantenemos considera varios parámetros relacionados con el funcionalismo: como la consideración del lenguaje como instrumento de interacción social —abarcando con esta concepción
todas las clásicas funciones del lenguaje—; así como el principio de la economía lingüística (A. MARTINET 1991: 219-225); la importancia del contexto
(S. C. LEVINSON 1989) en el que se enmarca la sentencia —incluyendo la
situación de la dimensión espacio temporal, el contexto y la presuposición
pragmática—; así como la iconicidad del lenguaje, y por tanto de la sentencia (F. NEWMEYER, 2000: 114).
Consecuentemente, las oraciones que producimos son por lo general —
excusando las licencias poéticas—: lo más cortas, lo más simples, lo menos
ambiguas y lo más entretenidas posible, en aras de la máxima adecuación
social.
Para procesar el lenguaje habrá que llevar a cabo una operación de reconstrucción de todos los elementos ausentes en la sentencia, así como de
los pronombres o proforma y de lo que llamaremos el marco de la sentencia:
L. Rello — CORAL: Construcción de Objetos Representacional Aplicada al Lenguaje 26
tiempo, espacio, veracidad, modo, etc. Entrarían dentro del marco todo lo
que no fuera directamente exigido por el verbo, es decir, todo lo que complementase opcionalmente u obligatoriamente al objeto verbo.
A continuación ejemplificamos el verbo (15) tirar, dando especial relevancia al hecho de que el significado que pueda tiene el verbo influye en sus
relaciones sintácticas, hecho que corrobora la ventaja de que CORAL pueda
contar con un lexicón etiquetado semánticamente como el de PLANKTON.
verboRegimenPreposicional(tirar,1,‘Lanzar con la mano; dejar
caer’,a,algos,ferlo).
verboRegimenPreposicional(tirar,1,‘Lanzar con la mano; dejar
caer’,a,‘un lugar’,ferlo).
verboRegimenPreposicional(tirar,1,‘Lanzar con la mano; dejar
caer’,contra,algos,ferlo).
verboRegimenPreposicional(tirar,1,‘Lanzar con la mano; dejar
caer’,por,‘un lugar’,ferlo).
verboRegimenPreposicional(tirar,2,‘Derribar; volcar.’,a,‘un
lugar’,ferlo).
verboRegimenPreposicional(tirar,2,‘Derribar;
volcar.’,con,algo,ferlo).
verboRegimenPreposicional(tirar,2,‘Derribar;
volcar.’,sobre,algo,ferlo).
verboRegimenPreposicional(tirar,3,‘No pasar una
prueba’,en,algo,ferlo).
verboRegimenPreposicional(tirar,4,‘Disparar un
arma’,a,algo,ferlo).
verboRegimenPreposicional(tirar,5,‘Hacer fuerza para atraer o
acercar’,de,algo,ferlo).
verboRegimenPreposicional(tirar,6,‘Quedar estrecha o corta
una prenda de vestir’,de,algo,ferlo).
verboRegimenPreposicional(tirar,7,‘Ir en una dirección
determinada’,a,‘un lugar’,ferlo).
verboRegimenPreposicional(tirar,7,‘Ir en una dirección
determinada’,hacia,‘un lugar’,ferlo).
verboRegimenPreposicional(tirar,7,‘Ir en una dirección
determinada’,para,‘un lugar’,ferlo).
verboRegimenPreposicional(tirar,7,‘Ir en una dirección
determinada’,por,‘un lugar’,ferlo).
verboRegimenPreposicional(tirar,8,‘Tener una inclinación;
tender hacia unas ideas o modo de vida’,a,algo,ferlo).
verboRegimenPreposicional(tirar,8,‘Tener una inclinación;
tender hacia unas ideas o modo de vida’,hacia,algo,ferlo).
verboRegimenPreposicional(tirar,9,‘Tener cierto
parecido’,a,algos,ferlo).
L. Rello — CORAL: Construcción de Objetos Representacional Aplicada al Lenguaje 27
5.2.2 Modelo genérico de sentencia
En el modelo genérico de sentencia que presento a continuación encontramos, (a) el verbo y los argumentos que dependen de éste, que pueden ser
opcionales u obligatorios; y (b) el marco de la sentencia formado por diferentes objetos (espacial, temporal, modal, veracidad y x) que por lo general
están implícitos porque pueden ser entendidos sin dificultades tanto por el
emisor como por el receptor.
La formación de la sentencia parte de lo más necesario o adecuado a lo
menos, corroborando la jerarquía de partes de la sentencia de validez universal que propone Hengeveld: verbo > nombre > adjetivo > adverbio (modo). (K. HENGEVELD 1992: 47)
+ corta
+ simple
– ambigua
+ entretenida
Oración
Reconstrucción
Marco
Objeto
temporal
Objeto
espacial
Objeto
veracidad
Objeto
modal
Verbo
Objeto X
Arg. 1
op / ob
Arg. 2
op / ob
Arg. 3
op / ob
5.2.3 Funciones semánticas en argumentos y objetos
Para indicar cuáles son las funciones semánticas que ocupan cada posición hemos modificado y adecuado algunos presupuestos funcionalistas (S.
DIK 1997) al español, ya que los estudios que han implementado la teoría
funcional en PROLOG se han realizado sobre inglés, francés y holandés (S.
DIK 1992). En la medida en la que el español es una lengua flexiva, tanto
más flexible será en lo que se refiere a la posición que ocupan de los argumentos en la sentencia —que por ejemplo en inglés donde la posición es
mucho más estricta—, lo que llevaría a pensar que las estructuras del español pudieran ser menos y más simples que en otras lenguas, debido precisamente a esta flexibilidad.
CORAL gestiona de una manera diferente a otros modelos, tanto las
funciones semánticas como los argumentos de la sentencia. No obstante, al
modelo que más se puede asemejar en las definiones teóricas de los argumentos es el funcionalismo. De modo que para hacer la exposición más di-
L. Rello — CORAL: Construcción de Objetos Representacional Aplicada al Lenguaje 28
dáctica, se procede a la explicación de los argumentos de CORAL en comparación a los funcionalistas.
Las funciones semánticas que ocupan la primera posición argumental 1
(A¹) son el Agente (entidad que controla una acción, es decir, una actividad
o una realización), el Posicionador (entidad que controla una posición),
Procesado (la entidad que sufre un proceso) y Cero (la entidad que prioritariamente implica un estado). En la posición argumental 2 (A²) se sitúa el
Goal (entidad afectada o efectuada por la operación de algún controlador).
Mientras que el argumento 3 (A³) está destinado al Receptor (entidad a cuyo poder se transfiere algo). El resto de las funciones semánticas las situamos en el marco, aunque esto no implica que no puedan ser obligatorias,
como ya vimos con el ejemplo (15) del verbo tirar, CORAL sí acepta como
obligatorios argumentos que vienen dados por la propia semántica del verbo.
El objeto espacial se corresponde con las funciones semánticas de Lugar, Dirección y Origen. Mientras que el objeto temporal (v. CONCLUSIONES,
§ 5.2.4) y el de veracidad (v. CONCLUSIONES, § 5.2.4) de CORAL no encuentran correspondencias en el paradigma funcionalista.
El planteamiento de los argumentos de CORAL difiere del funcionalista
en la relación entre las funciones semánticas y su posición (S. DIK 1997:
120-121). Por ejemplo, Dik sitúa la Fuerza (entidad no cotroladora que instiga un proceso) — es decir el Caso Instrumental según Fillmore (C. J.
FILLMORE 1968: 1-88)— en la primera posición argumental, mientras que en
nuestro modelo ocupará esa posición atendiendo únicamente a criterios formales: en el caso en el que concuerde con el sujeto la Fuerza o el Caso Instrumental ocupara el A¹: (16) La llave abrió la puerta, de lo contrario será
un objeto modal (17) Juan abrió la puerta con la llave.
5.2.4 Funciones sintácticas en argumentos y objetos
La asignación de las funciones sintácticas se realiza en base de una clasificación de funciones semánticas (S. DIK 1997: 266) en términos de una
prioridad de carácter universal: agente (sujeto) > goal > receptor > beneficiario > instrumental > locativo > temporal. Si una sentencia permite la
asignación de la función beneficiario, la jerarquía predice que hay en esa
sentencia también se pueden predecir las funciones precedentes como agente, goal y receptor.
En nuestro modelo la jerarquía entre A¹ > A² > A³ es clara y sigue el
planteamiento de jerarquía anterior. Veamos ahora los argumentos de CORAL en comparación y correspondencia con los de la tradición gramatical.
L. Rello — CORAL: Construcción de Objetos Representacional Aplicada al Lenguaje 29
El A¹ (agente, posicionador, procesado o cero) se corresponde con el
tradicional sujeto y se reconoce por su concordancia con el verbo. El A²
(goal) coincide con el objeto directo y el complemento preposicional. Se reconoce o bien por que lleva delante una preposición, que rige el verbo (se
cuenta con una lista de verbos y sus preposiciones obligatorias), o bien porque en el caso en el que el A² sea una persona va precedido de la preposición a, o bien en última instancia porque el A² se posiciona detrás del verbo
en la mayoría de los casos. Los pronombres la, lo, las y los son los que aparecen en el caso de su pronominalización exceptuando los casos de leísmo,
que CORAL acepta como estructuras posibles. Siguiendo la jerarquía argumental si existe el A³ es porque en A¹ y el A² ya han sido reconocidos,
además suelen ir precedidos de la preposición a o para o pronominalmente
se representa a través de le y les.
En el caso extremo en el que ambos A¹ y A² concuerden con el verbo
determinar la posición argumental de cada uno será algo más complicado:
para poder delimitar cuál de las dos cadenas de caracteres se corresponde
con la función sintáctica adecuada, apelaremos a una jerarquía de posibilidades (S. DIK 1997: 279), que determinará cuál de las dos formas tiene más
posibilidades de ser A¹ que la otra.
La clasificación que presentamos ha sido simplificada y adecuada a
nuestro modelo considerando algunos parámetros funcionalistas, como entidades de primer y de segundo orden, y los términos de una misma predicación o de predicación subordinada, innecesarios para nuestro fin:
(a) definido > específico > no específico
(b) 1ª/ 2ª persona > 3ª persona
(c) singular > plural
(d) humano > animado > inanimado
(e) entidades concretas > entidades abstractas
El objeto temporal se concreta en todos los adverbios, sintagmas y desinencias verbales que hagan referencia al tiempo, considerando que las desinencias verbales no son absolutas en lo que refiriere a la situación del tiempo, y como consecuencia, se atenderá a los universales de marcación del
tiempo verbal por los que el tiempo presente podrá representar el pasado o
el futuro, pero un tiempo futuro o un tiempo pasado siempre se refieren al
futuro y al pasado respectivamente.
El objeto espacial recoge las formas que refieren al lugar en el que se
sitúa algo o bien la dirección o el origen, coincidiendo con las funciones semánticas funcionalistas de lugar, dirección y origen. En el objeto modal se
L. Rello — CORAL: Construcción de Objetos Representacional Aplicada al Lenguaje 30
engloban desde la función semántica de instrumento hasta los tradicionales
completemos circunstanciales de modo. El objeto veracidad se relaciona con
la lógica, con el valor de verdad que se le dé a una sentencia, dependiendo
de la fuente o de la actitud del hablante.
En el siguiente gráfico se ejemplifican las correspondencias entre las
funciones semánticas y las posiciones sintácticas:
A¹
A²
A³
O. espacial
Agente
Posicionador
Procesado
Cero
Goal
Receptor
Lugar
Dirección
Origen
O. temporal
O. modal
O. veracidad
Fuerza
5.3 Moldes lingüísticos o tipos de estructura de
sentencia
Para transmitir este universo de objetos el ser humano utiliza una serie
de estrategias que en el lenguaje se materializan en diferentes tipos de estructuras que relacionan objetos. Cada lengua posee N estructuras lingüísticas —esquemas o moldes—, no obstante, lo que se piensa es mucho más libre que las estructuras se utilizan para su transmisión.
Nuestro objetivo es modelizar los tipos de moldes lingüísticos o tipos
estructura de sentencia —que no coinciden con los tipos de oraciones gramaticales tradicionales— y tras determinar qué estructuras, habrá que comprobar qué verbos utilizan esas estructuras. Recordemos que para nosotros
un verbo se caracteriza por su cadena de caracteres y su significado. Así un
verbo con dos significados tendrá dos entradas dentro de PLANKTON como
moldes lingüísticos. Y dos verbos con diferentes streams podrán tener el
mismo molde si tienen el mismo significado.
Los moldes lingüísticos son concebidos como estructuras de transmitir:
primero se piensa lo que se quiere transmitir y después se decide la estructura a utilizar, según lo que se quiera transmitir, la intención del hablante,
el contexto, etc. Finalmente se rellena la estructura que el receptor recompone añadiendo los elementos que no han sido expresados.
Es necesario partir de una primera distinción entre las estructuras
normales y estructuras especiales.
L. Rello — CORAL: Construcción de Objetos Representacional Aplicada al Lenguaje 31
5.3.1 Estructuras normales
La estructura normal es la que ha sido definida en el punto anterior
sobre la naturaleza de la sentencia. Esta estructura genérica tomará diferentes manifestaciones (entre otras muchas causas) según el verbo que utilice
—argumentos obligatorios u optativos—, y según el tipo de expresión —expresión de condición, de concesión, de finalidad, de causa, de consecuencia,
de comparación, de tiempo, de lugar y de modo—.
En la estructura normal se incluyen tipos de oraciones que generalmente en las gramáticas se plantean como tipos diferentes: oraciones reflexivas
—en las que el agente y el goal se refieren al mimos objeto—, las oraciones
recíprocas —los agentes y los receptores son el mismo objeto—, la pasiva
refleja y algunos tipos de oraciones impersonales. Las oraciones coordinadas
y subordinadas se consideran sentencias complejas.
El reconocimiento de las estructuras que forman cada elemento del
marco y del verbo se realzará mediante criterios formales —desarrollados en
parte por los lenguajes de autómatas— auxiliados por listas.
5.3.2 Estructuras especiales
Para la determinación de las estructuras especiales hemos tenido en
cuenta: su simplicidad, su índice de aparición, el grado de complejidad para
su identificación y de inclusión en los objetos.
E.1: <objeto, ob> <vb. copulativo> <objeto, ob>
Entre las estructuras especiales distinguimos la E.1 que se corresponden
con las predicaciones nominales y oraciones copulativas.
La E.1 pone en relación dos objetos. En (18) Víctor es rubio, Víctor
forma parte del conjunto de individuos cuya característica es rubio sin embargo en (19) Víctor escribe palíndromos, se establece una relación entre
tres objetos: Víctor, que desarrolla un proceso, escribir, y el producto de
este proceso palíndromos.
Los verbos ser y estar no son más que elementos sintácticos de apoyo,
carentes de significado léxico, que se utilizan para la realización de las categorías morfosintácticas tiempo, persona, número, aspecto y modo. De tal
modo que el verbo no aporta ninguna información acerca del sintagma nominal inicial, el sujeto oracional.
Se reconocen porque utilizan los verbos ser, estar, parecer y resultar,
siempre que el contenido semántico de éstos sea nulo y funcionen únicamente como nexo. Por lo tanto esto excluye de las E.1: al verbo ser cuando este
L. Rello — CORAL: Construcción de Objetos Representacional Aplicada al Lenguaje 32
significa existir, al verbo parecer cuando va seguido de que, y al uso pronominal del verbo parecer: (20) Tu hermano se parece a tu padre. También se
excluyen los casos en los que los verbos ser o estar equivalen a hallarse, tener lugar, empezar, etc. (21) La casa está a dos leguas (se halla). (22) La
función será a las cuatro (empezará). En otras palabras: no se consideran
todos los casos en los que los verbos ser y estar ocupan el puesto que legítimamente le correspondería a un verbo predicativo.
Existen casos especiales como las expresiones de la hora: (23) Son las
doce y media, o (24) Es la una, se presupone el ordenador reconstruye el
sujeto con la/s hora/s.
E.2: <hay> <objeto, ob>
La E.2 presenta un objeto. Esta estructura no muestra ninguna relación
entre objetos. Esto se debe a que el verbo haber cuando funciona en las oraciones impersonales ejerce su propio significado sin ser auxiliar de otros verbos. Su reconocimiento es sencillo, utiliza el verbo haber en tercera persona
y en singular.
Sin embargo es frecuente el error por parte de los hablantes de concordar el verbo haber con el objeto que le sigue (25) *Habían muchas personas,
por lo que también habrá que contemplar la posibilidad del reconocimiento
de este tipo de oraciones. Además dificulta su reconocimiento el hecho de
que en ocasiones se utiliza había de manera análoga (26) Ayer había dos mil
jóvenes en el campus; y la similaridad el uso del verbo hacer, que hoy sustituye a haber en las referencias temporales (27) Hace mucho tiempo que no
vemos a Laura con Javi o (28) Hace frío.
E.3: <objeto, ob> <tener> <objeto, ob>
El verbo tener, al indicar posesión, también crea un tipo de sentencia
especial porque está relacionando dos elementos funcionando el verbo como
un tipo de nexo, de escaso contenido semántico, lo poseído en una característica, una propiedad o parte del poseedor. Es por esta razón por la que
este tipo de sentencias son consideradas especiales: porque relacionan los
objetos de manera diferente, un prueba de ello es que este verbo puede ser
sustituido por el pronombre posesivo: (29) Yo tengo una casa, mi casa.
E.4: <hace> <objeto, ob>
L. Rello — CORAL: Construcción de Objetos Representacional Aplicada al Lenguaje 33
El verbo hacer puede gramaticalizarse cuando se utiliza en tercera persona del singular para presentar un hecho —la mayoría de las veces— meteorológico. (30) Hace mucho calor.
Se reconoce porque hacer se presenta en tercera persona del singular y
suele ir seguido de palabras como muy o mucho y calor, frío, fresco, sol,
buen tiempo, malo, mal tiempo, etc.
E.5: <objeto> <más> <objeto> <que> <objeto>
La expresión de la comparación requiere de una forma especial por su
estructura. La E.5 opone dos objetos en relación a un tercero —generalmente una cualidad— estableciendo relaciones de superioridad, igualdad o inferioridad. El reconocimiento de las E.5 se debe al uso de más /menos / tan/
igual/ + adjetivo + que; más/ menos + adjetivo + de; tan / tanto + adjetivo + como; así como el uso de los adverbios más, menos, mejor, pero +
que; tanto + nombre + como; cuanto… tanto y tal… cual.
E.6: <decir> <que> <objeto>
Incluimos en un grupo especial las oraciones sustantivas de objeto directo o completivas debido a la relación especial que existe entre el objeto
(A¹) y la oración sustantiva porque el argumento A¹ funciona como objeto
veracidad.
Según algunos autores la oración completiva es la oración que se encuentra menos integrada dentro de la oración principal diferenciándose así
del resto de las oraciones subordinadas. Este tipo de oraciones se suelen relacionar con el discurso indirecto y normalmente su verbo principal es un
verbo que expresa un proceso cognitivo, del subtipo llamado de actitud proposicional (I. B OSQUE y V. D EMONTE 1999b: 1998), o verbo dicendi ( V .
ANEXO II) que se refiere al acto de habla como: argumentar, concretar, criticar, denunciar, enfatizar, enunciar, esbozar, estipular, fallar y sentenciar.
Otros verbos sin embargo, no siempre refieren al acto de habla como
opinar, rechazar, decretar o bendecir. Como guía, seguimos la lista de verbos que se construyen con una subordinada sustantiva de objeto directo y
que poseen objeto indirecto (I. BOSQUE y V. DEMONTE 1999b: 2073-2074).
Una de las pruebas para saber si se trata de una E.6 es que su significado
no varía al cambiar la oración a estilo directo.
L. Rello — CORAL: Construcción de Objetos Representacional Aplicada al Lenguaje 34
E.7: <es> <objeto> <que> <subjuntivo>
Considero a estas estructuras un tipo especial de E.1, en las que se relacionan dos objetos pero uno de ellos, el A¹, está formado por una oración
subordinada en subjuntivo (V. ANEXO III). Las formas más comunes son:
(no) es + conveniente, importante, necesario, imprescindible, interesante,
posible, probable… + que + oración en subjuntivo.
E.8: <si> <objeto,oración>, <objeto,oración>
Este tipo de estructuras relacionan dos objetos siendo uno condición de
otro, si <objeto> entonces <objeto>. Su estructura no casa con la estructura normal de la oración genérica.
Si la E.8 expresa una condición real, el verbo de la oración con la conjunción si se conjuga en presente o el pretérito imperfecto del indicativo.
(31) Si tengo hambre, me como un bocadillo, (32) Si ha llegado, entonces
estará en clase. En el caso en el que la E.8 exprese una condición irreal, el
verbo de la oración precedida de si estará conjugado en pretérito imperfecto
o pretérito pluscuamperfecto del subjuntivo: (33) Si fuera rico tocaría con
un violín en el tejado y (34) Si hubiera tenido suerte ya se hubiera ido a
Jamaica.
5.3.3 Formas no personales
La estructura normal siempre contaba con un verbo en forma personal
excluyendo las formas de infinitivo, participio y gerundio.
El infinitivo se reconoce porque acaba en una de las terminaciones siguientes: –ar, –er, –ir. Puede funcionar como un sustantivo si va precedido
de artículos: (35) El sentir del pueblo, si va acompañado de pronominales
(complementos directos o indirectos) éstos se sitúan detrás; (36) Habérmelo
dicho puede funcionar como imperativo si lleva la preposición a delante;
(37) ¡A dormir! expresa un aspecto acabado si se combina el infinitivo del
verbo haber con la forma participio; (38) De haber sabido esto, me hubiera
comprado toneladas de chocolatinas. También el infinitivo puede ir precedido de por adquiriendo sentido casual: (39) Por comer tanto chocolate, te
pusiste como una foca. Y de la preposición al tomando sentido temporal y
pasando por tanto a formar parte del objeto temporal (40) Al abrir la chocolatina rompió la tormenta.
Asimismo, el infinitivo puede formar parte de las estructuras espaciales vistas antes, por ejemplo de la E.8 cuando el infinitivo va acompañado
de con o de, ya que en estos caso equivale a una condición: (41) Con pre-
L. Rello — CORAL: Construcción de Objetos Representacional Aplicada al Lenguaje 35
guntar, no se pierde nada y (42) De seguir así, acabaremos el chocolate de
la nevera.
Cuando el gerundio sigue a un verbo expresa simultaneidad (43) Me
pilló comiendo chocolate. También puede funcionar como adverbio, si bien
en estos casos el reconocimiento del gerundio como adverbio es complicado
no hay que dejar de considerar que el gerundio al igual que los adverbios
puede llevar diminutivos (44) Se fue a comprar chocolate andandito. Al
igual que el infinitivo, el gerundio compuesto indica una acción acabada
(45) Habiendo reordenado las chocolatinas de la estantería, me quedé más
tranquila. El gerundio puede formar parte de oraciones complejas desempeñando diferentes valores (temporal, condicional, causal y concesivo) que trataremos en estudios posteriores.
El participio presenta una complicación más que las formas no personales anteriores y es que en ocasiones puede funcionar como adjetivo y en ocasiones como verbo. Cuando funciona como verbo suele ir justo detrás del
verbo haber y cuando funciona como adjetivo concuerda con el sustantivo en
género y número. Si el participio sigue a los verbos ser o estar forman la voz
pasiva, en el caso de estar, forman una pasiva de estado (46) El Chocolate
está recién calentado. (47) El chocolate fue acompañado por churros. El participio puede participar en proposiciones subordinadas con valor temporal y
causal, no obstante, dejaremos este tipo de formas para posteriores investigaciones (V. ANEXO IV).
r
5.4 Valoración final
De todo lo expuesto es fácil deducir la importancia del modelo aquí
propuesto.
Como ya se ha indicado, el lenguaje es el principal patrimonio del ser
humano, siendo su herramienta fundamental, ya sea en su estudio sincrónico
o diacrónico, en su faceta externa —como medio de comunicación—, o en su
faceta interna —soporte para el pensamiento racional o al menos del consciente—.
Conocer su estructura, modelizarlo y saber el porqué se emplea una u
otra estructura, nos permitirá mejorar la comunicación con otros seres humanos, actuales o futuros, o incluso con nosotros mismos, descubriendo más
fácilmente los fallos en los razonamientos o los problemas de interpretación.
L. Rello — CORAL: Construcción de Objetos Representacional Aplicada al Lenguaje 36
Además este conocimiento nos permitirá proponer modificaciones en el propio lenguaje para adecuarlo más a su función.
Ya hemos visto también que para acometer este monumental desafío es
fundamental el apoyo de múltiples disciplinas, ya sean del área de humanidades, como la propia lingüística —verdadero motor del estudio—, la filosofía o la semiótica; del área más técnica, como la lógica, la matemática y,
sobre todo, la informática; así como del área de las ciencias de la salud, como la psicología o la logopedia.
En una u otra medida todas las disciplinas aportan algo, aunque para
nuestra investigación las áreas más importantes sean la propia lingüística, la
lógica-filosófica y la informática. Ciertamente esta multidisciplinariedad es
un reto en nuestro mundo científico bastante empeñado en la especialización
a ultranza.
En este área necesitamos a veces de la rigidez de la lógica o de los sistemas informáticos y otras de la flexibilidad de las más difusas reflexiones
filosóficas.
Sin embargo el afán de conocimiento del ser humano, especialmente en
lo que se refiere a sí mismo y a sus motivaciones, hacen que sea un placer
profundizar en otras áreas diferentes de las que originalmente atrajeron
nuestro interés.
Tampoco caben dudas de la importancia social de este estudio. Como
ya hemos indicado el lenguaje es el patrimonio más importante de la humanidad, así que todo lo que sea estudiarlo y modelizarlo debería aportar un
beneficio a todos y cada uno de los seres humanos. Afortunadamente, el
lenguaje todavía no está patentado y no pertenece a ninguna corporación o
ser humano concreto así que las mejoras nos beneficiaran a todos.
Sin duda queda mucho camino por recorrer, pero pensamos que aquí se
establecen las bases para una nueva generación en los paradigmas lingüísticos. Seguramente ninguno de los ladrillos de la construcción son puramente
originales, pero su combinación resulta absolutamente nueva. Hay que profundizar con estas bases, con estos axiomas, y ver a qué conclusiones, a qué
teoremas llegamos. Estos teoremas y su adecuación a la realidad —que podremos comprobar con el formidable corpus electrónico que es Internet—
nos permitirán conocer en qué medida este modelo es válido y en qué aspectos se debería profundizar.
Para ello, excepto el tiempo y los conocimientos de los investigadores,
el resto de recursos son fácilmente accesibles para cualquiera. Un ordenador,
una conexión a Internet y una buena biblioteca es todo lo que se requiere
para desarrollar el paradigma. Esto y la libertad intelectual de los investi-
L. Rello — CORAL: Construcción de Objetos Representacional Aplicada al Lenguaje 37
gadores deben seleccionar de entre los conocimientos y modelos existentes
qué sirve para su modelo y qué no sirve, sin atender a nombres o etiquetas
más o menos aceptados por la comunidad científica.
Quizá la verdad no esté en una corriente concreta sino en la correcta
combinación de las aportaciones de cada una de ellas a pesar de que a veces
resulta difícil moverse fuera de una corriente concreta.
Esperamos que la formidable dificultad del desafío, aumentado por la
paradójica situación de que el propio objeto de estudio sea la herramienta
con la que se estudia, sea superada con las propuestas de ese modelo, que
como trabajo original seguro que requiere de múltiples ajustes pero que sin
duda propone numerosas ideas en este área, que en un futuro se consolidarán en este campo.
Tan importante como la investigación científica es su difusión: coral está
disposición de todo el mundo en: http://www.luzrello.com/coral.html,
donde se incluyen más recursos para su divulgación. Todas las aportaciones
son bienvenidas.
L. Rello — CORAL: Construcción de Objetos Representacional Aplicada al Lenguaje 38
6. Bibliografía
6.1 Documentos impresos
BACH, EMMON; HARMS, ROBERT T, Universals in linguistic theory, New
York; London, Holt, Rinehart & Winston, 1968.
BAKEL, JAN VAN, Automatic semantic interpretation: a computer model
of understanding natural language, Dordrecht, Holland; Cinnaminson,
U.S.A, Foris Publications, 1984.
BATES, MADELEINE; WEISCHEDEL, RALPH M. (eds.), Natural language
generation: Third International Conference, INLG 2004: Brockenhurst, UK,
July 14-16, 2004: proceedings, Berlin, Springer, 2004.
BELZ, ANJA; EVANS, ROGER; PIWEK, PAUL. (eds.), Challenges in natural language processing, Cambridge, Cambridge University Press, 1993.
BOSQUE, IGNACIO; DEMONTE, VIOLETA (dir.), Gramática descriptiva de
la lengua española. Vol. 1, Sintaxis básica de las clases de palabras, Madrid,
Espasa Calpe, 1999a.
BOSQUE, IGNACIO; DEMONTE, VIOLETA (dir.), Gramática descriptiva de
la lengua española. Vol.2, Las construcciones sintácticas fundamentales; Relaciones temporales, aspectuales y modales, Madrid, Espasa Calpe, 1999b.
BOSQUE, IGNACIO; DEMONTE, VIOLETA (dir.), Gramática descriptiva de
la lengua española. Vol. 3, Entre la oración y el discurso; Morfología, Madrid, Espasa Calpe, 1999c.
CHOMSKY, NOAM, Lectures on government and binding, Dordrecht, Foris, 1981.
CHOMSKY, NOAM, El conocimiento del lenguaje, Madrid, Alianza, 1985.
DIK, SIMON C., Gramática funcional, Madrid, Sociedad General Española de Librería, 1981.
DIK, SIMON C., Functional grammar in Prolog: an integrated implementation for english, french, and dutch, Berlin; New York, Mouton de Gruyter,
1992.
L. Rello — CORAL: Construcción de Objetos Representacional Aplicada al Lenguaje 39
DIK, SIMON C., The theory of functional grammar. Part 1, The structure of the clause, Berlin; New York, Mouton de Gruyter, 1997.
FERNÁNDEZ LÓPEZ, Mª DEL CARMEN, Las preposiciones: valores y usos:
construcciones preposicionales, Salamanca, Colegio de España, 1999.
FILLMORE, CHARLES J., «The case of the case» en BACH, E. Universals
in linguistic theory, New York; London, Holt, Rinehart & Winston, 1968.
FORTESCUE, MICHAEL; HARDER, PETER; KRISTOFFERSEN, LARS (eds.),
Layered structure and reference in a functional perspective: papers from the
Functional Grammar Conference in Copenhagen 1990, Amsterdam, John
Benjamins, 1992.
F REGE , G OTTLOB , Estudios sobre semántica, New York; Barcelona,
Orbis, 1985.
GARCÍA VELASCO, DANIEL, Funcionalismo y lingüística: la gramática
funcional de S.C. Dik, Oviedo, Universidad de Oviedo, 2003.
GAZDAR, GERALD; FRANZ, ALEX, Natural language processing in the
1980s: a bibliography, Stanford, Center for the Study of Language and Information, 1987.
G AZDAR , G ERALD ; M ELLISH , C HRIS , Natural language processing in
LISP: an introduction to computational linguistics, Wokingham, AddisonWesley, 1989.
GRISHMAN, RALPH, Computational Linguistics: an introduction, Cambridge, Cambridge University Press, 1986.
H AUSSER , R OLAND , A computational model of natural language
communication: interpretation, inference, and production in database semantics, Berlin; New York, Springer, 2006.
HENGEVELD, KEES, «Parts of Spreech», en FORTESCUE, M., Layered
structure and reference in a functional perspective, Amsterdam, John Benjamins, 1992.
KEMPEN, GERARD, Natural language generation new results in artificial
intelligence, psychology and linguistics, Dordrecht; Lancaster, Nijhoff, 1987.
LEVINSON, STEPHEN C., Pragmática, Barcelona, Teide, 1989.
LYONS, JOHN, Introducción al lenguaje y a la lingüística, Barcelona,
Teide, 1984.
MARTINET, ANDRÉ, Elementos de lingüística general, Madrid, Gredos,
1991.
MEL’ČUK, IGOR; CLAS, ANDRÉ; POLGUÈRE, ALAIN, Introduction à la
lexicologie explicative et combinatoire, Louvain-la-Neuve, Duculot, 1995.
MEZIANE, FARID; MÉTAIS, ELISABETH (eds.), Natural language processing and information systems: 9th International Conference on Applications
L. Rello — CORAL: Construcción de Objetos Representacional Aplicada al Lenguaje 40
of Natural Language to Information Systems, NLDB 2004: Salford, UK,
June 23-25, 2004: proceedings, Berlin, Springer, 2004.
N EWMEYER , F REDERICK J., Language form and language function,
Cambridge (Massachusetts) London, MIT Press, 2000.
PARTEE, BARBARA P., Montague grammar, San Diego, Academic Press,
1976.
PARTEE, BARBARA P., Mathematical methods in linguistics, Dordrecht,
Kluwer Academic Pub, 1990.
SALAKOSKI, TAPIO (ed.), Advances in natural language processing: 5th
International Conference on NLP, FinTAL 2006: Turku, Finland, August
23-25, 2006, Berlin, Springer, 2006.
VICEDO, JOSÉ LUIS (ed.), Advances in natural language processing: 4th
International Conference, EsTAL 2004: Alicante, Spain, October 20-22,
2004, Berlin, Springer, 2004.
WANNER, LEO, Lexical functions in lexicography and natural language
processing, Amsterdam; Philadelphia, J. Benjamins, 1996.
WITTGENSTEIN, LUDWIG, Tractatus logico-philosophicus Tagebücher
1914-1916 Philosophische Untersuchungen, Frankfurt am Main, Suhrkamp,
1969.
WITTGENSTEIN, LUDWIG, Investigaciones filosóficas, México, Universidad Autónoma de México, 2003.
6.2 Textos electrónicos
DÍAZ VILLA, ANA MARÍA, “Tipología de errores gramaticales para un
corrector automático” en Procesamiento del Lenguaje Natural, núm. 35,
2005, pp. 409-416. Disponible en Web:
<http://www.sepln.org/revistaSEPLN/revista/35/50.pdf>
MEL’ČUK, IGOR, “Levels of Dependency in Linguistic Description: Concepts and Problems” en AGEL, V., EICHINNGER, L., EROMS, H. W., HELLWIG,
P., HERRINGER, H. J., LOBIN, H. (eds.), Dependency and Valency. An International Handbook of Contemporary Research, vol. 1, Berlin; New York, W.
de Gruyter, 2003, pp. 188-229. Disponible en Web:
<http://www.olst.umontreal.ca/FrEng/Dependency.pdf>
RELLO, LUZ, Relaciones semánticas y funciones léxicas en términos que
designan color y sus adjetivos derivados. Madrid, 2007. Disponible en Web:
<http://www.luzrello.com/Escritos_files/rello-funciones_lexi
cas_colores.pdf>
L. Rello — CORAL: Construcción de Objetos Representacional Aplicada al Lenguaje 41
Anexo I
Funciones léxicas de Mel’čuk y relaciones léxico-semánticas.
Adaptación y recopilación realizada por el profesor Horcajada Diezma.
Función
Descripción
Ejemplo
A0
adjective
A0(law)=legal
Ai
typical modifier for ith actant
A1(surprise)=surprised
Able i
adjective for capability of ith
actant
Able1(read)=literate
Adv0
adverb
Adv0(honest)=honestly
Advi
adverbial for ith actant
Adv1(dismay)=in dismay
Anti
antonym
Anti(like)=dislike
Bon
“good” (expression of praise)
Bon(advice)=sound
Cap
leader/chief
Cap(school)=head
Caus
cause
Caus(rise)=raise
CausPredMinus
cause to decrease
CausPredMinus(price)=drop
CausPredPlus
cause to increase
CausPredPlus(price)=increase
L. Rello — CORAL: Construcción de Objetos Representacional Aplicada al Lenguaje 42
Función
Descripción
Ejemplo
Centr
centre/middle
Centr(problem)=crux
Cont
continue
ContOper 1(influence)=maintain
Contr
contrastive term
Contr(heaven)=earth
converse term
Conv 21(more)=less
Culm
culmination
Culm(anger)=paroxysm
Degrad
degrade, get worse
Degrad(milk)=go/turn
sour
Equip
team, crew
Equip(hospital)=staff
Excess
function excessively
Excess(heart)=palpitate
Fact
be realized
Fact 0(dream)=come
true
Figur
standard metaphor
Figur(smoke)=cloud
Fin
cease, stop
FinOper 1(influence)=lose
nearly empty verb
(keyword=subject)
Func 0(silence)=reign
Gener
superordinate
Gener(anger)=feeling
Germ
germ, core
Germ(evil)=root
Imper
order, command
Imper(silence)=shut
up!
Incep
begin
IncepFunc 0
(war)=break out
Conv
ij
0,1,2
Func
0,1,2
L. Rello — CORAL: Construcción de Objetos Representacional Aplicada al Lenguaje 43
Función
Descripción
Ejemplo
IncepPredMinus
start to decrease
IncepPredMinus(price)=fall
IncepPredPlus
start to increase
IncepPredPlus(price)=skyrocket
Instr
typical preposition (=with
the help of)
Instr(car)=by
Involv
keyword = subject
Involv(smell)=fill [the
room]
Labor ij
nearly empty verb :
- ith actant = subject
- jth actant = direct object
Labor 12(consideration)=take into
Liqu
liquidate, delete
Liqu(disease)=eradicate
Loc
locative prepositions
Loc in(list)=on
Magn
intensifier
Magn(bachelor)=confirmed
Manif
be manifest
Caus1Manif(opinion)=express
Minus
less
IncepPredMinus(price)=fall
Mult
regular group/set
Mult(dog)=pack
Nocer
damage, attack
Nocer(mosquito)=bite
Obstr
function with difficulty
Obstr(voice)=falter
Oper1,2
nearly empty (support)
verb (keyword=subject)
Oper1(attention)=pay
ab/ad/in
L. Rello — CORAL: Construcción de Objetos Representacional Aplicada al Lenguaje 44
Función
Descripción
Ejemplo
Pejor
worse
CausPredPejor(prospect)=darken
Perf
perfective (completed action)
S1Perf(marry)=spouse
Perm
permit
Perm1Fact0(passion)=succumb to
Plus
more
IncepPredPlus (price)=skyrocket
Posi
positive evaluation of ith
actant
Pos2(opinion)=favorable
Pred
predicate (= to be)
Pred(actor)=act
Prepar
prepare
PreparFact0(rifle)=load
Propt
typical preposition (= because of)
Propt(fear)=for
Prox
on the verge of
ProxFunc0(storm)=approach
Quali
Able i + highly probable
Qual1(device)=deceitful
Real1,2,...
satisfy the requirements of
Real1(promise)=keep
Result
result of an event
Result(learn)=know
S0
noun
S0(die)=death
Si
typical noun for ith actant
S1(murder)=murderer
S instr
typical instrument
S instr(paint)=brush
S loc
typical place
S loc(lion)=den
L. Rello — CORAL: Construcción de Objetos Representacional Aplicada al Lenguaje 45
Función
Descripción
Ejemplo
S med
typical means
S med(write)=ink
S mod
typical mode
S mod(write)=handwriting
S res
typical result
S res(copy v)=copy n
Sing
regular “portion”
Sing(rice)=grain
Son
typical sound
Son(elephant)=trumpet
Sympt
physical symptoms
Degrad(speech) +
Sympt23(surprise)=be
speechless
Syn
synonym
Syn(help)=aid
V0
verb
V0(advice)=advise
Ver
as it should be
Ver(excuse)=legitimate
Otras relaciones léxico-semánticas
Función
Descripción
Ejemplo
Unit
unit of
Unit(gravity)=g
Part
part of
Part(table)=leg
Child
child/young of
Child(horse)=foal
Parent
parent of
Parent(lamb) =sheep
Male
male of
Male(pig)=boar
L. Rello — CORAL: Construcción de Objetos Representacional Aplicada al Lenguaje 46
Función
Descripción
Ejemplo
Female
female of
Female(elephant)=cow
Process
typical noun of process
S0Process(apply)=
application
Telic
relation between instrument and
verb
Telic(rubber)=erase
(see S instr)
Spec
specific term (hyponym)
Spec(flower)=rose, tulipe, ...(see Gener)
L. Rello — CORAL: Construcción de Objetos Representacional Aplicada al Lenguaje 47
Anexo II
Verbos dicendi
aceptar, achacar, aclarar, aconsejar, adelantar, adjudicar, adjurar, admitir, aducir, advertir, afirmar, agradecer, agregar, ahorrar, alegar, amonestar, anticipar, anunciar, añadir , arrancar, arrebatar, arrojar, arrullar, asegurar, atribuir, augurar , aullar, avanzar, avisar, balar, balbucear, balbucir,
barbullar, berrear, bisbisear, bramar, cacarear, callar, censurar, certificar,
chapurrear, chillar, chismorrear, clarificar, cloquear, comentar, comunicar,
conceder, confesar, confiar, confirmar, consentir, contar, contestar, croar,
cuchichear, deber, decir, declara, demandar, demostrar, denegar, desaconsejar, describir, desear, desmentir, detallar, dictar, discutir, disimular, enaltecer, encarecer, encargar, encomendar, encomiar, enseñar, esclarecer, esconder, escribir, escupir, especificar, espetar, evitar, exigir, explicar, explicitar,
exponer, expresar, extirpar, facilitar, garantizar, gemir, gimotear, gorjear,
gritar, gruñir, halagar, impedir, implorar, imponer, imposibilitar, imputar,
inculcar, indicar, insinuar, inventar, invocar, jurar, ladrar, lanzar, largar,
machacar, mandar, manifestar, mascullar, maullar, mencionar, mendigar,
merecer, mostrar, mugir, murmurar, musitar, narrar, negar, notificar, objetar, ocultar, ofrecer, ordenar, otorgar, participar, pedir, perdonar, permitir,
piafar, piar, plantear, posibilitar, precisar, predecir, presagiar, prescribir,
pretender, pretextar, probar, profetizar, prohibir, prometer (hacer una acción futura), prometer (decir con insistencia), pronosticar, proponer, proporcionar, puntualizar, reafirmar, rebatir, rebuznar, recalcar, recelar, recetar, reclamar, recomendar, reconocer, recordar, recriminar, refunfuñar, refutar, regañar, reiterar, relatar, rechinchar, renegar, repetir, replicar, reprehender, reprochar, responder, revelar, rezongar, rogar, rugir, sacar, señalar, significar, silbar, silbotear, solicitar, soltar , sonsacar, sostener, sugerir,
suplicar, sustentar, susurrar, tararear, telefonear, telegrafiar, transcribir,
transmitir, valer, vaticinar, ventilar, vituperar, vociferar, vomitar
L. Rello — CORAL: Construcción de Objetos Representacional Aplicada al Lenguaje 48
Anexo III
Expresiones que rigen subjuntivo
quizás
tal vez
(no) es
(no) es
(no) es
(no) es
(no) es
(no) es
(no) es
conveniente que
importante que
imprescindible que
interesante que
necesario que
posible que
probable que
Verbos que rigen subjuntivo
agradecer
alegrarse de
no creer
desear que
dudar
esperar
extrañarse
gustar que
lamentar
perdonar
preferir que
querer que
sentir
tener miedo de
temer
L. Rello — CORAL: Construcción de Objetos Representacional Aplicada al Lenguaje 49
Conjunciones más subjuntivo
antes (de) que
aunque
cuando
después (de) que
mientras que
para que
tan pronto como
sin que
L. Rello — CORAL: Construcción de Objetos Representacional Aplicada al Lenguaje 50
Anexo IV
Formas perifrásticas más frecuentes
Significación progresiva
a + infinitivo
venir a + infinitivo
volver a + infinitivo
haber de + infinitivo
haber que + infinitivo
tener que + infinitivo
deber de + infinitivo
llegar a + infinitivo
acabar de + infinitivo
Significación durativa
estar + gerundio
ir + gerundio
venir + gerundio
seguir + gerundio
andar + gerundio
Significación perfectiva
venir a + infinitivo
acabar de + infinitivo
llegar a + infinitivo
alcanzar a + infinitivo
llevar + participio
tener + participio
estar + participio
ser + participio
quedar + participio