Rello, Luz-CORAL
Transcription
Rello, Luz-CORAL
C.O.R.A.L. Construcción de Objetos Representacional Aplicada al Lenguaje Luz Rello Ninguna invención es perfecta al nacer. Cicerón L. Rello — CORAL: Construcción de Objetos Representacional Aplicada al Lenguaje 3 Índice 1. MOTIVACIÓN 5 2. OBJETIVOS 11 3. DATOS 13 4. METODOLOGÍA 18 5. CONCLUSIONES 21 5.1 El lenguaje como apuntador de objetos 21 5.1.1 Concepción del lenguaje 21 5.1.2 Objeto 22 5.1.3 Referencia a objeto 23 5.2 La naturaleza de la sentencia 25 5.2.1 Sentencia 25 5.2.2 Modelo genérico de sentencia 27 5.2.3 Funciones semánticas en argumentos y objetos 27 5.2.4 Funciones sintácticas en argumentos y objetos 28 5.3 Moldes lingüísticos o tipos de estructura de sentencia 30 5.3.1 Estructuras normales 31 5.3.2 Estructuras especiales 31 E.1: <objeto, ob> <vb. copulativo> <objeto, ob> 31 E.2: <hay> <objeto, ob> 32 L. Rello — CORAL: Construcción de Objetos Representacional Aplicada al Lenguaje 4 E.3: <objeto, ob> <tener> <objeto, ob> 32 E.4: <hace> <objeto, ob> 32 E.5: <objeto> <más> <objeto> <que> <objeto> 33 E.6: <decir> <que> <objeto> 33 E.7: <es> <objeto> <que> <subjuntivo> 34 E.8: <si> <objeto,oración>, <objeto,oración> 34 5.3.3 Formas no personales 34 5.4 Valoración final 6. BIBLIOGRAFÍA 35 38 6.1 Documentos impresos 38 6.2 Textos electrónicos 40 ANEXO I 41 Funciones léxicas de Mel’čuk y relaciones léxico-semánticas. 41 Otras relaciones léxico-semánticas 45 ANEXO II 47 Verbos dicendi ANEXO III 47 48 Expresiones que rigen subjuntivo 48 Verbos que rigen subjuntivo 48 Conjunciones más subjuntivo 49 ANEXO IV 50 Formas perifrásticas más frecuentes 50 Significación progresiva 50 Significación durativa 50 Significación perfectiva 50 L. Rello — CORAL: Construcción de Objetos Representacional Aplicada al Lenguaje 5 1. Motivación La modelización del lenguaje natural es una de la áreas de investigación más prometedoras de la actualidad. De hecho, lo ha venido siendo desde el principio del estudio científico documentado que podríamos fijar en la antigua Grecia hasta nuestros días. Gran parte de esa fascinación se debe a la doble naturaleza del lenguaje, como construcción artificial del ser humano para algunos, o como producto natural de la evolución del mismo, sin olvidar su cercanía con el pensamiento y las profundas reflexiones que esto conlleva. Este interés se ha visto acrecentado en los últimos cien años, en los que los grandes filósofos del siglo XIX y principios del XX se han llegado a obsesionar con su estudio, como en el caso de Wittgenstein y sus dos principales obras Tractatus e Investigaciones filosóficas, o Frege cuyo interés llevó a la formalización de la lógica. Además de estos intentos por parte de los filósofos que tratan de hacerse matemáticos para modelizar el lenguaje, encontramos los lógico-matemáticos como Montague, que tratan de hacerse filósofos para modelizarlo, desarrollando modelos lógicos para este propósito, sin olvidar a Chomsky y su formalización. La ventaja es que hoy disponemos de una herramienta para este propósito que ninguno de los grandes investigadores ha tenido: sus propias investigaciones que nos guían en las nuestras y los ordenadores y su formidable capacidad de cálculo, y más recientemente, lo que considero la mayor herramienta: un corpus de millones de textos para analizar, estudiar y procesar: Internet, que con la ayuda de los ordenadores, permite crear modelos y comprobarlos en innumerables textos en un plazo mínimo. Todo esto hace que estemos viviendo un momento especialmente importante para este campo, lo que me lleva a estudiarlo y a desarrollar un propio modelo, CORAL: Construcción de Objetos Representacional Aplicada al Lenguaje. L. Rello — CORAL: Construcción de Objetos Representacional Aplicada al Lenguaje 6 se enmarca —y al mismo tiempo se explica— por las siguientes circunstancias: la inadecuación de los lenguajes formales cuando se enfrentan a las complejidades propias de los lenguajes naturales, la falta de multidisciplinariedad tan requerida en esta materia, y la necesidad social a la que nos enfrentamos de gestionar cantidades inabordables de información que requiere una mejora en la interfaz hombre-máquina. En primer lugar trataremos la situación de los modelizadores actuales del lenguaje que intentan superar el nivel palabra. Hasta el momento se ha gestionado con éxito las palabras entendidas como cadena de caracteres, basta con pensar en Google; sin embargo, existen otros intentos de superar este nivel en el lenguaje: los lenguajes formales, que se han creado precisamente a partir de los intentos de formalización de las sintaxis gramatical.1 Su utilización en el Procesamiento del Lenguaje Natural (PLN) ha ofrecido algunas ventajas iniciales, pero están resultado ineficaces al tratar con lenguajes naturales. Esta inadecuación se debe a varios aspectos, fundamentalmente al hecho de que su valor fundamental es la determinación de estruturas sintácticas correctas. En los lenguajes matemáticos y computacionales, las estructuras correctas están claramente diferenciadas de las incorrectas, pero en los lenguajes naturales se emplean —especialmente en el lenguaje literario— estructuras que no son estrictamente correctas ni incorrectas: las figuras retóricas, ya identificadas por Nebrija. CORAL 1 Entendemos lenguaje formal en sentido estricto como un conjunto de palabras infinitas, formadas a partir de un conjunto de caracteres finito (alfabeto), que se rige por reglas (gramática) y consta de interpretación semántica. Si establecemos una jerarquía de los diferentes tipos de lenguajes según su grado de abstracción, estos tipos de lenguajes formales se encuentran un paso más allá de los lenguajes lógicos, las matemáticas o los lenguajes de programación sin punteros, y un paso más atrás de los lenguajes naturales que son capaces de hacerse referencia a sí mismos. Los lenguajes de programación con punteros quedan a medio camino entre estos dos extremos, al igual que los lenguajes formales que tratamos, porque mediante los punteros los lenguajes de programación pueden hacerse referencia a sí mismos, aunque esta referencia no es total, porque se realiza mediante dos áreas de la memoria —procedimientos y datos—, que en el ordenador se estructuran en diferentes lugares. L. Rello — CORAL: Construcción de Objetos Representacional Aplicada al Lenguaje 7 Si queremos adecuar las estructuras formales para identificar como correctas las figuras, entonces aparecen dentro de las estructuras correctas un gran número de estructuras de dudosa corrección y de escaso uso. Además de otras limitaciones, el resultado final de la aplicación de los lenguajes formales sería la identificación de estructuras correctas. Esto parece un esfuerzo excesivo para los escasos resultados obtenidos, por eso pienso que los sistemas de procesamiento de los lenguajes naturales deberían centrarse en las estructuras entendibles más que en las estructuras correctas. Nos centraremos a continuación en los fines y en los medios con los que cuentan algunos de los lenguajes formales que más interesan al caso, para poder apreciar posteriormente la singularidad de CORAL. Los lenguajes formales orientados al PLN se han utilizado para diferentes fines: desde confeccionar agentes de diálogo, que simulan la compresión del lenguaje natural, con el fin de mantener diálogos convincentes entre máquina y humano, hasta, como propone Chomsky (N. CHOMSKY 1981) ofrecer una explicación última a la facultad humana del lenguaje a través de una gramática formal. La disparidad de estos objetivos no impide que todos estos lenguajes formales se hayan de servir de un componente fundamental: la sintaxis o las reglas en que se estructuran, en la que generalmente se integra un lexicón etiquetado de algún modo. Para la elaboración de esta sintaxis, los diferentes intentos de modelización han seguido diferentes corrientes gramaticales, desde modelos gramaticales más formalistas en su comienzo a la aplicación de gramáticas de restricciones o enfoques funcionalistas (S. DIK 1992) utilizando diversos lenguajes de programación declarativa como LISP (G. GAZDAR 1989) o PROLOG (S. DIK 1992). En la actualidad, en Denis Diderot, Paris VII, se están poniendo en práctica las gramáticas generativas no transformacionales (HeadDriven Phrase Structure Grammar, Lexical Functional Grammar, etc.) o la Teoría sentido-texto para la creación de los nuevos robots de tercera generación (O. GARCÍA MARCHENA).2 No obstante, la aplicación rigurosa de una única teoría lingüística no está exenta de riegos: porque aunque estos lenguajes formales son eficaces 2 En futura publicación: GARCÍA MARCHENA, OSCAR, “Lingüística española e Inteligencia Artificial: Aplicación informática de gramáticas de restricciones para la confección de agentes de diálogo”, Interlingüística, Actas de XXII Congreso Internacional de la Asociación de Jóvenes Lingüistas (AJL), Sevilla, 2007. L. Rello — CORAL: Construcción de Objetos Representacional Aplicada al Lenguaje 8 para caracterizar lenguajes y para comprobar si una estructura es válida o no, en cambio crean muchas sentencias sin existencia real y sufren para representar algunas estructuras simplificadas o reorganizadas. Algunos ejemplos de ello los podemos encontrar al analizar el funcionamiento y los resultados de algunos de los más actuales analizadores sintácticos del español como HISPAL, FreeLing, SUP y Connexor que están basados en diferentes formalismos gramaticales con importantes diferencias a nivel morfológico, sintáctico y oracional. Estos analizadores ejemplifican problemas (TINKOVA TINCHEVA)3 aún insalvables de los lenguajes formales, por ejemplo: la falsa identificación de funciones sintácticas en (1) Papel fundamental han desempeñado en esta recuperación los evangelios…, oración en la que FreeLing identifica los evangelios con el objeto directo; el erróneo reconocimiento —por parte de Connexor— del objeto directo precedido de la preposición a en su segunda aparición en la oración en (2) El colmo es ver a Lucio subiendo al ataque; o la heterogeneidad que se da en el tratamiento de lexías o nombres formados por varias palabras entre espacios en blanco: así HISPAL, en la oración (3) Ángel Amor se llama el individuo, no identifica el nombre propio Ángel Amor como un todo, quizá porque Amor coincide con el nombre común de amor. Éstas son sólo algunas de las dificultades más simples a las que se enfrenta un analizador sintáctico, razón por la cual gran parte de los esfuerzos dedicados en PLN de los últimos años se hayan centrado en la desambiguación de los análisis sintácticos que crean estos modelos. Asimismo, las bases sobre las cuales se construyen estas modelizaciones para el PLN son conjuntos de datos que se presentan, o bien en forma de corpus elaborados ad hoc, o bien como herramientas de reciente creación, que gestionan grandes cantidades de datos, como los diccionarios ACQUILEX, ACQUILEX II, WORDNET y EURONET. El proyecto que presento, CORAL, se diferencia de todas estas modelizaciones tanto en los objetivos como en los medios. CORAL no aspira a dar una explicación del lenguaje ni a caracterizarlo tal como haría una buena gramática. CORAL no es normativo, no pretende determinar lo que es correcto e incorrecto, y tampoco parte de un corpus cerrado, diferenciándose del resto desde su base. 3 En futura publicación: TINKOVA TINCHEVA, NEVENA, “Estado actual del análisis sintáctico español”, Interlingüística, Actas de XXII Congreso Internacional de la Asociación de Jóvenes Lingüistas (AJL), Sevilla, 2007. L. Rello — CORAL: Construcción de Objetos Representacional Aplicada al Lenguaje 9 tiene a su disposición —ya verán cómo— el corpus más vivo, rico y extenso del planeta: Internet. Y no modeliza la gramática del español, sino que trabaja con estruturas o moldes que transmiten información, superando el nivel palabra, independientemente de la corrección o incorrección de las estructuras, tomándolas tal como plantean las estadísticas de su aparición en Internet. Se podría pensar que CORAL no repara en el funcionamiento del lenguaje para su desarrollo, sino todo lo contrario: que no tenga la pretensión de explicarlo no significa que no deje de nutrirse de los avances de la lingüística, como sucede desde su nacimiento. El segundo motivo que plateaba como razón para la creación de CORAL era la falta de multidisciplinariedad en nuestras universidades en un campo que lo requiere tanto como el PLN. Por un lado encontramos programas realizados por programadores geniales que saben poco de lengua y por otro lado programas bastante deficientes realizados, no sin esfuerzo, por parte de atrevidos lingüistas. Seguramente comiencen pronto en nuestras universidades grupos de PLN formados por dos tercios de informáticos y un tercio de lingüistas, como en Stanford, tal como me comentaba Dan Jurafsky, profesor de PLN de esa universidad. Pero este pensamiento optimista necesita ayuda y necesita proyectos como CORAL. CORAL aboga desde su comienzo por la pluridisciplinariedad, porque la necesita, ya que sin una perspectiva multidisciplinar, CORAL no sería posible: CORAL no puede ser planteado sin un lingüista, ni puede ser desarrollado sin un informático. Ambas disciplinas se auxilian, se complementan, y al combinar las posibilidades, cada una con las de otra, éstas fuerzas se multiplican. Finalmente, la tercera motivación que ha llevado a la creación de este proyecto es práctica, porque CORAL intenta responder a una necesidad social y empresarial. Estamos en un momento en el que ha aparecido un medio que ha revolucionado la comunicación entre las personas, poniendo a disposición de cada ser humano una cantidad inabordable de información. Es mucho más necesario el desarrollo de una tecnología que filtre la información disponible y la digiera, dando respuestas concretas a preguntas concretas, que la propuesta de una serie de páginas en las que encontrar la información. Basta recordar que la empresa que mayor crecimiento ha experimentado en el mundo, que hasta hace 9 años no existía y tiene unos ingresos CORAL L. Rello — CORAL: Construcción de Objetos Representacional Aplicada al Lenguaje 10 anuales de 5.264 millones de Euros —en el año 2006—, se dedica fundamentalmente a procesar la información. Hasta el momento, Google, gestiona las palabras como cadenas de caracteres, así que si fuéramos capaces de ir un paso más allá, procesando la información, el beneficio para la humanidad sería enorme. Pensamos que CORAL puede ser una línea de desarrollo muy esperanzadora en este sentido, sobre todo porque trata —como detallaremos más adelante— de extraer de los diferentes moldes o estructuras lingüísticas la información que podrían aportar, a partir de planteamientos propios y sin centrarse en una única corriente lingüística. L. Rello — CORAL: Construcción de Objetos Representacional Aplicada al Lenguaje 11 2. Objetivos El objetivo de CORAL es dar un paso más allá en el procesamiento de información. Hasta el momento esta gestión se ha realizado con éxito a nivel palabra, entendiendo la palabra como una cadena de caracteres, siendo esta forma de procesamiento únicamente estadística, no de conocimiento. En este paradigma se persigue identificar la información contenida en expresiones compuestas de varias palabras, en lo que hemos llamado nivel sentencia o nivel estructurado compuesto de referencias a objetos y de elementos estructuradores (v. CONCLUSIONES, § 5.1.3). Para ello no hemos utilizado los criterios usados con anterioridad en otros modelos, precisamente para evitar los fallos que éstos producen, sin poder evitar que surjan otros nuevos (v. METODOLOGÍA). Es por esta razón, por la que el paradigma que presento se preocupa más por identificar la información contenida en cada expresión, que su posible corrección o incorrección, además de obtener como resultado del análisis información relevante para la compresión de la misma. Como adelantamos con anterioridad, CORAL se diferencia del resto de los intentos de modelización en tres aspectos fundamentales: objetivos, metodología y datos en los que se basa. El objetivo de CORAL es el procesamiento de la información que transmiten estructuras del lenguaje superando el nivel palabra, entendida como cadena de caracteres. Estas estructuras con las que trabaja CORAL no coinciden con las estructuras de las gramáticas ni son explicativas del lenguaje. Estas estructuras son concebidas (v. CONCLUSIONES, § 5.2.1) como sentencias, como moldes que transmiten información por poseer una estructura que CORAL ha definido y por relacionar objetos mediante los elementos estructuradores. Como se explicará, el cuerpo teórico que fundamenta y estructura CORAL se basa precisamente en la naturaleza de sentencia que plantea y la concepción del lenguaje como apuntador de objetos (v. CONCLUSIONES, § 5.2.1). El objetivo de CORAL aspira a ser: realista, efectivo y perdurable. L. Rello — CORAL: Construcción de Objetos Representacional Aplicada al Lenguaje 12 Con realista me refiero a que persigo que CORAL se ajuste a la realidad del lenguaje y no que el lenguaje se ajuste al modelo, como ocurre con los corpus creados ad hoc. Esta es la razón por la que CORAL se nutre, no de un corpus limitado o cerrado, sino del corpus de datos más vivo, variado y extenso posible: Internet. Mientras que el realismo afecta a los datos con los que CORAL trabaja (v. DATOS), la búsqueda de la efectividad y de la perdurabilidad ha influido en la metodología (v. METODOLOGÍA). La pretensión de perdurabilidad de los resultados ha hecho que la metodología que CORAL sea especial: en vez de determinar reglas —mediante las cuales supuestamente se rige el lenguaje—, y crear un modelo que genere y analice oraciones —cuyos resultados se estiman a corto plazo—, lo que persigue es abordar el lenguaje natural, seleccionando las estruturas más sencillas y procesarlas, y una vez reconocidas éstas, pasar a las más sencillas de las restantes. Este proceso se realiza siguiendo un método hipotético deductivo. Para que la modelización sea lo más efectiva posible he creado planteamientos propios, y en ocasiones, he tomado parámetros de los paradigmas lingüísticos que mejor se ajustaban a las necesidades de cada caso que planteaba el español para su modelización. Así, CORAL no pretende ser una explicación o una simulación del posible funcionamiento gramatical. Sus pretensiones son más humildes: tan sólo pretende que la entrada y la salida de la información en la máquina coincida con la der ser humano, ya que nuestro objetivo es que la máquina entienda el lenguaje humano, no estudiar el modo en el que el ser humano procesa el lenguaje. También CORAL funciona con independencia de la normatividad del lenguaje. Si una estructura que transmite información se da en la realidad de un modo representativo estadísticamente, esta estructura será considerada por CORAL. No obstante, aunque CORAL no pretende ser un modelo del funcionamiento del lenguaje, sí se han tenido en cuenta las conclusiones de las investigaciones lingüísticas para la creación de CORAL. En la práctica la potencial aplicación de CORAL es múltiple, porque el procesamiento de la información a nivel sentencia implica la posibilidad de manipular, extraer, modificar y transformar información, de tal modo que las posibilidades de aplicación de CORAL en PLN son variadas y afectan muchos campos relacionados con los auxiliadores en la interfaz hombre-máquina: como los buscadores en bases de datos, consultas en bases de datos, ayuda al procesamiento de textos, reconocimiento de voz, o traducción automática. L. Rello — CORAL: Construcción de Objetos Representacional Aplicada al Lenguaje 13 3. Datos parte de los datos que le aporta PLANKTON: un modelo léxicomorfológico que viene siendo desarrollado desde el año 2001 por Eduardo Basterrechea y sus alumnos de PLN de la licenciatura de Lingüística de la Universidad Complutense de Madrid. Como PLANKTON cuenta con una fuente inagotable de textos que procesa —Internet—, en principio, CORAL tendría a su disposición un corpus total. Sin embargo, CORAL no aspira, en un primer momento, a tener un afán totalizador y a dar cabida a todos los tipos de sentencias posibles, sino ir reconociendo estructuras más sencillas y recursivas, y poco a poco, y una vez modelizado lo simple, pasar a considerar las siguientes estructuras que volverán a ser las más simples dentro de las complejas. PLANKTON es un repositorio de textos en el que se integra un lexicón. Cada palabra de este lexicón sufre una serie de procesos en cada uno de los módulos constitutivos de PLANKTON. Tras estos procedimientos, cada palabra es identificada de manera única mediante el binomio (a) cadena de caracteres (stream) y (b) significado, de modo que una palabra con dos significados tendrá dos representaciones en nuestro sistema, más una representación por cada categoría en la que exista una palabra representada por esa misma cadena de caracteres. Cada categoría se caracteriza por una serie de rasgos y se evitan desde el principio problemas de ambigüedad e identificación como sucedía con el analizador sintáctico HISPAL, gracias a la función etiquetadora para palabras polisémicas y palabras con las misma grafía que realiza Krill, un módulo de PLANKTON. Veamos a continuación cómo PLANKTON consigue ese milagro: partir de la maraña de textos de Internet, modelizar el stream o cadena de caracteres y devolver a CORAL palabras etiquetadas que serán los datos con los que CORAL trabajará. CORAL L. Rello — CORAL: Construcción de Objetos Representacional Aplicada al Lenguaje 14 PLAKTON Internet araña enlaces camaleón textos cocodrilo Palabras desconocido pez Krill(En,1,1,1) Krill(un,1,1,2) Krill(lugar,1,1,3) rémora lexicón hormiga vaca Los cilindros representan almacenes de información mientras que procesos están recuadrados. El camaleón es una navegador que funciona de manera automática: recibe la página html y divide la página entre lo que son los enlaces y lo que es el texto. Los textos van al cilindro de textos y los enlaces al de enlaces. El camaleón también hace un filtrado de textos en otros idiomas, o de textos que no interesen. La araña toma la información de enlaces y los utiliza para pedir más paginas html a Internet, que van a pasar al camaleón donde se vuelve a repetir el mismo proceso. De esta manera se van rastreando y adquiriendo textos procedentes de Internet. El cocodrilo es un procesador que recoge los textos y los descompone en palabras. Cada palabra está asociada al texto donde se localiza. De esta manera se podrán reconocer y saber cómo están estructuradas para la futura incursión de CORAL. Esta manera de asociar palabras al texto se llama Krill. Por ejemplo: (4) En un lugar de la mancha. L. Rello — CORAL: Construcción de Objetos Representacional Aplicada al Lenguaje 15 Krill(En,1,1,1) Krill(un,1,1,2) Krill(lugar,1,1,3) Palabras Texto Frase Posición Estos módulos —camaleón, araña, enlaces, textos, cocodrilo y krill— han sido desarrollados en su totalidad y funcionan. Los procesos que describiremos a continuación se encargan de procesar la información de las palabras y están siendo desarrollados en la actualidad con resultados satisfactorios en las partes que ya funcionan. El papel del pez afecta sobretodo al plano morfológico. El pez trabaja sobre las palabras: su trabajo es leer la información del krill y aportar nueva información morfológica al krill. Para llevar esto a cabo el pez se sirve del lexicón, un diccionario, que auxiliará al pez en su segunda tarea que es ir identificando las palabras que van apareciendo en el Krill con las del lexicón. A medida que se vayan identificando más palabras el lexicón irá aumentando. Cada vez irán apareciendo menos palabras nuevas porque habrá cada vez más palabras identificadas. Por ejemplo: el pez puede reconocer una palabra como adjetivo o nombre si lleva las terminaciones –o,–a, –os y –as, facilitando su identificación en el lexicón. Cada vez que una palabra haya sido identificada por el pez, éste debe de notificar necesariamente al krill qué palabra es. Este paso es fundamental para evitar algunos casos de ambigüedad, considerada como uno de los mayores problemas de PLN. Así, las palabras polisémicas tendrán varias entradas en el lexicón, por ejemplo: (5) palabra(mono, animal, …). (6) palabra(mono, traje, …). (7) palabra(mono, bonito, …). El lexicón no está estructurado como el krill, en donde todos los hechos son iguales. Dentro del lexicón hay diferentes tipos de palabras y cada clase de palabras se caracteriza de una manara diferente. Para cada palabra hay un único esquema o entrada. Por ejemplo la entrada (8) palabra(id_palabra, mono, animal) será única, es decir, sólo hay una palabra que tiene estos argumentos. A esta palabra se le asigna un número correlativo, de esta manera, una palabra determinada puede ser identificada de manera única. L. Rello — CORAL: Construcción de Objetos Representacional Aplicada al Lenguaje 16 El hecho de trabajar con números encuentra su explicación en la optimización informática que un único número posibilita en comparación a una cadena de caracteres de dos líneas, que es lo que viene a ocupar cada palabra. Para cada categoría se ha creado un índice propio ya que cada categoría se explica con hechos diferentes. Mostramos a continuación la modelización de cada clase: palabra(id_categoría, palabra, categoría, id_dentrocategoría). sustantivo(id_dentrocategoría, palabra, género, número, significado). adjetivo(id_dentrocategoría, palabra, género, número, grado, significado). adverbio(id_dentrocategoría, palabra, tipo, significado). adverbiomente(id_dentrocategoría, palabra, significado). propio(id_dentrocategoría, palabra, tipo de complemento, significado). conjunción(id_dentrocategoría, palabra, tipo de oración, significado). interjección(id_dentrocategoría, palabra, significado). pronombre(id_dentrocategoría, palabra, tipo, número, persona, género, significado). deternimante(id_dentrocategoría, palabra, tipo, número, género, significado). verbo(id_dentrocategoría, palabra [infinitivo], personal, regular, conjugación, trasitivo/intransitivo, complementos [categoría obligatorias y categorías opcionales], significado). forma_verbal(id_dentrocategoría, id_dentro_categoría_verbal, palabra, modo, tiempo, persona, número, voz, regular/ irregular). La hormiga está todavía por definir, utiliza aspectos sintácticos y semánticos para realizar la misma labor que realiza el pez: buscar los aspectos sintácticos y semánticos para tratar de determinar con más detalle las palabras. En el cilindro desconocido van a parar todas las palabras que no las puede encontrar el pez en el lexicón. Estas palabras se definen con el siguiente índice: desconocido(palabra, número_apariciones). Es la rémora la que intenta averiguar algo más sobre estas palabras de desconocido, preguntando a otros recursos como un conjugador verbal — otro módulo independiente en proceso de elaboración que traba ja con PLANKTON—, otros diccionarios como el DRAE, Google, páginas lematizadoras, etc. Si una palabra de desconocido se encuentra satisfecha por alguno L. Rello — CORAL: Construcción de Objetos Representacional Aplicada al Lenguaje 17 de estos recursos, pasa a ser añadida al lexicón y deja de formar parte de desconocido. Finalmente, la vaca toma y desarrolla las palabras del lexicón, que luego vuelve a añadir al lexicón una vez que han sido desarrolladas. Un ejemplo de palabra desarrollada que devuelve la vaca es cualquier verbo conjugado en su totalidad, de modo que, cuando aparezca alguna otra forma de ese verbo en el lexicón, ésta ya esté identificada. L. Rello — CORAL: Construcción de Objetos Representacional Aplicada al Lenguaje 18 4. Metodología Adoptando siempre el método hipotético deductivo, el tratamiento automático del lenguaje natural puede orientarse desde dos puntos de vista diferentes: (a) entendiendo el lenguaje como una secuencia lineal de caracteres o stream y (b) desde la idea a transmitir. Dependiendo del punto de partida que se tome en el proceso de la realización del lenguaje: o bien la noción abstracta de la que parte el hablante (b), o bien de la materialización final, el stream (a). En el primer caso (a) se parte del lenguaje —como cadena de caracteres— hasta la idea a transmitir, pasando por diferentes grados de abstracción creciente: carácter < palabra < grupo < sentencia < sentencia compleja < párrafo < texto. El stream se divide en palabras, éstas habrán de ser clasificadas en grupos de palabras, y éstos a su vez formarán sentencias, y así sucesivamente hasta llegar al texto. Como se observa, estos niveles no se corresponden con los niveles del lenguaje: fonético, fonológico, morfológico, sintáctico, semántico, pragmático y textual. PLANKTON esta siendo desarrollado siguiendo esta aproximación: una modelización ascendente. Oraciones Grupos de palabras Palabras Stream L. Rello — CORAL: Construcción de Objetos Representacional Aplicada al Lenguaje 19 La segunda posibilidad (b) es sobre la que versa este estudio: CORAL. Se trata de una modelización descendente, desde la noción de lo que se pretende transmitir hasta el mensaje concreto. Se entiende que la mejor aproximación metodológica al problema sería desarrollar ambas líneas hasta llegar al punto de encuentro. Para llegar a ello, CORAL, además de los planteamientos originales en los que se basa —el lenguaje como apuntador de objetos y la naturaleza de la sentencia y sus tipos—, se ha servido de los principales enfoques lingüísticos —formalistas y funcionalistas— del momento, que se rigen también por métodos hipotéticos deductivos, siendo las diferencias entre ellos tales como la concepción que puedan tener del lenguaje, un diferente grado de formalización y la mayor o menor flexibilidad de sus planteamientos que dependerá de los parámetros —objetivos o relativos— que utilicen para determinarlos. CORAL se servirá de herramientas valiosas, producto de las investigaciones de estas corrientes, siempre que éstas sean consideradas las más efectivas para el tratamiento de los aspectos del lenguaje escrito del que está compuesto Internet y no crearan contradicción en el aparato teórico de CORAL, es decir, siempre que sean efectivas y consistentes. Consecuentemente, podemos considerar este proyecto en parte funcionalista: por la asunción de una correspondencia no arbitraria entre la forma gramatical y la función que desempeñan, y por la relevancia que adquieren las funciones gramaticales en este modelo, aunque estas funciones son entendidas en CORAL de un modo original, adecuadas a sus objetivos. Por otro lado, CORAL, como todas las modelizaciones, es formal en el sentido en el que utiliza un sistema notacional matemáticamente preciso para materializar las generalizaciones e implicaciones del lenguaje. Pero no es formal si se entiende formal como oposición al significado y al uso del lenguaje. Asimismo, CORAL no quiere caer en la excesiva abstracción de los datos reales, como se critica a algunos modelos formalistas, sino que pretende mantenerse cerca de la realidad del lenguaje, por este motivo no tendrá sentido hablar de un modelo normativo, aunque reconocerá las estruturas mal formadas considerando un parámetro ± correcto. Esto no será relevante en comparación al valor del que se inviste una sentencia debido a su uso, a su capacidad de comunicar, y así se puede inferir un tipo de modelo de estructura a partir de esa sentencia. Además de estos factores habrá que añadir a nuestra metodología una variable que juega un papel fundamental en CORAL: la estadística. Porque en el desarrollo teórico de CORAL —en el que se determinan los diferentes L. Rello — CORAL: Construcción de Objetos Representacional Aplicada al Lenguaje 20 moldes o estructuras de información—, las primeras formas en ser considerados serán las más frecuentes en el lenguaje de Internet que nos facilita PLANKTON. Sobre la metodología es necesario añadir que CORAL no sólo aboga por el método hipotético deductivo, basándose en los datos empíricos que le aporta PLANKTON, sino que es consciente de no querer adoptar un enfoque normativo —generalmente inductivos— por dos razones: en primer lugar porque CORAL aspira a acercarse al procesamiento del lenguaje real —no del ideal—, porque sólo así, tomando Internet, se podrá avanzar en la práctica del PLN, buscando resultados útiles y aplicables no sólo en la teoría; y en segundo lugar, porque no quiere caer en la inadecuación de los modelos anteriores, que han intentado superar el nivel palabra en el PLN, como vimos con los analizadores sintácticos (v. MOTIVACIÓN). Del trabajo con el lenguaje natural, siguiendo esta metodología, irán surgiendo sencillas estructuras seleccionadas o “moldes de significación”: las sentencias. Los criterios para determinar las estruturas que se van seleccionando son tres: el criterio estadístico, es decir, se tendrán más en cuenta el tipo de estruturas que más aparecen; la posibilidad de reconocimiento de la estructura dentro del corpus; y en tercer lugar la facilidad que presente la estructura de ser incluida en los objetos y, por extensión, su coherencia dentro del cuerpo teórico de CORAL. Estas sentencias serán comprobadas empíricamente en su existencia, en su uso y su posible identificación en el corpus. Después de este proceso se realizará lo mismo con la siguiente sentencia de modo que su existencia, uso e identificación sean compatibles y, en la medida de los posible, complementarias con las sentencias comprobadas con anterioridad que ya forman parte de CORAL, pero que son susceptibles de sufrir cambios en el caso de descubrir nuevos comportamientos del lenguaje que obligue a cambiar los planteamientos. Es por esto por lo que CORAL se remodela y se perfecciona constantemente a medida que avanza la investigación. L. Rello — CORAL: Construcción de Objetos Representacional Aplicada al Lenguaje 21 5. Conclusiones El resultado de esta investigación ha dado lugar a la creación teórica de CORAL —más relacionada con la rama de la lingüística—, pensada para la aplicación de la informática, que por falta de recursos, no ha podido ser llevada acabo, pero que es posible, ya que durante la creación del planteamiento teórico de CORAL siempre se ha tenido en cuenta la viabilidad del proyecto que se ha ido asegurando gracias a las consultas realizadas a expertos en informática. CORAL se fundamenta en dos ideas originales principales: la concepción del lenguaje como apuntador de objetos y la naturaleza de la sentencia. 5.1 El lenguaje como apuntador de objetos 5.1.1 Concepción del lenguaje El lenguaje es un instrumento de interacción social (S. DIK 1997: 5) cuya principal razón es establecer comunicación entre los seres humanos, y gran parte de esto se consigue mediante la expresión del pensamiento a través del lenguaje, matizando así a Chomsky (1985: 15-16) quien mantiene que la función del lenguaje será principalmente la expresión del pensamiento. Así como el lenguaje, grosso modo, transmite ideas entre dos seres humanos, necesitamos tener alguna noción de lo que un ser humano quiere transmitir. Se parte de que en la mente de cada persona hay un universo de objetos relacionados entre sí. Estos objetos no tienen que estar basados necesariamente en referentes procedentes de la realidad extralingüística. En base a esto, si se considera que el lenguaje hace referencia o apunta a objetos, en- L. Rello — CORAL: Construcción de Objetos Representacional Aplicada al Lenguaje 22 tonces cada sentencia estará formada por apuntadores de objetos,4 es decir, el contenido de cada mensaje sería entonces una serie de apuntadores a estos objetos sobre una estructura concreta. Algunas de estas estructuras concretas pueden ser recurrentes en la forma de relacionar objetos, lo que permite su sistematización por parte de CORAL. 5.1.2 Objeto Un objeto sería una noción inaprensible, que al ser realizada en una cadena de caracteres, más que representar al objeto representaría un aspecto de éste, es decir, una realización del mismo. Así palabras sinónimas representarían aspectos diferentes pero próximos de los mismos objetos. La palabra (9) banco y la palabra (10) entidad financiera apuntan o refieren al mismo objeto pero a aspectos diferentes. La misma parte del objeto cuando son sustituibles (sinónimos) y diferente parte, si no son sustituibles. Es importante resaltar que la misma cadena de caracteres puede apuntar a dos objetos totalmente diferentes. En este sentido, la palabra (9) banco apunta a varios objetos diferentes: asiento; mesa de carpintero; conjunto de peces; entidad financiera; o almacén de órganos, tejidos o líquidos fisiológicos humanos. Para poder diferenciar estos streams —compuestos por los mismo caracteres, pero que apuntan hacia objetos diferentes— nosotros utilizamos un identificador, que será un significado del stream que permita diferenciarlo de los demás. Cada palabra tendrá tantas representaciones en nuestro sistema como significados tenga (11): palabra(banco, palabra(banco, palabra(banco, palabra(banco, palabra(banco, 24389), sustantivo 76896), sustantivo 2344), sustantivo 6786), sustantivo 9808), sustantivo sustantivo(24389, masculino, singular, asiento). sustantivo(76896, masculino, singular, mesa_carpintero). sustantivo(2344, masculino, singular, conjunto_peces). sustantivo(6786, masculino, singular, entidad_financiera). 4 No existe un paralelismo entre la relación existente entre lenguaje y objetos, que se plantea aquí, y la relación entre palabra y referencia, ya que esta última relación se establece entre una expresión nominal y la cosa u objeto real o conceptual, al que se alude (J. Lyons 1984: 145), mientras que los objetos que proponemos son más amplios. L. Rello — CORAL: Construcción de Objetos Representacional Aplicada al Lenguaje 23 sustantivo(9808, masculino, singular, almacén_órganos_ tejidos-líquidos_fisiológicos_humanos). 5.1.3 Referencia a objeto Una referencia a objeto está formada por (a) una cadena de caracteres más (b) su significado (B. PARTEE 1990). Por ejemplo, la palabra montaña: (12) sustantivo[id_dentro de categoría, montaña (palabra), femenino, singular, elevación del terreno (significado). El objeto por tanto no tiene ninguna representación concreta, sino que tiene múltiples realizaciones o manejadores —handlers—: A0 - montañoso A1 - montañés Funciones sintácticas Plus - cordillera, cadena montañosa Gender - accidente geográfico Si - montañero Culm - pico Contr - planicie Process - escalar Part - ladera, base, pico Llevar a cabo la modelización de los objetos sería similar a querer realizar una representación del conocimiento, y nuestro objetivo no es representar el conocimiento sino el lenguaje: es tratar de identificar dentro del lenguaje cuáles son las referencias a objetos. No obstante, un esbozo posible para la estructuración de los objetos estaría relacionado con la teoría propuesta por Mel’čuk (L. WANNER 1996: 145) sobre las funciones léxicas. Estas funciones léxicas cubren, en todas las lenguas, las relaciones sintagmáticas que se dan —intensificadores, verbos soporte…—, así como las relaciones paradigmáticas entre las lexías —sinónimos, antónimos, derivados…— (V. ANEXO I). Se han realizado algunas aplicaciones de esta teoría al español en grupos de palabras reducidos, que demuestran el potencial de esta teoría en esta lengua, como por ejemplo el grupo de términos que designan color y sus derivados (L. RELLO 2007). Como se representa a continuación, también los objetos deberían recoger al igual que las entradas del diccionario todas las formas morfológicas posibles de la palabra y sus funciones sintácticas. En (13) A mí me gusta el L. Rello — CORAL: Construcción de Objetos Representacional Aplicada al Lenguaje 24 agua de la montaña, encontramos tres referencias a objetos: gustar, agua y montaña. A0 - acuoso A0 - gustoso A1 - aguado A1 - gustado Able - soluble Anti - disgustar V - gustar Funciones sintácticas S0 - gusto Magn - encantar, adorar Funciones sintácticas Excess - inundación Vb - aguar Figur - vida Abv - *aguadamente, *acuosamente Unit - gota A0 - montañoso A1 - montañés Funciones sintácticas Plus - cordillera, cadena montañosa Gender - accidente geográfico Si - montañero Culm - pico Contr - planicie Process - escalar Part - ladera, base, pico Las sentencias se forman a partir de las referencias a objetos más los elementos estructurales. Concebimos elementos estructurales de forma aproximada a como las diferentes corrientes gramaticales han venido definiendo a las palabras vacías, palabras gramaticales o palabras funcionales, siendo palabras cuyo significado es gramatical, o sea, palabras cuyo significado exprese una relación o la pertenencia a una clase. Por ejemplo en la oración (14) Klir es Plon. Klir y Plon son referencias a objetos y es es un estructurador que indica que nos encontramos ante una Estructura 0 (E.0, como veremos más adelante). El ordenador no sabe lo que es Klir o Plon, pero sí que Plon o Klir son referencias a objetos. Una vez que identificamos los esquemas de referenciación de los objetos, podremos entrar a manejar su contenido semántico. L. Rello — CORAL: Construcción de Objetos Representacional Aplicada al Lenguaje 25 palabras elementos estructuradores 5.2 La naturaleza de la sentencia 5.2.1 Sentencia La sentencia es entendida como una estructura en la que entran en relación los objetos. La sentencia está relacionada conceptualmente con la oración —más propia del paradigma tradicional y el formalista— y con la cláusula —de concepción funcionalista—. La sentencia comparte con la oración que es autónoma desde un punto de vista sintáctico, que es autosuficiente como unidad comunicativa en un contexto concreto, y que es la realización concreta de una estructura más abstracta. En cambio toma la sentencia de la cláusula la idea de que las funciones sintácticas estén relacionadas en torno al verbo. La naturaleza de la sentencia que mantenemos considera varios parámetros relacionados con el funcionalismo: como la consideración del lenguaje como instrumento de interacción social —abarcando con esta concepción todas las clásicas funciones del lenguaje—; así como el principio de la economía lingüística (A. MARTINET 1991: 219-225); la importancia del contexto (S. C. LEVINSON 1989) en el que se enmarca la sentencia —incluyendo la situación de la dimensión espacio temporal, el contexto y la presuposición pragmática—; así como la iconicidad del lenguaje, y por tanto de la sentencia (F. NEWMEYER, 2000: 114). Consecuentemente, las oraciones que producimos son por lo general — excusando las licencias poéticas—: lo más cortas, lo más simples, lo menos ambiguas y lo más entretenidas posible, en aras de la máxima adecuación social. Para procesar el lenguaje habrá que llevar a cabo una operación de reconstrucción de todos los elementos ausentes en la sentencia, así como de los pronombres o proforma y de lo que llamaremos el marco de la sentencia: L. Rello — CORAL: Construcción de Objetos Representacional Aplicada al Lenguaje 26 tiempo, espacio, veracidad, modo, etc. Entrarían dentro del marco todo lo que no fuera directamente exigido por el verbo, es decir, todo lo que complementase opcionalmente u obligatoriamente al objeto verbo. A continuación ejemplificamos el verbo (15) tirar, dando especial relevancia al hecho de que el significado que pueda tiene el verbo influye en sus relaciones sintácticas, hecho que corrobora la ventaja de que CORAL pueda contar con un lexicón etiquetado semánticamente como el de PLANKTON. verboRegimenPreposicional(tirar,1,‘Lanzar con la mano; dejar caer’,a,algos,ferlo). verboRegimenPreposicional(tirar,1,‘Lanzar con la mano; dejar caer’,a,‘un lugar’,ferlo). verboRegimenPreposicional(tirar,1,‘Lanzar con la mano; dejar caer’,contra,algos,ferlo). verboRegimenPreposicional(tirar,1,‘Lanzar con la mano; dejar caer’,por,‘un lugar’,ferlo). verboRegimenPreposicional(tirar,2,‘Derribar; volcar.’,a,‘un lugar’,ferlo). verboRegimenPreposicional(tirar,2,‘Derribar; volcar.’,con,algo,ferlo). verboRegimenPreposicional(tirar,2,‘Derribar; volcar.’,sobre,algo,ferlo). verboRegimenPreposicional(tirar,3,‘No pasar una prueba’,en,algo,ferlo). verboRegimenPreposicional(tirar,4,‘Disparar un arma’,a,algo,ferlo). verboRegimenPreposicional(tirar,5,‘Hacer fuerza para atraer o acercar’,de,algo,ferlo). verboRegimenPreposicional(tirar,6,‘Quedar estrecha o corta una prenda de vestir’,de,algo,ferlo). verboRegimenPreposicional(tirar,7,‘Ir en una dirección determinada’,a,‘un lugar’,ferlo). verboRegimenPreposicional(tirar,7,‘Ir en una dirección determinada’,hacia,‘un lugar’,ferlo). verboRegimenPreposicional(tirar,7,‘Ir en una dirección determinada’,para,‘un lugar’,ferlo). verboRegimenPreposicional(tirar,7,‘Ir en una dirección determinada’,por,‘un lugar’,ferlo). verboRegimenPreposicional(tirar,8,‘Tener una inclinación; tender hacia unas ideas o modo de vida’,a,algo,ferlo). verboRegimenPreposicional(tirar,8,‘Tener una inclinación; tender hacia unas ideas o modo de vida’,hacia,algo,ferlo). verboRegimenPreposicional(tirar,9,‘Tener cierto parecido’,a,algos,ferlo). L. Rello — CORAL: Construcción de Objetos Representacional Aplicada al Lenguaje 27 5.2.2 Modelo genérico de sentencia En el modelo genérico de sentencia que presento a continuación encontramos, (a) el verbo y los argumentos que dependen de éste, que pueden ser opcionales u obligatorios; y (b) el marco de la sentencia formado por diferentes objetos (espacial, temporal, modal, veracidad y x) que por lo general están implícitos porque pueden ser entendidos sin dificultades tanto por el emisor como por el receptor. La formación de la sentencia parte de lo más necesario o adecuado a lo menos, corroborando la jerarquía de partes de la sentencia de validez universal que propone Hengeveld: verbo > nombre > adjetivo > adverbio (modo). (K. HENGEVELD 1992: 47) + corta + simple – ambigua + entretenida Oración Reconstrucción Marco Objeto temporal Objeto espacial Objeto veracidad Objeto modal Verbo Objeto X Arg. 1 op / ob Arg. 2 op / ob Arg. 3 op / ob 5.2.3 Funciones semánticas en argumentos y objetos Para indicar cuáles son las funciones semánticas que ocupan cada posición hemos modificado y adecuado algunos presupuestos funcionalistas (S. DIK 1997) al español, ya que los estudios que han implementado la teoría funcional en PROLOG se han realizado sobre inglés, francés y holandés (S. DIK 1992). En la medida en la que el español es una lengua flexiva, tanto más flexible será en lo que se refiere a la posición que ocupan de los argumentos en la sentencia —que por ejemplo en inglés donde la posición es mucho más estricta—, lo que llevaría a pensar que las estructuras del español pudieran ser menos y más simples que en otras lenguas, debido precisamente a esta flexibilidad. CORAL gestiona de una manera diferente a otros modelos, tanto las funciones semánticas como los argumentos de la sentencia. No obstante, al modelo que más se puede asemejar en las definiones teóricas de los argumentos es el funcionalismo. De modo que para hacer la exposición más di- L. Rello — CORAL: Construcción de Objetos Representacional Aplicada al Lenguaje 28 dáctica, se procede a la explicación de los argumentos de CORAL en comparación a los funcionalistas. Las funciones semánticas que ocupan la primera posición argumental 1 (A¹) son el Agente (entidad que controla una acción, es decir, una actividad o una realización), el Posicionador (entidad que controla una posición), Procesado (la entidad que sufre un proceso) y Cero (la entidad que prioritariamente implica un estado). En la posición argumental 2 (A²) se sitúa el Goal (entidad afectada o efectuada por la operación de algún controlador). Mientras que el argumento 3 (A³) está destinado al Receptor (entidad a cuyo poder se transfiere algo). El resto de las funciones semánticas las situamos en el marco, aunque esto no implica que no puedan ser obligatorias, como ya vimos con el ejemplo (15) del verbo tirar, CORAL sí acepta como obligatorios argumentos que vienen dados por la propia semántica del verbo. El objeto espacial se corresponde con las funciones semánticas de Lugar, Dirección y Origen. Mientras que el objeto temporal (v. CONCLUSIONES, § 5.2.4) y el de veracidad (v. CONCLUSIONES, § 5.2.4) de CORAL no encuentran correspondencias en el paradigma funcionalista. El planteamiento de los argumentos de CORAL difiere del funcionalista en la relación entre las funciones semánticas y su posición (S. DIK 1997: 120-121). Por ejemplo, Dik sitúa la Fuerza (entidad no cotroladora que instiga un proceso) — es decir el Caso Instrumental según Fillmore (C. J. FILLMORE 1968: 1-88)— en la primera posición argumental, mientras que en nuestro modelo ocupará esa posición atendiendo únicamente a criterios formales: en el caso en el que concuerde con el sujeto la Fuerza o el Caso Instrumental ocupara el A¹: (16) La llave abrió la puerta, de lo contrario será un objeto modal (17) Juan abrió la puerta con la llave. 5.2.4 Funciones sintácticas en argumentos y objetos La asignación de las funciones sintácticas se realiza en base de una clasificación de funciones semánticas (S. DIK 1997: 266) en términos de una prioridad de carácter universal: agente (sujeto) > goal > receptor > beneficiario > instrumental > locativo > temporal. Si una sentencia permite la asignación de la función beneficiario, la jerarquía predice que hay en esa sentencia también se pueden predecir las funciones precedentes como agente, goal y receptor. En nuestro modelo la jerarquía entre A¹ > A² > A³ es clara y sigue el planteamiento de jerarquía anterior. Veamos ahora los argumentos de CORAL en comparación y correspondencia con los de la tradición gramatical. L. Rello — CORAL: Construcción de Objetos Representacional Aplicada al Lenguaje 29 El A¹ (agente, posicionador, procesado o cero) se corresponde con el tradicional sujeto y se reconoce por su concordancia con el verbo. El A² (goal) coincide con el objeto directo y el complemento preposicional. Se reconoce o bien por que lleva delante una preposición, que rige el verbo (se cuenta con una lista de verbos y sus preposiciones obligatorias), o bien porque en el caso en el que el A² sea una persona va precedido de la preposición a, o bien en última instancia porque el A² se posiciona detrás del verbo en la mayoría de los casos. Los pronombres la, lo, las y los son los que aparecen en el caso de su pronominalización exceptuando los casos de leísmo, que CORAL acepta como estructuras posibles. Siguiendo la jerarquía argumental si existe el A³ es porque en A¹ y el A² ya han sido reconocidos, además suelen ir precedidos de la preposición a o para o pronominalmente se representa a través de le y les. En el caso extremo en el que ambos A¹ y A² concuerden con el verbo determinar la posición argumental de cada uno será algo más complicado: para poder delimitar cuál de las dos cadenas de caracteres se corresponde con la función sintáctica adecuada, apelaremos a una jerarquía de posibilidades (S. DIK 1997: 279), que determinará cuál de las dos formas tiene más posibilidades de ser A¹ que la otra. La clasificación que presentamos ha sido simplificada y adecuada a nuestro modelo considerando algunos parámetros funcionalistas, como entidades de primer y de segundo orden, y los términos de una misma predicación o de predicación subordinada, innecesarios para nuestro fin: (a) definido > específico > no específico (b) 1ª/ 2ª persona > 3ª persona (c) singular > plural (d) humano > animado > inanimado (e) entidades concretas > entidades abstractas El objeto temporal se concreta en todos los adverbios, sintagmas y desinencias verbales que hagan referencia al tiempo, considerando que las desinencias verbales no son absolutas en lo que refiriere a la situación del tiempo, y como consecuencia, se atenderá a los universales de marcación del tiempo verbal por los que el tiempo presente podrá representar el pasado o el futuro, pero un tiempo futuro o un tiempo pasado siempre se refieren al futuro y al pasado respectivamente. El objeto espacial recoge las formas que refieren al lugar en el que se sitúa algo o bien la dirección o el origen, coincidiendo con las funciones semánticas funcionalistas de lugar, dirección y origen. En el objeto modal se L. Rello — CORAL: Construcción de Objetos Representacional Aplicada al Lenguaje 30 engloban desde la función semántica de instrumento hasta los tradicionales completemos circunstanciales de modo. El objeto veracidad se relaciona con la lógica, con el valor de verdad que se le dé a una sentencia, dependiendo de la fuente o de la actitud del hablante. En el siguiente gráfico se ejemplifican las correspondencias entre las funciones semánticas y las posiciones sintácticas: A¹ A² A³ O. espacial Agente Posicionador Procesado Cero Goal Receptor Lugar Dirección Origen O. temporal O. modal O. veracidad Fuerza 5.3 Moldes lingüísticos o tipos de estructura de sentencia Para transmitir este universo de objetos el ser humano utiliza una serie de estrategias que en el lenguaje se materializan en diferentes tipos de estructuras que relacionan objetos. Cada lengua posee N estructuras lingüísticas —esquemas o moldes—, no obstante, lo que se piensa es mucho más libre que las estructuras se utilizan para su transmisión. Nuestro objetivo es modelizar los tipos de moldes lingüísticos o tipos estructura de sentencia —que no coinciden con los tipos de oraciones gramaticales tradicionales— y tras determinar qué estructuras, habrá que comprobar qué verbos utilizan esas estructuras. Recordemos que para nosotros un verbo se caracteriza por su cadena de caracteres y su significado. Así un verbo con dos significados tendrá dos entradas dentro de PLANKTON como moldes lingüísticos. Y dos verbos con diferentes streams podrán tener el mismo molde si tienen el mismo significado. Los moldes lingüísticos son concebidos como estructuras de transmitir: primero se piensa lo que se quiere transmitir y después se decide la estructura a utilizar, según lo que se quiera transmitir, la intención del hablante, el contexto, etc. Finalmente se rellena la estructura que el receptor recompone añadiendo los elementos que no han sido expresados. Es necesario partir de una primera distinción entre las estructuras normales y estructuras especiales. L. Rello — CORAL: Construcción de Objetos Representacional Aplicada al Lenguaje 31 5.3.1 Estructuras normales La estructura normal es la que ha sido definida en el punto anterior sobre la naturaleza de la sentencia. Esta estructura genérica tomará diferentes manifestaciones (entre otras muchas causas) según el verbo que utilice —argumentos obligatorios u optativos—, y según el tipo de expresión —expresión de condición, de concesión, de finalidad, de causa, de consecuencia, de comparación, de tiempo, de lugar y de modo—. En la estructura normal se incluyen tipos de oraciones que generalmente en las gramáticas se plantean como tipos diferentes: oraciones reflexivas —en las que el agente y el goal se refieren al mimos objeto—, las oraciones recíprocas —los agentes y los receptores son el mismo objeto—, la pasiva refleja y algunos tipos de oraciones impersonales. Las oraciones coordinadas y subordinadas se consideran sentencias complejas. El reconocimiento de las estructuras que forman cada elemento del marco y del verbo se realzará mediante criterios formales —desarrollados en parte por los lenguajes de autómatas— auxiliados por listas. 5.3.2 Estructuras especiales Para la determinación de las estructuras especiales hemos tenido en cuenta: su simplicidad, su índice de aparición, el grado de complejidad para su identificación y de inclusión en los objetos. E.1: <objeto, ob> <vb. copulativo> <objeto, ob> Entre las estructuras especiales distinguimos la E.1 que se corresponden con las predicaciones nominales y oraciones copulativas. La E.1 pone en relación dos objetos. En (18) Víctor es rubio, Víctor forma parte del conjunto de individuos cuya característica es rubio sin embargo en (19) Víctor escribe palíndromos, se establece una relación entre tres objetos: Víctor, que desarrolla un proceso, escribir, y el producto de este proceso palíndromos. Los verbos ser y estar no son más que elementos sintácticos de apoyo, carentes de significado léxico, que se utilizan para la realización de las categorías morfosintácticas tiempo, persona, número, aspecto y modo. De tal modo que el verbo no aporta ninguna información acerca del sintagma nominal inicial, el sujeto oracional. Se reconocen porque utilizan los verbos ser, estar, parecer y resultar, siempre que el contenido semántico de éstos sea nulo y funcionen únicamente como nexo. Por lo tanto esto excluye de las E.1: al verbo ser cuando este L. Rello — CORAL: Construcción de Objetos Representacional Aplicada al Lenguaje 32 significa existir, al verbo parecer cuando va seguido de que, y al uso pronominal del verbo parecer: (20) Tu hermano se parece a tu padre. También se excluyen los casos en los que los verbos ser o estar equivalen a hallarse, tener lugar, empezar, etc. (21) La casa está a dos leguas (se halla). (22) La función será a las cuatro (empezará). En otras palabras: no se consideran todos los casos en los que los verbos ser y estar ocupan el puesto que legítimamente le correspondería a un verbo predicativo. Existen casos especiales como las expresiones de la hora: (23) Son las doce y media, o (24) Es la una, se presupone el ordenador reconstruye el sujeto con la/s hora/s. E.2: <hay> <objeto, ob> La E.2 presenta un objeto. Esta estructura no muestra ninguna relación entre objetos. Esto se debe a que el verbo haber cuando funciona en las oraciones impersonales ejerce su propio significado sin ser auxiliar de otros verbos. Su reconocimiento es sencillo, utiliza el verbo haber en tercera persona y en singular. Sin embargo es frecuente el error por parte de los hablantes de concordar el verbo haber con el objeto que le sigue (25) *Habían muchas personas, por lo que también habrá que contemplar la posibilidad del reconocimiento de este tipo de oraciones. Además dificulta su reconocimiento el hecho de que en ocasiones se utiliza había de manera análoga (26) Ayer había dos mil jóvenes en el campus; y la similaridad el uso del verbo hacer, que hoy sustituye a haber en las referencias temporales (27) Hace mucho tiempo que no vemos a Laura con Javi o (28) Hace frío. E.3: <objeto, ob> <tener> <objeto, ob> El verbo tener, al indicar posesión, también crea un tipo de sentencia especial porque está relacionando dos elementos funcionando el verbo como un tipo de nexo, de escaso contenido semántico, lo poseído en una característica, una propiedad o parte del poseedor. Es por esta razón por la que este tipo de sentencias son consideradas especiales: porque relacionan los objetos de manera diferente, un prueba de ello es que este verbo puede ser sustituido por el pronombre posesivo: (29) Yo tengo una casa, mi casa. E.4: <hace> <objeto, ob> L. Rello — CORAL: Construcción de Objetos Representacional Aplicada al Lenguaje 33 El verbo hacer puede gramaticalizarse cuando se utiliza en tercera persona del singular para presentar un hecho —la mayoría de las veces— meteorológico. (30) Hace mucho calor. Se reconoce porque hacer se presenta en tercera persona del singular y suele ir seguido de palabras como muy o mucho y calor, frío, fresco, sol, buen tiempo, malo, mal tiempo, etc. E.5: <objeto> <más> <objeto> <que> <objeto> La expresión de la comparación requiere de una forma especial por su estructura. La E.5 opone dos objetos en relación a un tercero —generalmente una cualidad— estableciendo relaciones de superioridad, igualdad o inferioridad. El reconocimiento de las E.5 se debe al uso de más /menos / tan/ igual/ + adjetivo + que; más/ menos + adjetivo + de; tan / tanto + adjetivo + como; así como el uso de los adverbios más, menos, mejor, pero + que; tanto + nombre + como; cuanto… tanto y tal… cual. E.6: <decir> <que> <objeto> Incluimos en un grupo especial las oraciones sustantivas de objeto directo o completivas debido a la relación especial que existe entre el objeto (A¹) y la oración sustantiva porque el argumento A¹ funciona como objeto veracidad. Según algunos autores la oración completiva es la oración que se encuentra menos integrada dentro de la oración principal diferenciándose así del resto de las oraciones subordinadas. Este tipo de oraciones se suelen relacionar con el discurso indirecto y normalmente su verbo principal es un verbo que expresa un proceso cognitivo, del subtipo llamado de actitud proposicional (I. B OSQUE y V. D EMONTE 1999b: 1998), o verbo dicendi ( V . ANEXO II) que se refiere al acto de habla como: argumentar, concretar, criticar, denunciar, enfatizar, enunciar, esbozar, estipular, fallar y sentenciar. Otros verbos sin embargo, no siempre refieren al acto de habla como opinar, rechazar, decretar o bendecir. Como guía, seguimos la lista de verbos que se construyen con una subordinada sustantiva de objeto directo y que poseen objeto indirecto (I. BOSQUE y V. DEMONTE 1999b: 2073-2074). Una de las pruebas para saber si se trata de una E.6 es que su significado no varía al cambiar la oración a estilo directo. L. Rello — CORAL: Construcción de Objetos Representacional Aplicada al Lenguaje 34 E.7: <es> <objeto> <que> <subjuntivo> Considero a estas estructuras un tipo especial de E.1, en las que se relacionan dos objetos pero uno de ellos, el A¹, está formado por una oración subordinada en subjuntivo (V. ANEXO III). Las formas más comunes son: (no) es + conveniente, importante, necesario, imprescindible, interesante, posible, probable… + que + oración en subjuntivo. E.8: <si> <objeto,oración>, <objeto,oración> Este tipo de estructuras relacionan dos objetos siendo uno condición de otro, si <objeto> entonces <objeto>. Su estructura no casa con la estructura normal de la oración genérica. Si la E.8 expresa una condición real, el verbo de la oración con la conjunción si se conjuga en presente o el pretérito imperfecto del indicativo. (31) Si tengo hambre, me como un bocadillo, (32) Si ha llegado, entonces estará en clase. En el caso en el que la E.8 exprese una condición irreal, el verbo de la oración precedida de si estará conjugado en pretérito imperfecto o pretérito pluscuamperfecto del subjuntivo: (33) Si fuera rico tocaría con un violín en el tejado y (34) Si hubiera tenido suerte ya se hubiera ido a Jamaica. 5.3.3 Formas no personales La estructura normal siempre contaba con un verbo en forma personal excluyendo las formas de infinitivo, participio y gerundio. El infinitivo se reconoce porque acaba en una de las terminaciones siguientes: –ar, –er, –ir. Puede funcionar como un sustantivo si va precedido de artículos: (35) El sentir del pueblo, si va acompañado de pronominales (complementos directos o indirectos) éstos se sitúan detrás; (36) Habérmelo dicho puede funcionar como imperativo si lleva la preposición a delante; (37) ¡A dormir! expresa un aspecto acabado si se combina el infinitivo del verbo haber con la forma participio; (38) De haber sabido esto, me hubiera comprado toneladas de chocolatinas. También el infinitivo puede ir precedido de por adquiriendo sentido casual: (39) Por comer tanto chocolate, te pusiste como una foca. Y de la preposición al tomando sentido temporal y pasando por tanto a formar parte del objeto temporal (40) Al abrir la chocolatina rompió la tormenta. Asimismo, el infinitivo puede formar parte de las estructuras espaciales vistas antes, por ejemplo de la E.8 cuando el infinitivo va acompañado de con o de, ya que en estos caso equivale a una condición: (41) Con pre- L. Rello — CORAL: Construcción de Objetos Representacional Aplicada al Lenguaje 35 guntar, no se pierde nada y (42) De seguir así, acabaremos el chocolate de la nevera. Cuando el gerundio sigue a un verbo expresa simultaneidad (43) Me pilló comiendo chocolate. También puede funcionar como adverbio, si bien en estos casos el reconocimiento del gerundio como adverbio es complicado no hay que dejar de considerar que el gerundio al igual que los adverbios puede llevar diminutivos (44) Se fue a comprar chocolate andandito. Al igual que el infinitivo, el gerundio compuesto indica una acción acabada (45) Habiendo reordenado las chocolatinas de la estantería, me quedé más tranquila. El gerundio puede formar parte de oraciones complejas desempeñando diferentes valores (temporal, condicional, causal y concesivo) que trataremos en estudios posteriores. El participio presenta una complicación más que las formas no personales anteriores y es que en ocasiones puede funcionar como adjetivo y en ocasiones como verbo. Cuando funciona como verbo suele ir justo detrás del verbo haber y cuando funciona como adjetivo concuerda con el sustantivo en género y número. Si el participio sigue a los verbos ser o estar forman la voz pasiva, en el caso de estar, forman una pasiva de estado (46) El Chocolate está recién calentado. (47) El chocolate fue acompañado por churros. El participio puede participar en proposiciones subordinadas con valor temporal y causal, no obstante, dejaremos este tipo de formas para posteriores investigaciones (V. ANEXO IV). r 5.4 Valoración final De todo lo expuesto es fácil deducir la importancia del modelo aquí propuesto. Como ya se ha indicado, el lenguaje es el principal patrimonio del ser humano, siendo su herramienta fundamental, ya sea en su estudio sincrónico o diacrónico, en su faceta externa —como medio de comunicación—, o en su faceta interna —soporte para el pensamiento racional o al menos del consciente—. Conocer su estructura, modelizarlo y saber el porqué se emplea una u otra estructura, nos permitirá mejorar la comunicación con otros seres humanos, actuales o futuros, o incluso con nosotros mismos, descubriendo más fácilmente los fallos en los razonamientos o los problemas de interpretación. L. Rello — CORAL: Construcción de Objetos Representacional Aplicada al Lenguaje 36 Además este conocimiento nos permitirá proponer modificaciones en el propio lenguaje para adecuarlo más a su función. Ya hemos visto también que para acometer este monumental desafío es fundamental el apoyo de múltiples disciplinas, ya sean del área de humanidades, como la propia lingüística —verdadero motor del estudio—, la filosofía o la semiótica; del área más técnica, como la lógica, la matemática y, sobre todo, la informática; así como del área de las ciencias de la salud, como la psicología o la logopedia. En una u otra medida todas las disciplinas aportan algo, aunque para nuestra investigación las áreas más importantes sean la propia lingüística, la lógica-filosófica y la informática. Ciertamente esta multidisciplinariedad es un reto en nuestro mundo científico bastante empeñado en la especialización a ultranza. En este área necesitamos a veces de la rigidez de la lógica o de los sistemas informáticos y otras de la flexibilidad de las más difusas reflexiones filosóficas. Sin embargo el afán de conocimiento del ser humano, especialmente en lo que se refiere a sí mismo y a sus motivaciones, hacen que sea un placer profundizar en otras áreas diferentes de las que originalmente atrajeron nuestro interés. Tampoco caben dudas de la importancia social de este estudio. Como ya hemos indicado el lenguaje es el patrimonio más importante de la humanidad, así que todo lo que sea estudiarlo y modelizarlo debería aportar un beneficio a todos y cada uno de los seres humanos. Afortunadamente, el lenguaje todavía no está patentado y no pertenece a ninguna corporación o ser humano concreto así que las mejoras nos beneficiaran a todos. Sin duda queda mucho camino por recorrer, pero pensamos que aquí se establecen las bases para una nueva generación en los paradigmas lingüísticos. Seguramente ninguno de los ladrillos de la construcción son puramente originales, pero su combinación resulta absolutamente nueva. Hay que profundizar con estas bases, con estos axiomas, y ver a qué conclusiones, a qué teoremas llegamos. Estos teoremas y su adecuación a la realidad —que podremos comprobar con el formidable corpus electrónico que es Internet— nos permitirán conocer en qué medida este modelo es válido y en qué aspectos se debería profundizar. Para ello, excepto el tiempo y los conocimientos de los investigadores, el resto de recursos son fácilmente accesibles para cualquiera. Un ordenador, una conexión a Internet y una buena biblioteca es todo lo que se requiere para desarrollar el paradigma. Esto y la libertad intelectual de los investi- L. Rello — CORAL: Construcción de Objetos Representacional Aplicada al Lenguaje 37 gadores deben seleccionar de entre los conocimientos y modelos existentes qué sirve para su modelo y qué no sirve, sin atender a nombres o etiquetas más o menos aceptados por la comunidad científica. Quizá la verdad no esté en una corriente concreta sino en la correcta combinación de las aportaciones de cada una de ellas a pesar de que a veces resulta difícil moverse fuera de una corriente concreta. Esperamos que la formidable dificultad del desafío, aumentado por la paradójica situación de que el propio objeto de estudio sea la herramienta con la que se estudia, sea superada con las propuestas de ese modelo, que como trabajo original seguro que requiere de múltiples ajustes pero que sin duda propone numerosas ideas en este área, que en un futuro se consolidarán en este campo. Tan importante como la investigación científica es su difusión: coral está disposición de todo el mundo en: http://www.luzrello.com/coral.html, donde se incluyen más recursos para su divulgación. Todas las aportaciones son bienvenidas. L. Rello — CORAL: Construcción de Objetos Representacional Aplicada al Lenguaje 38 6. Bibliografía 6.1 Documentos impresos BACH, EMMON; HARMS, ROBERT T, Universals in linguistic theory, New York; London, Holt, Rinehart & Winston, 1968. BAKEL, JAN VAN, Automatic semantic interpretation: a computer model of understanding natural language, Dordrecht, Holland; Cinnaminson, U.S.A, Foris Publications, 1984. BATES, MADELEINE; WEISCHEDEL, RALPH M. (eds.), Natural language generation: Third International Conference, INLG 2004: Brockenhurst, UK, July 14-16, 2004: proceedings, Berlin, Springer, 2004. BELZ, ANJA; EVANS, ROGER; PIWEK, PAUL. (eds.), Challenges in natural language processing, Cambridge, Cambridge University Press, 1993. BOSQUE, IGNACIO; DEMONTE, VIOLETA (dir.), Gramática descriptiva de la lengua española. Vol. 1, Sintaxis básica de las clases de palabras, Madrid, Espasa Calpe, 1999a. BOSQUE, IGNACIO; DEMONTE, VIOLETA (dir.), Gramática descriptiva de la lengua española. Vol.2, Las construcciones sintácticas fundamentales; Relaciones temporales, aspectuales y modales, Madrid, Espasa Calpe, 1999b. BOSQUE, IGNACIO; DEMONTE, VIOLETA (dir.), Gramática descriptiva de la lengua española. Vol. 3, Entre la oración y el discurso; Morfología, Madrid, Espasa Calpe, 1999c. CHOMSKY, NOAM, Lectures on government and binding, Dordrecht, Foris, 1981. CHOMSKY, NOAM, El conocimiento del lenguaje, Madrid, Alianza, 1985. DIK, SIMON C., Gramática funcional, Madrid, Sociedad General Española de Librería, 1981. DIK, SIMON C., Functional grammar in Prolog: an integrated implementation for english, french, and dutch, Berlin; New York, Mouton de Gruyter, 1992. L. Rello — CORAL: Construcción de Objetos Representacional Aplicada al Lenguaje 39 DIK, SIMON C., The theory of functional grammar. Part 1, The structure of the clause, Berlin; New York, Mouton de Gruyter, 1997. FERNÁNDEZ LÓPEZ, Mª DEL CARMEN, Las preposiciones: valores y usos: construcciones preposicionales, Salamanca, Colegio de España, 1999. FILLMORE, CHARLES J., «The case of the case» en BACH, E. Universals in linguistic theory, New York; London, Holt, Rinehart & Winston, 1968. FORTESCUE, MICHAEL; HARDER, PETER; KRISTOFFERSEN, LARS (eds.), Layered structure and reference in a functional perspective: papers from the Functional Grammar Conference in Copenhagen 1990, Amsterdam, John Benjamins, 1992. F REGE , G OTTLOB , Estudios sobre semántica, New York; Barcelona, Orbis, 1985. GARCÍA VELASCO, DANIEL, Funcionalismo y lingüística: la gramática funcional de S.C. Dik, Oviedo, Universidad de Oviedo, 2003. GAZDAR, GERALD; FRANZ, ALEX, Natural language processing in the 1980s: a bibliography, Stanford, Center for the Study of Language and Information, 1987. G AZDAR , G ERALD ; M ELLISH , C HRIS , Natural language processing in LISP: an introduction to computational linguistics, Wokingham, AddisonWesley, 1989. GRISHMAN, RALPH, Computational Linguistics: an introduction, Cambridge, Cambridge University Press, 1986. H AUSSER , R OLAND , A computational model of natural language communication: interpretation, inference, and production in database semantics, Berlin; New York, Springer, 2006. HENGEVELD, KEES, «Parts of Spreech», en FORTESCUE, M., Layered structure and reference in a functional perspective, Amsterdam, John Benjamins, 1992. KEMPEN, GERARD, Natural language generation new results in artificial intelligence, psychology and linguistics, Dordrecht; Lancaster, Nijhoff, 1987. LEVINSON, STEPHEN C., Pragmática, Barcelona, Teide, 1989. LYONS, JOHN, Introducción al lenguaje y a la lingüística, Barcelona, Teide, 1984. MARTINET, ANDRÉ, Elementos de lingüística general, Madrid, Gredos, 1991. MEL’ČUK, IGOR; CLAS, ANDRÉ; POLGUÈRE, ALAIN, Introduction à la lexicologie explicative et combinatoire, Louvain-la-Neuve, Duculot, 1995. MEZIANE, FARID; MÉTAIS, ELISABETH (eds.), Natural language processing and information systems: 9th International Conference on Applications L. Rello — CORAL: Construcción de Objetos Representacional Aplicada al Lenguaje 40 of Natural Language to Information Systems, NLDB 2004: Salford, UK, June 23-25, 2004: proceedings, Berlin, Springer, 2004. N EWMEYER , F REDERICK J., Language form and language function, Cambridge (Massachusetts) London, MIT Press, 2000. PARTEE, BARBARA P., Montague grammar, San Diego, Academic Press, 1976. PARTEE, BARBARA P., Mathematical methods in linguistics, Dordrecht, Kluwer Academic Pub, 1990. SALAKOSKI, TAPIO (ed.), Advances in natural language processing: 5th International Conference on NLP, FinTAL 2006: Turku, Finland, August 23-25, 2006, Berlin, Springer, 2006. VICEDO, JOSÉ LUIS (ed.), Advances in natural language processing: 4th International Conference, EsTAL 2004: Alicante, Spain, October 20-22, 2004, Berlin, Springer, 2004. WANNER, LEO, Lexical functions in lexicography and natural language processing, Amsterdam; Philadelphia, J. Benjamins, 1996. WITTGENSTEIN, LUDWIG, Tractatus logico-philosophicus Tagebücher 1914-1916 Philosophische Untersuchungen, Frankfurt am Main, Suhrkamp, 1969. WITTGENSTEIN, LUDWIG, Investigaciones filosóficas, México, Universidad Autónoma de México, 2003. 6.2 Textos electrónicos DÍAZ VILLA, ANA MARÍA, “Tipología de errores gramaticales para un corrector automático” en Procesamiento del Lenguaje Natural, núm. 35, 2005, pp. 409-416. Disponible en Web: <http://www.sepln.org/revistaSEPLN/revista/35/50.pdf> MEL’ČUK, IGOR, “Levels of Dependency in Linguistic Description: Concepts and Problems” en AGEL, V., EICHINNGER, L., EROMS, H. W., HELLWIG, P., HERRINGER, H. J., LOBIN, H. (eds.), Dependency and Valency. An International Handbook of Contemporary Research, vol. 1, Berlin; New York, W. de Gruyter, 2003, pp. 188-229. Disponible en Web: <http://www.olst.umontreal.ca/FrEng/Dependency.pdf> RELLO, LUZ, Relaciones semánticas y funciones léxicas en términos que designan color y sus adjetivos derivados. Madrid, 2007. Disponible en Web: <http://www.luzrello.com/Escritos_files/rello-funciones_lexi cas_colores.pdf> L. Rello — CORAL: Construcción de Objetos Representacional Aplicada al Lenguaje 41 Anexo I Funciones léxicas de Mel’čuk y relaciones léxico-semánticas. Adaptación y recopilación realizada por el profesor Horcajada Diezma. Función Descripción Ejemplo A0 adjective A0(law)=legal Ai typical modifier for ith actant A1(surprise)=surprised Able i adjective for capability of ith actant Able1(read)=literate Adv0 adverb Adv0(honest)=honestly Advi adverbial for ith actant Adv1(dismay)=in dismay Anti antonym Anti(like)=dislike Bon “good” (expression of praise) Bon(advice)=sound Cap leader/chief Cap(school)=head Caus cause Caus(rise)=raise CausPredMinus cause to decrease CausPredMinus(price)=drop CausPredPlus cause to increase CausPredPlus(price)=increase L. Rello — CORAL: Construcción de Objetos Representacional Aplicada al Lenguaje 42 Función Descripción Ejemplo Centr centre/middle Centr(problem)=crux Cont continue ContOper 1(influence)=maintain Contr contrastive term Contr(heaven)=earth converse term Conv 21(more)=less Culm culmination Culm(anger)=paroxysm Degrad degrade, get worse Degrad(milk)=go/turn sour Equip team, crew Equip(hospital)=staff Excess function excessively Excess(heart)=palpitate Fact be realized Fact 0(dream)=come true Figur standard metaphor Figur(smoke)=cloud Fin cease, stop FinOper 1(influence)=lose nearly empty verb (keyword=subject) Func 0(silence)=reign Gener superordinate Gener(anger)=feeling Germ germ, core Germ(evil)=root Imper order, command Imper(silence)=shut up! Incep begin IncepFunc 0 (war)=break out Conv ij 0,1,2 Func 0,1,2 L. Rello — CORAL: Construcción de Objetos Representacional Aplicada al Lenguaje 43 Función Descripción Ejemplo IncepPredMinus start to decrease IncepPredMinus(price)=fall IncepPredPlus start to increase IncepPredPlus(price)=skyrocket Instr typical preposition (=with the help of) Instr(car)=by Involv keyword = subject Involv(smell)=fill [the room] Labor ij nearly empty verb : - ith actant = subject - jth actant = direct object Labor 12(consideration)=take into Liqu liquidate, delete Liqu(disease)=eradicate Loc locative prepositions Loc in(list)=on Magn intensifier Magn(bachelor)=confirmed Manif be manifest Caus1Manif(opinion)=express Minus less IncepPredMinus(price)=fall Mult regular group/set Mult(dog)=pack Nocer damage, attack Nocer(mosquito)=bite Obstr function with difficulty Obstr(voice)=falter Oper1,2 nearly empty (support) verb (keyword=subject) Oper1(attention)=pay ab/ad/in L. Rello — CORAL: Construcción de Objetos Representacional Aplicada al Lenguaje 44 Función Descripción Ejemplo Pejor worse CausPredPejor(prospect)=darken Perf perfective (completed action) S1Perf(marry)=spouse Perm permit Perm1Fact0(passion)=succumb to Plus more IncepPredPlus (price)=skyrocket Posi positive evaluation of ith actant Pos2(opinion)=favorable Pred predicate (= to be) Pred(actor)=act Prepar prepare PreparFact0(rifle)=load Propt typical preposition (= because of) Propt(fear)=for Prox on the verge of ProxFunc0(storm)=approach Quali Able i + highly probable Qual1(device)=deceitful Real1,2,... satisfy the requirements of Real1(promise)=keep Result result of an event Result(learn)=know S0 noun S0(die)=death Si typical noun for ith actant S1(murder)=murderer S instr typical instrument S instr(paint)=brush S loc typical place S loc(lion)=den L. Rello — CORAL: Construcción de Objetos Representacional Aplicada al Lenguaje 45 Función Descripción Ejemplo S med typical means S med(write)=ink S mod typical mode S mod(write)=handwriting S res typical result S res(copy v)=copy n Sing regular “portion” Sing(rice)=grain Son typical sound Son(elephant)=trumpet Sympt physical symptoms Degrad(speech) + Sympt23(surprise)=be speechless Syn synonym Syn(help)=aid V0 verb V0(advice)=advise Ver as it should be Ver(excuse)=legitimate Otras relaciones léxico-semánticas Función Descripción Ejemplo Unit unit of Unit(gravity)=g Part part of Part(table)=leg Child child/young of Child(horse)=foal Parent parent of Parent(lamb) =sheep Male male of Male(pig)=boar L. Rello — CORAL: Construcción de Objetos Representacional Aplicada al Lenguaje 46 Función Descripción Ejemplo Female female of Female(elephant)=cow Process typical noun of process S0Process(apply)= application Telic relation between instrument and verb Telic(rubber)=erase (see S instr) Spec specific term (hyponym) Spec(flower)=rose, tulipe, ...(see Gener) L. Rello — CORAL: Construcción de Objetos Representacional Aplicada al Lenguaje 47 Anexo II Verbos dicendi aceptar, achacar, aclarar, aconsejar, adelantar, adjudicar, adjurar, admitir, aducir, advertir, afirmar, agradecer, agregar, ahorrar, alegar, amonestar, anticipar, anunciar, añadir , arrancar, arrebatar, arrojar, arrullar, asegurar, atribuir, augurar , aullar, avanzar, avisar, balar, balbucear, balbucir, barbullar, berrear, bisbisear, bramar, cacarear, callar, censurar, certificar, chapurrear, chillar, chismorrear, clarificar, cloquear, comentar, comunicar, conceder, confesar, confiar, confirmar, consentir, contar, contestar, croar, cuchichear, deber, decir, declara, demandar, demostrar, denegar, desaconsejar, describir, desear, desmentir, detallar, dictar, discutir, disimular, enaltecer, encarecer, encargar, encomendar, encomiar, enseñar, esclarecer, esconder, escribir, escupir, especificar, espetar, evitar, exigir, explicar, explicitar, exponer, expresar, extirpar, facilitar, garantizar, gemir, gimotear, gorjear, gritar, gruñir, halagar, impedir, implorar, imponer, imposibilitar, imputar, inculcar, indicar, insinuar, inventar, invocar, jurar, ladrar, lanzar, largar, machacar, mandar, manifestar, mascullar, maullar, mencionar, mendigar, merecer, mostrar, mugir, murmurar, musitar, narrar, negar, notificar, objetar, ocultar, ofrecer, ordenar, otorgar, participar, pedir, perdonar, permitir, piafar, piar, plantear, posibilitar, precisar, predecir, presagiar, prescribir, pretender, pretextar, probar, profetizar, prohibir, prometer (hacer una acción futura), prometer (decir con insistencia), pronosticar, proponer, proporcionar, puntualizar, reafirmar, rebatir, rebuznar, recalcar, recelar, recetar, reclamar, recomendar, reconocer, recordar, recriminar, refunfuñar, refutar, regañar, reiterar, relatar, rechinchar, renegar, repetir, replicar, reprehender, reprochar, responder, revelar, rezongar, rogar, rugir, sacar, señalar, significar, silbar, silbotear, solicitar, soltar , sonsacar, sostener, sugerir, suplicar, sustentar, susurrar, tararear, telefonear, telegrafiar, transcribir, transmitir, valer, vaticinar, ventilar, vituperar, vociferar, vomitar L. Rello — CORAL: Construcción de Objetos Representacional Aplicada al Lenguaje 48 Anexo III Expresiones que rigen subjuntivo quizás tal vez (no) es (no) es (no) es (no) es (no) es (no) es (no) es conveniente que importante que imprescindible que interesante que necesario que posible que probable que Verbos que rigen subjuntivo agradecer alegrarse de no creer desear que dudar esperar extrañarse gustar que lamentar perdonar preferir que querer que sentir tener miedo de temer L. Rello — CORAL: Construcción de Objetos Representacional Aplicada al Lenguaje 49 Conjunciones más subjuntivo antes (de) que aunque cuando después (de) que mientras que para que tan pronto como sin que L. Rello — CORAL: Construcción de Objetos Representacional Aplicada al Lenguaje 50 Anexo IV Formas perifrásticas más frecuentes Significación progresiva a + infinitivo venir a + infinitivo volver a + infinitivo haber de + infinitivo haber que + infinitivo tener que + infinitivo deber de + infinitivo llegar a + infinitivo acabar de + infinitivo Significación durativa estar + gerundio ir + gerundio venir + gerundio seguir + gerundio andar + gerundio Significación perfectiva venir a + infinitivo acabar de + infinitivo llegar a + infinitivo alcanzar a + infinitivo llevar + participio tener + participio estar + participio ser + participio quedar + participio