Download hacia una tipología de definiciones basada en el modelo analítico
Document related concepts
Transcript
HACIA UNA TIPOLOGÍA DE DEFINICIONES BASADA EN EL MODELO ANALÍTICO César Antonio Aguilar Gerardo Sierra Martínez Grupo de Ingeniería Lingüística Instituto de Ingeniería, UNAM Torre de Ingeniería, Cubículo 3, Basamento, Ciudad Universitaria México DF. C. P. 04510 E-mails: {caguilar, gsierram}@iingen.unam.mx WEB Page: http://iling.torreingenieria.unam.mx 1. Introducción La delimitación de una tipología de definiciones ha sido un problema abordado principalmente por la filosofía, la lexicografía y la terminología. En términos generales, una tipología de definiciones equivale a una clasificación o taxonomía que considera rasgos distintivos tales como el método seguido para formularlas, la clase de información conceptual que pueden expresar, sus unidades constitutivas, etc. El primer autor que ha planteado el modelo prototípico de una definición ha sido Aristóteles (Candel 1998, Modrack 2001), reconocido con el nombre de definición analítica. Si bien este modelo se ha mantenido hasta la fecha como patrón canónico, Sager y Ndi-Kimbi (1995), e igualmente Lara (2001, 2004) consideran la existencia de otros patrones de construcción identificables en textos científicos y técnicos. Siguiendo las observaciones hechas por Sager y Ndi-Kimbi, así como las de Lara, en este trabajo se propone una taxonomía de definiciones localizadas dentro de contextos definitorios (Alarcón 2003), la cual toma como base para su clasificación la presencia o ausencia de sus dos unidades básicas: género próximo y diferencia específica. En concreto, dicha taxonomía se compone de 4 tipos: analíticas, sinonímicas, funcionales y extensionales. La estructura a seguir en este trabajo es la siguiente. En el apartado 2 se da una descripción, grosso modo, sobre lo que es una definición analítica. En el apartado 3 se establece una distinción entre definiciones, explicaciones y descripciones. En el apartado 4 se delinea la tipología de definiciones a partir de su ubicación en un contexto definitorio, junto con la descripción de sus características. En el apartado 5 se muestran algunos ejemplos obtenidos de dos corpus de documentos técnicos. Finalmente, en el apartado 6 se ofrecen algunas consideraciones sobre la tipología aquí planteada. 2. La definición analítica Tanto la lexicografía y la terminología parten del modelo analítico para formular su concepción sobre lo que es una definición. Para Aristóteles, la definición representa la formulación lingüística de un conocimiento científico obtenido a partir de una demostración (Candel 1998). Tal formulación tiene como fin responder a la pregunta ¿qué cosa es X? En aras de responder a esta pregunta, la definición se compone de dos elementos: género próximo y diferencia específica. El género próximo es el elemento que indica, a través de una relación semántica de hiperonimia, a qué clase pertenece una entidad referida por un vocablo o un término. En contraparte, la diferencia específica es el elemento que expone cuáles son las propiedades particulares de dicha entidad respecto a su clase, estableciendo una serie de relaciones semánticas tales como las de hiponimia, meronomia, holonimia, télica1 y otras. Un rasgo a destacar en la definición analítica es su estrecha relación con estructuras sintácticas de índole predicativa (Bäck 2000, Modrak 2001). Para Aristóteles, una predicación, más que una estructura lingüística, es una proposición lógica que permite expresar un conocimiento verdadero sobre las propiedades esenciales de una entidad (Allan 2004). Ahondando en esta cuestión, Bäck (2000) observa que para Aristóteles el verbo ser adquiere un valor importante, ya que le permite expresar de forma descriptiva cuál es el tipo de existencia que asume un sujeto conforme a las características que puedan predicarse de él en un contexto dado. Así, p. e., una predicación del tipo Sócrates es mortal, debe ser entendida como Sócrates existe (o tiene su existencia) como mortal (en este momento). Para Tugendhat (2003), de hecho, este valor que adquiere la predicación permite suponer que Aristóteles, más que desarrollar un modelo lógico de representación del conocimiento, en realidad propone una semántica formal sustentada en dos elementos: I. Los términos de la predicación. II. El verbo ser con un sentido de existencia (y, mutatis mutandis, cualquier verbo que pueda predicar algo sobre las cualidades de un objeto), el cual manifiesta la forma de existencia que asumen tales términos en una situación dada. Cercanos a esta visión sobre las relaciones que se dan entre la definición analítica y la predicación, Sager y Ndi-Kimbi (1995), situados desde una perspectiva terminológica, explican que dentro de textos científicos y técnicos es posible reconocer por lo menos dos variantes: a) Una variante constituida a partir de un patrón básico aquellos asociado al verbo ser, en donde se configura una estructura del tipo X [es un] Y + Z, en donde X es un término a definir, Y es un concepto superior (género próximo), y Z es un complemento que caracteriza al término de manera individual (diferencia específica), p. e.: el número de KC es un factor determinante de los valores de los coeficientes hidrodinámicos. b) Patrones complejos: aquellos que en un plano sintáctico se configuran a partir de un enunciado que introduce una oración de relativo siguiendo una estructura del tipo: X [es un] Y [(que/la cual/el cual/cuyo) + verbo] + Z, en donde X es un término a definir, Y es un concepto superior (género próximo), y Z es un complemento (diferencia específica) introducido por una partícula de relativo, así como un verbo que indica algún rasgo particular de dicho término. Por ejemplo: un programa es una secuencia de instrucciones que sirve para resolver un problema. 1 Por relación télica se entiende, de acuerdo con Pustejovsky (1991), aquella relación léxico-semántica que describe cuál es el propósito o función que tiene una entidad, p. e., una computadora {sirve para /se emplea/permite} hacer operaciones lógicas y matemáticas. A partir de estos patrones descritos por Sager y Ndi-Kimbi, derivados del modelo analítico, puede hacerse una distinción entre una definición canónica de aquello que puede ser considerado como una explicación o una descripción. 3. Definiciones, explicaciones y definiciones Pozzi (2006) plantea que definiciones, explicaciones y descripciones son estructuras lingüísticas útiles para expresar información conceptual asociada a un término. La diferencia entre estas tres estructuras es, por una parte su patrón de codificación en lengua natural, y por otra la clase de información que presentan. Tomando en cuenta estas dos diferencias, se pueden describir dichas estructuras del siguiente modo: Definición. Se trata de un enunciado con una secuencia sujeto + predicado, el cual configura una definición analítica compuesta por un género próximo y una diferencia específica. Explicación. Se trata de una clase de texto destinado a clarificar las causas, el contexto y las consecuencias de una entidad o de un evento. Igualmente, en algunos casos se consideran también las reglas o leyes que subyacen. Un rasgo distintivo que Pozzi ha identificado en su análisis de documentos médicos (2006), es la presuposición de que el lector cuenta con un mínimo conocimiento sobre el tema a tratar. Descripción. Se trata de una representación detallada y ordenada sobre lo que es una entidad o un evento específico, usando para ello unidades tales como frases nominales definidas, partículas deícticas (pronombres, adjetivos o adverbios), mecanismos de repetición, entre los más relevantes2. Contrastando las características que presentan definiciones, explicaciones y descripciones, se observa que en el caso de las primeras, éstas se configuran dentro de un plano gramatical en forma de predicaciones, siguiendo en esto el comportamiento descrito por Sager y Ndi-Kimbi. Respecto a las explicaciones y descripciones, ambas tienden a estructurarse como textos que pueden ser breves o extensos, los cuales mantienen una cohesión temática relacionada con la información conceptual que se asocia a un término. Dicha información conceptual puede asociar al término con otros dentro de una misma explicación o descripción, por lo que más que dar una síntesis sobre un concepto — que es el caso de la definición—, lo que se busca es clarificar de la manera más precisa el concepto representado por el término dentro de un campo de conocimiento. Retomando el hecho de que las definiciones gramaticalmente se codifican en predicaciones, para este trabajo se ha considerado como definición canónica aquella que presente tres rasgos mínimos: I. Contar con una estructura predicativa sujeto + predicado, o alguna variante posible. II. Hacer explícita una relación entre un género próximo y una diferencia específica. III. Proporcionar una síntesis respecto de la información conceptual que se asocia a dicha definición. 2 Al respecto, puede verse a Lyons (1983). 4. Definiciones situadas en contextos definitorios Como se ha señalado al principio, a partir del modelo analítico se han derivado varias propuestas por formular una taxonomía de definiciones posibles, entre las cuales pueden destacarse las que proponen Robinson (1965), Sager y Ndi-Kimbi (1995), Lara (1997, 2004), Pearson (1998), por mencionar algunas. Tomando en cuenta estas propuestas, Sierra et al (2003, 2006) han desarrollado una tipología de definiciones derivada del modelo analítico, con miras a identificar automáticamente sus patrones de constitución en textos, específicamente dentro de un contexto definitorio (CD), el cual equivale a un fragmento discursivo en donde se introducen y asocian un término con una definición. Para establecer dicha asociación, se emplean una serie de conectores lingüísticos tales como predicaciones verbales, patrones pragmáticos y marcas tipográficas (Alarcón 2003). Existen dos rasgos importantes que permiten reconocer distintos tipos de definiciones posibles en CDs: a) La clase de verbo que opera como núcleo de una predicación que ligue a un término con su definición. b) La presencia o ausencia explícita del género próximo y la diferencia específica. En el caso del primer rasgo, Aguilar et al (2004), junto con Sierra et al (2008) han analizado desde un enfoque sintáctico de qué forma la predicación influye en la selección de la clase de definición asociable a un término. Con relación al segundo rasgo, en este trabajo se describe de qué manera influyen tanto el género próximo como la diferencia específica en la configuración de tales clases de definiciones. Básicamente, se reconocen 4 tipos de definiciones: Definición analítica: se da una definición de este tipo cuando el género próximo y la diferencia específica aparecen de manera explícita dentro de una definición. Definición sinonímica: se da cuando en una definición sólo se hace explícito el género próximo, de tal manera que el género próximo establece una equivalencia conceptual con el término que es definido. Definición funcional: se da cuando sólo se hace explícita la diferencia específica, la cual ofrece una definición de un concepto a partir de su uso o aplicación en una situación dada. Definición extensional: se da cuando sólo se hace explícita la diferencia específica, la cual presenta una definición que enumera los componentes que conforman un objeto representado por el término a definir. Esta enumeración de componentes sigue un orden basado en relaciones del que van de un todo hacia las partes, o de las partes hacia el todo Junto con esta formulación explícita que se haga del género próximo y/o de la diferencia específica, estas 4 clases de definiciones mantienen relación con el verbo que configura la predicación que las asocia con un término. Dependiendo del verbo que opere como núcleo de tal predicación, se observa un patrón sintáctico en donde el género próximo y la diferencia específica se sitúan en posiciones de sujeto, objeto o predicado. Por ejemplo, cuando la predicación se construye en torno al verbo ser, se observa un patrón sujeto + predicado, en donde el sujeto representa al término a definir, y el predicado introduce la definición, p. e.: [Un algoritmo] Sujeto es [un conjunto de instrucciones para una computadora] Predicado. En contraparte, verbos como definir, considerar, entender, interpretar, etc., fijan un patrón del tipo sujeto + objeto + predicado, haciendo explícito quién es el autor de la definición, situado en posición de sujeto, mientras que el término a definir pasa a ocupar la posición de objeto, p. e.: [Turing] Sujeto define [algoritmo] Objeto [un conjunto de instrucciones para una computadora] Predicado. Un hecho que se observa en los dos ejemplos, es que el género próximo aparece representado en forma de frase nominal, mientras que la diferencia específica puede expresarse en forma de algún tipo de frase (p. e., prepositiva, adjetiva o adverbial), o de oración de relativo introducida por un pronombre (que/la cual/el cual/cuyo, quien, etc.). En lo que se refiere a las definiciones sinonímicas, la predicación introduce una definición que únicamente hace explícito el género próximo, sin considerar ningún tipo de diferencia específica. El género próximo establece una relación de equivalencia con el término a definir en un nivel conceptual, p. e.: [un maremoto] Sujeto equivale a [un tsunami] Predicado. Para el caso de las definiciones funcionales, se reconoce únicamente la presencia explícita de la diferencia específica, la cual describe como rasgo distintivo de un objeto su función u operabilidad en un contexto dado, p. e.: [una computadora] Sujeto sirve para [procesar problemas y resultados lógicos, matemáticos y/o estadísticos] Predicado. Finalmente, respecto a las definiciones extensionales, la predicación introduce una definición en donde se hace explícita la diferencia específica (sin mencionar el género próximo). La clase de información conceptual asociada a estas definiciones puede ser de dos tipos: a) enumeración de las partes o componentes que integran un objeto; b) listado de todos aquellos objetos que conforman un conjunto, p. e.: [una computadora] Sujeto cuenta con [un hardware, un software, así como una serie de unidades periféricas] Predicado. 5. Ejemplos obtenidos de corpus técnicos Partiendo de esta tipología de definiciones, se han realizado algunos experimentos de extracción automática en dos corpus de documentos técnicos: el Corpus Lingüístico de Ingeniería o CLI (Medina et al 2004), y el Corpus de Informática en Español o CIE (L’Homme y Drouin 2006). Respecto al CLI, se trata de un corpus lingüístico conformado por documentos especializados en formato plano (.TXT), orientados hacia distintas áreas de ingeniería, desarrollado por el Grupo de Ingeniería Lingüística (GIL), que cuenta con alrededor de 500, 000 palabras3. Por su parte, el Groupe Éklectic, afiliado al departamento de lingüística y traducción de la Universidad de Montreal, ha compilado y organizado el CIE, el cual es un corpus de documentos técnicos cuyo contenido va dirigido hacia las áreas de informática y ciencias de la computación4. Para realizar el proceso de reconocimiento de patrones asociados a definiciones, se usó una herramienta diseñada en lenguaje Python, la cual es una variante de un sistema para búsqueda de operadores metalingüísticos en inglés diseñado por 3 Para mayores detalles sobre el CLI véase el sitio WEB www.iling.unam.mx/index.php. Para mayores detalles sobre este corpus, puede consultarse el sitio WEB del grupo Écklectic: http://olst.ling.umontreal.ca/ 4 Rodríguez (2004)5. Tal herramienta ejecuta las búsquedas en archivos electrónicos a partir patrones lingüísticos asociados a definiciones. Posterior a esta búsqueda, se realizó una revisión manual que permitió determinar cuáles eran los mejores candidatos a definiciones canónicas, descartando aquellos que no lo fueran. Entre los patrones lingüísticos asociados a definiciones que hacían explícito tanto el género próximo como la diferencia específica se han reconocido dos: aquellas definiciones ligadas a predicaciones primarias (p. e., con el verbo ser), y aquellas que se ligaban a predicaciones secundarias (p. e., verbos como definir, concebir, entender, y otros similares). Ejemplos de patrones vinculados a predicaciones primarias son: 5.1. El contenedor refrigerado es [una forma especializada] Género próximo [de transporte de perecederos] Diferencia específica. 5.2. Un esquema XML representa [el significado] Género información recibida desde una aplicación] Diferencia específica. próximo [de la 5.3. Escalada deslizante de gestionabilidad se refiere a [los diferentes niveles de administración] Género próximo [que los servidores en su infraestructura requieren] Diferencia específica. Los ejemplos anteriores pueden contrastarse con otros patrones en donde la definición analítica aparece ligada a una predicación secundaria: 5.4. Carlos Godino define la arquitectura naval como [la ciencia] Género próximo [que trata de los conocimientos necesarios para la construcción de los buques] Diferencia específica. 5.5. Podemos considerar las computadoras programables modernas como [la evolución] Género próximo [de sistemas antiguos de cálculo o de ordenación] Diferencia especifica. 5.6. Se conoce como reenganche rápido a [la operación] Género próximo [de cierre de un interruptor después de una falla definición] Diferencia específica. Respecto a las definiciones sinonímicas, el patrón que asumen las definiciones al ser introducidas por una predicación equivale a una secuencia conformada por una frase nominal junto con sus modificadores. Ejemplos de esto son: 5.7. La tensión de base se llama [tensión de unidad] Género próximo. 5.8. La tensión de tierra V equivale a [la máxima diferencia del potencial] Género próximo. 5.9. La fuerza proporcional a la aceleración se nombra [fuerza de inercia] Género próximo. En el caso de las definiciones funcionales, éstas pueden aparecer asociadas a predicaciones primarias, ofreciendo una descripción sobre el tipo de operación que 5 En el sitio WEB: http://turing.iimas.unam.mx/~crodriguezp/cdrom/index.html, pueden verse más detalles respecto a esta herramienta de búsqueda. puede desempeñar un la entidad referida por un término, o bien puede indicar en qué contexto se realiza tal operación. En este tipo de definiciones, sólo se hace explícita la diferencia específica. 5.10. La técnica de velocimetría de imágenes de partícula permite [medir la velocidad de un campo de flujo bi o tri dimensional] Diferencia específica. 5.11. La PDA permite [una captura de información más rápida y ágil] Diferencia específica. 5.12. Una clase escrita en COBOL puede servir [de base para otra implementada con C# o Visual Basic] Diferencia específica. Finalmente, las definiciones extensionales se vinculan regularmente a predicaciones primarias, cuyo predicado únicamente expresa una diferencia específica que enumera o enlista una serie de componentes o de partes que integran una entidad. Otra variante sería la enumeración de los miembros que conforman un conjunto, de acuerdo con la relación todo/parte que proponen Vossen y Copestake (1993). Véanse los siguientes ejemplos: 5.13. El circuito carrier puede consistir de [dos o tres alambres de línea o de un alambre con retorno a tierra] Diferencia específica. 5.14. El apartarrayos tipo autovalvular consiste de [varias chapas de explosores conectados en serie] Diferencia específica. 5.15. La Terminal de Contenedores cuenta con [dos muelles de atraque, el muelle del Bufadero y el muelle del Dique del Este] Diferencia específica. 6. Consideraciones finales A grandes rasgos, en este trabajo se ha delineado una propuesta de tipología de definiciones, las cuales han sido derivadas del modelo analítico desarollado por Aristóteles. Considerando al modelo analítico como un patrón canónico, resulta viable generar nuevas clases de definiciones a partir de dos rasgos: a) La presencia/ausencia explícita del género próximo o la diferencia específica dentro de una definición situada en un CD. b) El tipo de predicación que asocie a tal definición con su correspondiente término. Estos dos rasgos permiten reconocer de qué manera tanto el género próximo como la diferencia específica son expresadas a través de frases y oraciones, lo que resulta útil para realizar tareas automáticas de definiciones en textos científicos. Si bien en este trabajo se ha hecho una descripción resumida de tales patrones, es posible vislumbrar algunas vías a seguir para la aplicación de esta tipología en tareas de búsqueda automática: Delinear una gramática que dé cuenta de los patrones de frase recurrentes en las 4 clases de definiciones deducibles de la tipología propuesta. Evaluar estadísticamente cuál es el grado de asociación existente entre predicaciones y definiciones, de modo que, dado cierto tipo de predicación, se pueda establecer un umbral de probabilidad para identificar la clase de definición que se une a dicha predicación. Contrastar los datos que se obtengan con los que arrojen experimentos similares obtenidos de otros corpus de documentos técnicos y científicos. Referencias Bibliografía general Aguilar, César, Alarcón, Rodrigo, Rodríguez, Carlos y Sierra, Gerardo (2004): “Reconocimiento y clasificación de patrones verbales definitorios en corpus especializados”, en Cabre T., Estopà R. y Tebé C. (eds.), La terminología en el siglo XXI, Barcelona, IULA-UPF: 259-269. Alarcón, Rodrigo (2003): Análisis lingüístico de contextos definitorios en textos de especialidad, tesis de licenciatura, México, UNAM. Aristóteles (1998): Tratados de lógica (Organon), traducción y edición de M. Candel Sanmartín, 2 tomos, Madrid, Gredos. Bäck, Allan (2000): Aristotle`s Theory of Predication, Leiden/Boston, Brill. Lara, Luis Fernando (2001): Ensayos de teoría semántica, México, COLMEX. Lara, Luis Fernando (2004): De la definición lexicográfica, México, COLMEX. Lyons, John (1983): Lenguaje, significado y contexto, Barcelona, Paidós. Modrak, Deborah K. W. (2001): Aristotle’s Theory of Language and Meaning, Cambridge, Cambridge University Press. Pearson, Jennifer (1998): Terms in Context, Philadelphia, John Benjamins. Pozzi, María (2006): “Estudio de los diferentes tipos de descripción de conceptos especializados de acuerdo con las diferentes necesidades comunicativas del destinatario final: un estudio de caso en el campo de la cardiología”, en Cabre T., Estopà R. y Tebé C. (eds.), La terminología en el siglo XXI, Barcelona, IULA-UPF: 629-642. Pustejovsky, James (1991): “The Generative Lexicon”, Computational Linguistics, 17(4): 409-441. Rodríguez, Carlos (2004): Metalinguistic Information Extraction from specialized texts to enrich computational lexicons. Tesis de Doctorado, Barcelona, Universidad Pompeu Fabra. Sager, Juan C. y Ndi-Kimbi, August (1995): “The conceptual structure of terminological definitions and their linguistic realisations”, Terminology 2(1): 87-106. Sierra, Gerardo, Alarcón, Rodrigo, Medina, Alfonso y Aguilar, César (2003b): “Definitional Contexts Extraction from Specialised Texts”, en LewandowskaTomaszczyk, B. (ed.), PALC 2003 Proceedings: Language, Corpora and ELearning, Frankfurt, Peter Lang Publish: 21-31. Sierra, Gerardo, Alarcón, Rodrigo, Aguilar, César y Barrón, Alberto (2006): “Towards the Elaboration of a Corpus of Definitional Contexts”, en Corino E., Marello C. y Onesti C. (eds.), Proccedings of XII EURALEX Internacional Congress, Alessandria, Edizioni dell’Orso: 229-240. Sierra, Gerardo, Alarcón, Rodrigo, Aguilar, César y Bach, Carme (2008): “Definitional Verbal Patterns for Semantic Relation Extraction”, en Auger A. y Barrière C. (eds.), Pattern-based Approaches to Semantic Relation Extraction. Special issue of Terminology, 14(1): 74–98. Tugendhat, Ernst (2003): Introducción a la filosofía analítica, traducción de Navarro J., Barcelona, Gedisa. Vossen, Piek y Copestake, Anne (1993): “Defaults in Lexical Representation”, en Briscoe T., Paiva V. y Copestake A. (eds.), Inheritance, Defaults and the Lexicon, Cambridge, Cambridge University Press: 246-274. Corpus de consulta Medina A. Sierra G. Garduño G. Méndez C. Saldaña R. (2004): “CLI: An Open Linguistic Corpus for Engineering”, en De Ita, G. Fuentes, O. Galindo, M, (eds.), Proceedings of IX Ibero-American Workshop on Artificial Intelligence, Puebla, México, BUAP: 203-208. L’Homme, Marie-Claude y Drouin, Patrick (2006): Corpus de Informática para el español, Groupe Éklectick- OLST, Montréal, Université de Montréal. Sitio electrónico: www.olst.umontreal.ca.