Automatización del análisis sintáctico para el español americano con el fin de crear un Treebank estandarizado

dc.contributor.advisorMarín Raventós, Gabrielaes_CR
dc.contributor.authorSandí Salazar, Minores_CR
dc.date.accessioned2020-03-10T15:15:36Z
dc.date.accessioned2021-09-06T23:25:23Z
dc.date.available2020-03-10T15:15:36Z
dc.date.available2021-09-06T23:25:23Z
dc.date.issued2017es_CR
dc.descriptionTesis (maestría académica en computación e informática)--Universidad de Costa Rica. Sistema de Estudios de Posgrado, 2017es_CR
dc.description.abstractEsta investigación se orienta hacia el análisis de textos que han sido etiquetados morfológicamente. Estos textos son analizados por lingüistas para asignar a cada palabra su función sintáctica en la oración a la que pertenecen. Este proceso generalmente es manual. Cada oración es analizada elemento por elemento hasta completar su análisis y proseguir con otra. Cuando la cantidad de oraciones es grande, el tiempo invertido por los lingüistas es considerable, pudiendo absorber espacios requeridos por el investigador para otras tareas. Las investigaciones en procesamiento de lenguaje natural buscan automatizar parcial o totalmente los análisis morfosintácticos. Cada equipo de expertos ha generado su propio etiquetado de categorías gramaticales y funciones sintácticas, siguiendo una corriente de análisis del lenguaje natural. Dos de ellas son la gramática generativa y la gramática de dependencias. Un alto porcentaje de las investigaciones mencionadas se ha hecho para lenguas como el inglés, alemán y chino, por citar algunas. El análisis para el español se inició después, enfatizándose las investigaciones en su variante peninsular y no en la americana. En los últimos años surgió una tendencia en la que varias investigaciones han desarrollado etiquetados morfosintácticos para estandarizar el análisis con formatos universales. Dicho de otra forma, pueden emplearse para analizar varias lenguas con un mismo formato. Esta tesis recopila información sobre algunos textos analizados en español para determinar sus características y ofrecer un posible punto de partida para posteriores investigaciones. Se incluye un inventario de etiquetados morfosintácticos usados en estos textos anotados, para hallar semejanzas y diferencias entre estos. El fin es comparar estos formatos, para determinar el más útil a la hora de estandarizar los análisis. También se examinan conjuntos de oraciones en español cuyas palabras poseen un sistema...es_CR
dc.description.procedenceUCR::Investigación::Sistema de Estudios de Posgrado::Ingeniería::Maestría Académica en Computación e Informáticaes_CR
dc.identifier.urihttps://repositorio.sibdi.ucr.ac.cr/handle/123456789/13370
dc.language.isospaes_CR
dc.subjectANALISIS LINGUISTICOes_CR
dc.subjectESPAÑOL - SINTAXISes_CR
dc.subjectLINGUISTICA COMPUTACIONALes_CR
dc.subjectTRADUCCION AUTOMATICAes_CR
dc.titleAutomatización del análisis sintáctico para el español americano con el fin de crear un Treebank estandarizadoes_CR
dc.typetesis de maestríaes_CR

Archivos

Bloque original
Mostrando 1 - 1 de 1
Cargando...
Miniatura
Nombre:
42011.pdf
Tamaño:
4.47 MB
Formato:
Adobe Portable Document Format

SIBDI, UCR - San José, Costa Rica.

© Todos los derechos reservados, 2024