Automatización del análisis sintáctico para el español americano con el fin de crear un Treebank estandarizado

Sandí Salazar, Minor

Automatización del análisis sintáctico para el español americano con el fin de crear un Treebank estandarizado

dc.contributor.advisor	Marín Raventós, Gabriela	es_CR
dc.contributor.author	Sandí Salazar, Minor	es_CR
dc.date.accessioned	2020-03-10T15:15:36Z
dc.date.accessioned	2021-09-06T23:25:23Z
dc.date.available	2020-03-10T15:15:36Z
dc.date.available	2021-09-06T23:25:23Z
dc.date.issued	2017	es_CR
dc.description	Tesis (maestría académica en computación e informática)--Universidad de Costa Rica. Sistema de Estudios de Posgrado, 2017	es_CR
dc.description.abstract	Esta investigación se orienta hacia el análisis de textos que han sido etiquetados morfológicamente. Estos textos son analizados por lingüistas para asignar a cada palabra su función sintáctica en la oración a la que pertenecen. Este proceso generalmente es manual. Cada oración es analizada elemento por elemento hasta completar su análisis y proseguir con otra. Cuando la cantidad de oraciones es grande, el tiempo invertido por los lingüistas es considerable, pudiendo absorber espacios requeridos por el investigador para otras tareas. Las investigaciones en procesamiento de lenguaje natural buscan automatizar parcial o totalmente los análisis morfosintácticos. Cada equipo de expertos ha generado su propio etiquetado de categorías gramaticales y funciones sintácticas, siguiendo una corriente de análisis del lenguaje natural. Dos de ellas son la gramática generativa y la gramática de dependencias. Un alto porcentaje de las investigaciones mencionadas se ha hecho para lenguas como el inglés, alemán y chino, por citar algunas. El análisis para el español se inició después, enfatizándose las investigaciones en su variante peninsular y no en la americana. En los últimos años surgió una tendencia en la que varias investigaciones han desarrollado etiquetados morfosintácticos para estandarizar el análisis con formatos universales. Dicho de otra forma, pueden emplearse para analizar varias lenguas con un mismo formato. Esta tesis recopila información sobre algunos textos analizados en español para determinar sus características y ofrecer un posible punto de partida para posteriores investigaciones. Se incluye un inventario de etiquetados morfosintácticos usados en estos textos anotados, para hallar semejanzas y diferencias entre estos. El fin es comparar estos formatos, para determinar el más útil a la hora de estandarizar los análisis. También se examinan conjuntos de oraciones en español cuyas palabras poseen un sistema...	es_CR
dc.description.procedence	UCR::Investigación::Sistema de Estudios de Posgrado::Ingeniería::Maestría Académica en Computación e Informática	es_CR
dc.identifier.uri	https://repositorio.sibdi.ucr.ac.cr/handle/123456789/13370
dc.language.iso	spa	es_CR
dc.subject	ANALISIS LINGUISTICO	es_CR
dc.subject	ESPAÑOL - SINTAXIS	es_CR
dc.subject	LINGUISTICA COMPUTACIONAL	es_CR
dc.subject	TRADUCCION AUTOMATICA	es_CR
dc.title	Automatización del análisis sintáctico para el español americano con el fin de crear un Treebank estandarizado	es_CR
dc.type	tesis de maestría	es_CR

Archivos

Bloque original

Mostrando 1 - 1 de 1

Nombre:: 42011.pdf
Tamaño:: 4.47 MB
Formato:: Adobe Portable Document Format

Descargar

Colecciones

Maestría en Computación e Informática