Extracción de temas emergentes en textos cortos utilizando modelos de temas y discriminación de términos

dc.contributor.advisorLeoni de León, Jorge Antonioes_CR
dc.contributor.authorQuesada Grosso, Minor Eduardoes_CR
dc.date.accessioned2019-07-13T17:05:36Z
dc.date.accessioned2021-09-06T23:25:24Z
dc.date.available2019-07-13T17:05:36Z
dc.date.available2021-09-06T23:25:24Z
dc.date.issued2017es_CR
dc.descriptionTesis (maestría académica en computación e informática)--Universidad de Costa Rica. Sistema de Estudios de Posgrado, 2017es_CR
dc.description.abstractLa minería y explotación de datos contenidos en las redes sociales no solo ha sido foco de múltiples esfuerzos, sino que a pesar de los recursos y energía invertidos aún queda mucho por hacer dada su complejidad, la cual obliga a adoptar una perspectiva multidisciplinaria (Liu and Zhang, 2012). Concretamente, en lo que respecta a esta investigación, el contenido de los textos publicados regularmente, y a un ritmo muy acelerado, en los sitios de microblogs (por ejemplo, en Twitter) puede ser utilizado para analizar tendencias mundiales y locales como en países específicos. Estas tendencias en microblogs son marcadas por temas emergentes que se distinguen de los demás por un súbito y acelerado índice de citas asociadas a un mismo tema; es decir, por un aumento repentino de popularidad en periodos relativamente cortos, por ejemplo, un día o unas cuantas horas Wanner et al. (2014). El problema, entonces, es doble, primero hay que extraer los temas sobre los cuáles se escribe y, luego, hay que identificar cuales de esos temas son emergentes. Una solución reciente, conocida como Bursty Biterm Tapie Model (BBTM) (Yan et al:, 2015), es un algoritmo para identificación de temas emergentes, con un buen nivel de resultados en Twitter. Este algoritmo utiliza coocurrencias de palabras (bitérminos) para modelar los temas emergentes. De modo que en lugar de procesar cada palabra, el algoritmo debe procesar los múltiples bitérminos formados con ella. Esto provoca un aumento en el tiempo de ejecución necesario. De ahí, que esta investigación busca evaluar la introducción en BBTM de un mecanismo para discriminar los bitérminos con el fin de procesar sólo aquellos que sean más importantes y reducir así el tiempo de ejecución necesario.es_CR
dc.description.procedenceUCR::Investigación::Sistema de Estudios de Posgrado::Ingeniería::Maestría Académica en Computación e Informáticaes_CR
dc.identifier.urihttps://repositorio.sibdi.ucr.ac.cr/handle/123456789/7365
dc.language.isospaes_CR
dc.subjectALGORITMOS (COMPUTADORAS)es_CR
dc.subjectMINERIA DE DATOSes_CR
dc.subjectRECUPERACION DE INFORMACIONes_CR
dc.subjectRECURSOS DE BUSQUEDA DE INFORMACION ELECTRONICAes_CR
dc.subjectREDES SOCIALESes_CR
dc.subjectTWITTERes_CR
dc.titleExtracción de temas emergentes en textos cortos utilizando modelos de temas y discriminación de términoses_CR
dc.typetesis de maestríaes_CR

Archivos

Bloque original
Mostrando 1 - 1 de 1
Cargando...
Miniatura
Nombre:
42150.pdf
Tamaño:
5.12 MB
Formato:
Adobe Portable Document Format

SIBDI, UCR - San José, Costa Rica.

© Todos los derechos reservados, 2024