Arquitectura de Big Data para el Análisis de Sentimientos Multimodales en el Sector Turístico del Departamento de Boyacá, Colombia

dc.contributor.advisorMonsalve Pulido, Julián Alberto
dc.contributor.authorAlgecira Arbelaez, Cristian David
dc.contributor.corporatenameUniversidad Santo Tomásspa
dc.contributor.cvlachttps://scienti.minciencias.gov.co/cvlac/visualizador/generarCurriculoCv.do?cod_rh=0001883154Spa
dc.contributor.cvlachttps://scienti.minciencias.gov.co/cvlac/visualizador/generarCurriculoCv.do?cod_rh=0000499030Spa
dc.contributor.orcidhttps://orcid.org/0000-0002-0706-5881Spa
dc.coverage.campusCRAI-USTA Tunjaspa
dc.date.accessioned2021-07-26T22:03:36Z
dc.date.available2021-07-26T22:03:36Z
dc.date.issued2021-07-13
dc.descriptionEl presente proyecto propone el desarrollo de una arquitectura de Big data que permita evaluar la satisfacción de los usuarios del sector turístico del departamento de Boyacá Colombia mediante el análisis de sentimientos multimodales, a través de una serie de parámetros en la extracción de datos a herramientas como Booking, TripAdvisor y twitter, facilitando el análisis de los sentimiento del usuario por medio de variables de polaridad, esto con tal de conocer la opinión de los usuarios frente al sector turístico del departamento de Boyacá. El proyecto atiende a tres puntos fundamentales dentro del desarrollo de la arquitectura: extracción de datos, análisis de datos y visualización. Dichos puntos establecen un punto de partida dentro del desarrollo de la arquitectura; puesto que los subpuntos de los tres parámetros iniciales buscan el buen funcionamiento y desarrollo de la arquitectura. La extracción comprende el uso de la herramienta webs scraper encargada de la extracción de datos de las herramientas ya mencionadas para posterior uso en el segundo parámetro, el análisis; en este punto se pretende que los datos obtenidos de la extracción se sometan al proceso de polaridad que permita determinar las emociones y opiniones de los usuarios frente a sus visitas; esto para finalmente en el proceso de visualización los datos obtenidos como resultados puedan ser plasmados en gráficas que permiten su entendimiento y comprensión. Finalmente, el proyecto presenta una serie de conclusiones frente a los resultados obtenidos con la arquitectura. La arquitectura está basada en el proyecto de investigación Doctoral de la Pontificia Universidad Javeriana “Modelo multimodal para el análisis de sentimientos en un dominio turístico”.spa
dc.description.abstractThis project proposes the development of a Big data architecture that allows evaluating the satisfaction of users of the tourism sector in the department of Boyacá Colombia through the analysis of multimodal sentiments, through a series of parameters in the extraction of data to tools such as Booking, TripAdvisor and twitter, facilitating the analysis of user sentiment through polarity variables, this in order to know the opinion of users regarding the tourism sector of the department of Boyacá. The project addresses three fundamental points within the development of the architecture: data extraction, data analysis and visualization. These points establish a starting point within the development of architecture; since the sub-points of the three initial parameters seek the proper functioning and development of the architecture. The extraction includes the use of the web scraper tool in charge of extracting data from the aforementioned tools for later use in the second parameter, the analysis; At this point, it is intended that the data obtained from the extraction be subjected to the polarity process that allows determining the emotions and opinions of the users regarding their visits; this for finally in the visualization process the data obtained as results can be captured in graphs that allow their understanding and comprehension. Finally, the project presents a series of conclusions regarding the results obtained with architecture based on its objective.spa
dc.description.degreelevelPregradospa
dc.description.degreenameIngeniero Informáticospa
dc.format.mimetypeapplication/pdfspa
dc.identifier.citationAlgecira Arbelaez, C. D. (2021). Arquitectura de Big Data para el Análisis de Sentimientos Multimodales en el Sector Turístico del Departamento de Boyacá, Colombia. [Trabajo de Grado, Universidad Santo Tomás]. Repositorio Institucional.spa
dc.identifier.instnameinstname:Universidad Santo Tomásspa
dc.identifier.reponamereponame:Repositorio Institucional Universidad Santo Tomásspa
dc.identifier.repourlrepourl:https://repository.usta.edu.cospa
dc.identifier.urihttp://hdl.handle.net/11634/35065
dc.language.isospaspa
dc.publisherUniversidad Santo Tomásspa
dc.publisher.facultyFacultad de Ingeniería de Sistemasspa
dc.publisher.programIngeniería Informáticaspa
dc.relation.referencesIngenioVirtual. (s.f.). IngenioVirtual. Obtenido de https://www.ingeniovirtual.com/tipos-de-graficos-y-diagramas-para-la-visualizacion-de-datos/spa
dc.relation.references3.0, E. (30 de Septiembre de 2020). Obtenido de https://www.educaciontrespuntocero.com/recursos/crear-una-nube-tags-las-palabras-mas-usadas-texto/spa
dc.relation.references300/1996, L. (1996).spa
dc.relation.referencesAhmed, I. (27 de Noviembre de 2020). Astera. Obtenido de https://www.astera.com/es/type/blog/automated-data-extraction-tools-for-faster-insights/spa
dc.relation.referencesAkram Hernandez Vásquez, H. C. (2019). MANIPULACIÓN, ANÁLISIS Y VISUALIZACIÓN DE DATOS DE. Obtenido de MANIPULACIÓN, ANÁLISIS Y VISUALIZACIÓN DE DATOS DE: https://www.scielosp.org/pdf/rpmesp/2019.v36n1/128-133/esspa
dc.relation.referencesAntonio Manuel Rodriguez Garcia, F. R. (2019). Píxel-BIT Revista de Medios y Educación. Obtenido de Píxel-BIT Revista de Medios y Educación: https://idus.us.es/bitstream/handle/11441/93761/Rodriguez-Garcia%20-%20competencia%20digital_removed.pdf?sequence=1&isAllowed=yspa
dc.relation.referencesBBVA API_Market. (11 de Enero de 2016). Obtenido de https://www.bbvaapimarket.com/es/mundo-api/herramientas-de-extraccion-de-datos-para-principiantes-y-profesionales/spa
dc.relation.referencesBordignon, G. H. (s.f.). Introducción a la Recuperación de Información. Obtenido de http://eprints.rclis.org/12243/1/Introduccion-RI-v9f.pdfspa
dc.relation.referencesBoyacá Visión 2019. (2019).spa
dc.relation.referencesCarina Sofía Andrade and Maribel Yasmina Santos. (2017).spa
dc.relation.referencesCesteros, A. F.-P. (2018). La eficacia del análisis de sentimientos para la empresa: el caso de estudio Dell Technologies Inc. MADRID. Obtenido de https://www.ucm.es/data/cont/docs/758-2019-01-04-TFG_Panico_Chiara_TFG.pdfspa
dc.relation.referencesclicdata. (s.f.). clicdata. Obtenido de https://www.clicdata.com/es/ejemplos/project-management/spa
dc.relation.referencesconceptodefinicion. (s.f.). conceptodefinicion. Obtenido de https://conceptodefinicion.de/histograma/spa
dc.relation.referencesdatavizcatalogue. (s.f.). datavizcatalogue. Obtenido de https://datavizcatalogue.com/ES/metodos/grafica_de_area.htmlspa
dc.relation.referencesDe Rojas y Camarero, 2008; Rivera,2013. (2013). Visitors experience, mood and satisfaction in A heritage context: Evidence from an interpretation center. Tourism Management, 525-537.spa
dc.relation.referencesDepartamento Administrativo Nacional de Estadistica. (s.f.).spa
dc.relation.referencesDivakar Mysore. (2013).spa
dc.relation.referencesDivakar Mysore, S. K. (17 de Septiembre de 2013). IBM. Obtenido de https://developer.ibm.com/es/technologies/analytics/articles/bd-archpatterns1/spa
dc.relation.referencesDlib. (2020). Dlib. Obtenido de Dlib: http://dlib.net/spa
dc.relation.referencesEarl, M. (28 de Julio de 2015). Obtenido de https://matthewearl.github.io/2015/07/28/switching-eds-with-python/spa
dc.relation.referencesecured. (s.f.). ecured. Obtenido de https://www.ecured.cu/Cartogramaspa
dc.relation.referencesErik Cambria, A. H. (2012). Sentic Album: Content-, Concept-, and Context-Based Online. Science+Business Media, LLC 2012. Obtenido de https://sentic.net/sentic-album.pdfspa
dc.relation.referencesEstadística, P. y. (27 de Mayo de 2012). Probabilidad y Estadística. Obtenido de http://probabilidadyestadisticaitsav.blogspot.com/2012/05/16-diagrama-de-arbol.htmlspa
dc.relation.referencesFacultad de Estudios Estadisticos, Universidad Complutense de Madrid. (2020). Obtenido de https://www.masterBigdataucm.com/que-es-Big-data/spa
dc.relation.referencesfreepik. (2018). freepik. Obtenido de https://www.freepik.es/vector-gratis/ilustracion-burbujas-discurso-nube_2904317.htmspa
dc.relation.referencesgamavision. (01 de Julio de 2020). gamavision. Obtenido de https://www.gamavision.com.ec/pros-y-contras-del-reconocimiento-facial/spa
dc.relation.referencesGarcía, S. M. (1997). Psicosociología del ocio y el turismo. Málaga: Algibe.spa
dc.relation.referencesgeeksforgeeks. (24 de Mayo de 2020). geeksforgeeks. Obtenido de https://www.geeksforgeeks.org/opencv-facial-landmarks-and-face-detection-using-dlib-and-opencv/spa
dc.relation.referencesgisandbeers. (17 de Marzo de 2019). gisandbeers. Obtenido de http://www.gisandbeers.com/crear-mapas-calor-heatmaps/spa
dc.relation.referencesGómez, J. C. (10 de Enero de 2020). Obtenido de https://josecantero.com/uncategorized/tendencias-en-turismo-experiencial-en-2020-bienvenidos-a-la-decada/spa
dc.relation.referencesHAA DnL. (s.f.). HAA DnL. Obtenido de https://sites.google.com/site/haadnl/home/diagrama-radialspa
dc.relation.referencesHong, M. K. (2017). Unstructured Social Media Data Mining System Based on Emotional Database and Unstructured Information Management Architecture Framework. ASP.spa
dc.relation.referencesJacinto, G. (1995). Psicología social del turismo. Psicología Social de la Educación y de la Cultura, Ocio, Deporte y Turismo. Salamanca, 245-272.spa
dc.relation.referencesJosé Augusto Cadena Moreano, R. H. (2017). RECONOCIMIENTO FACIAL CON BASE EN IMÁGENES. B O L E T Í N V I R T U A L - M A Y O - V O L 6 - 5 I S N N 2 2 6 6 - 1 5 3 6. Obtenido de file:///C:/Users/Usuario/Downloads/Dialnet-ReconocimientoFacialConBaseEnImagenes-6145639.pdfspa
dc.relation.referencesJosé Luis García Cué, J. A. (Octubre de 2008). Revista Estilos de Aprendizaje. Obtenido de Revista Estilos de Aprendizaje: http://revistaestilosdeaprendizaje.com/article/view/852/1540spa
dc.relation.referencesKanuk y Schiffman . (s.f.).spa
dc.relation.referencesLa Vanguardia. (11 de enero de 2020). Obtenido de https://www.vanguardia.com/economia/nacional/turismo-hara-importante-aporte-en-el-pib-del-pais-XM1860653spa
dc.relation.referenceslucidchart. (s.f.). lucidchart. Obtenido de https://www.lucidchart.com/pages/es/que-es-un-diagrama-de-flujospa
dc.relation.referencesMartín, S. (1997).spa
dc.relation.referencesMartinez, J. L. (08 de Junio de 2014). slideshare. Obtenido de https://es.slideshare.net/joseluis199222/tabla-de-resultados-obtenidos-mecanismos-1spa
dc.relation.referencesMcCannell. (1976). The Tourist. New York.spa
dc.relation.referencesMckercher. (1999).spa
dc.relation.referencesMcKercher, B. (1999). A chaos approach to tourism. Tourism Management, 425- 434.spa
dc.relation.referencesMérida, C. (2014). Modelo arquitectónico de información para una plataforma de Big Data para el Sector Turístico. Lima, Perú.spa
dc.relation.referencesmicrosoft. (15 de Junio de 2016). microsoft. Obtenido de https://docs.microsoft.com/es-es/sql/reporting-services/tutorial-add-a-pie-chart-to-your-report-report-builder?view=sql-server-ver15spa
dc.relation.referencesMolina et al. 2007; Troitiño, 1991. (1991). Segmentación de la demanda turística: Un análisis aplicado a un destino cultural. Revista de análisis turístico n° 4, 36-48.spa
dc.relation.referencesMontaner, J. (1996). Psicosociología del turismo. Barcelona: Sintesis.spa
dc.relation.referencesNodeJS. (2020). NodeJS. Obtenido de NodeJS: https://nodejs.org/es/docs/spa
dc.relation.referencesnpm ejs. (2020). npm ejs. Obtenido de npm ejs: https://www.npmjs.com/package/ejsspa
dc.relation.referencesnpm express. (2020). npm express. Obtenido de npm express: https://www.npmjs.com/package/expressspa
dc.relation.referencesnpm mongoose. (2020). npm mongoose. Obtenido de npm mongoose: https://www.npmjs.com/package/mongoosespa
dc.relation.referencesnpm morgan. (2020). npm morgan. Obtenido de npm morgan: https://www.npmjs.com/package/morganspa
dc.relation.referencesnpm nodemon. (2020). npm nodemon. Obtenido de npm nodemon: https://www.npmjs.com/package/nodemonspa
dc.relation.referencesNumpy. (2020). Numpy. Obtenido de Numpy: https://numpy.org/doc/spa
dc.relation.referencesPandas. (2019). Pandas. Obtenido de Pandas: https://pandas.pydata.org/docs/spa
dc.relation.referencesPaul Viola, M. J. (2001). Rapid Object Detection using a Boosted Cascade of Simple Features. Obtenido de https://web.iitd.ac.in/~sumeet/viola-cvpr-01.pdfspa
dc.relation.referencesPauli, P. A. (2019). Análisis de sentimiento. Comparación de algoritmos predictivos y métodos utilizando un lexicon español. BUENOS AIRES: INSTITUTO TECNOLÓGICO DE BUENOS AIRES – ITBA. Obtenido de https://ri.itba.edu.ar/bitstream/handle/123456789/1782/Proyecto%20Final.pdf?sequence=1&isAllowed=yspa
dc.relation.referencesPearce, P. (1993). Fundamentals of Tourist Motivation. Tourism Research: Critiques and Challenges.spa
dc.relation.referencesPine & Gilmore. (1998). The experience economy: Work is Theater& Every Business a Stage. Harvard Business School Press.spa
dc.relation.referencespracticobaul. (s.f.). practicobaul. Obtenido de https://sites.google.com/site/unpracticobaul/tablas-en-un-textospa
dc.relation.referencesQuestionPro. (2020). QuestionPro. Obtenido de QuestionPro: https://www.questionpro.com/es/analisis-de-datos.html#:~:text=El%20an%C3%A1lisis%20de%20datos%20es%20la%20ciencia%20que%20se%20encarga,los%20conocimientos%20sobre%20diversos%20temas.spa
dc.relation.referencesRedacción España. (18 de Noviembre de 2019). B12. Obtenido de https://agenciab12.mx/noticia/diferencia-datos-estructurados-y-datos-no-estructuradosspa
dc.relation.referencesRevuelta-Domínguez, F. I. (Diciembre de 2012). researchgate.net. Obtenido de https://www.researchgate.net/figure/Figura-4-Representacion-grafica-de-la-red-segun-el-grado_fig1_266025222spa
dc.relation.referencesRICHARDS. (2004). Diputació de Barcelona. Obtenido de www.diba.es/cerc/arxinterac04/arcem1/richards/dipbarcelonaspa
dc.relation.referencesRober Morales Chaparro, J. C. (2012). Desarrollo dirigido por modelos de visualización. Obtenido de Desarrollo dirigido por modelos de visualización: https://biblioteca.sistedes.es/wp-content/uploads/2016/05/JISBD-2012-565-Desarrollo-dirigido-por-modelos-de-visualizaci%C3%B3n-de-datos-para-la-Web.pdfRober Morales Chaparro, J. C. (2012). Desarrollo dirigido por modelos de visualización. Obtenido de Desarrollo dirigido por modelos de visualización: https://biblioteca.sistedes.es/wp-content/uploads/2016/05/JISBD-2012-565-Desarrollo-dirigido-por-modelos-de-visualizaci%C3%B3n-de-datos-para-la-Web.pdfspa
dc.relation.referencesSande, J. C. (2018). Análisis de sentimientos en Twitter. UOC, Universitat Oberta de Catalunya, 99. Obtenido de http://openaccess.uoc.edu/webapps/o2/bitstream/10609/81435/6/jsobrinosTFM0618memoria.pdfspa
dc.relation.referencesSchiffman, L. &. (1983). Consumer behavior. Englewood Cliffs: Prentice Hall.spa
dc.relation.referencesScikit-Learn. (2019). Scikit-Learn. Obtenido de Scikit-Learn: https://scikit-learn.org/0.21/documentation.htmlspa
dc.relation.referencesSenticNet. (2018). SenticNet. Obtenido de SenticNet: https://sentic.net/spa
dc.relation.referencessupport.minitab. (2020). /support.minitab. Obtenido de https://support.minitab.com/es-mx/minitab/19/help-and-how-to/graphs/matrix-plot/before-you-start/overview/spa
dc.relation.referencesthemexpert. (s.f.). themexpert. Obtenido de https://www.themexpert.com/docs/quix/elements/polar-area-chartspa
dc.relation.referencesTIBCO. (s.f.). TIBCO. Obtenido de https://docs.tibco.com/pub/spotfire_web_player/6.0.0-november-2013/es-ES/WebHelp/GUID-6023CECC-E502-4AE1-B5C5-FFE5DAF6FAE2.htmlspa
dc.relation.referencesTremolosa. (2002). ACTIVIDAD DE OCIO-TURÍSTICO.spa
dc.relation.referencesUniversidad Alcala. (s.f.).spa
dc.relation.referencesUniversidad de Alcalá. (2020). Obtenido de https://www.master-Bigdata.com/Big-data-actualmente-tan-importante/spa
dc.relation.referencesVasavi Gajarla, A. G. (s.f.). Emotion Detection and Sentiment Analysis of Images. Obtenido de https://www.cc.gatech.edu/~hays/7476/projects/Aditi_Vasavi.pdfspa
dc.relation.referencesVieira, D. (06 de Mayo de 2019). rockcontent. Obtenido de https://rockcontent.com/es/blog/que-es-diagrama-de-gantt/spa
dc.relation.referencesZambrano, D. M. (2017). Innovación para el Análisis de Sentimientos en Texto, una revisión de la técnica actual aplicando metodologías de crowdsourcing. researchgate. Obtenido de file:///C:/Users/Usuario/Downloads/340-940-1-PB.pdfspa
dc.rightsAtribución-NoComercial-SinDerivadas 2.5 Colombia*
dc.rights.accessrightsinfo:eu-repo/semantics/openAccess
dc.rights.coarhttp://purl.org/coar/access_right/c_abf2
dc.rights.localAbierto (Texto Completo)spa
dc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/2.5/co/*
dc.subject.keywordSentiment analysisspa
dc.subject.keywordBig Dataspa
dc.subject.keywordExtractionspa
dc.subject.keywordWeb Scraperspa
dc.subject.keywordTourismspa
dc.subject.lembTurismospa
dc.subject.lembArquitecturaspa
dc.subject.proposalAnálisis de sentimientosspa
dc.subject.proposalBig Dataspa
dc.subject.proposalExtracciónspa
dc.subject.proposalTurismospa
dc.subject.proposalWeb Scraperspa
dc.titleArquitectura de Big Data para el Análisis de Sentimientos Multimodales en el Sector Turístico del Departamento de Boyacá, Colombiaspa
dc.typebachelor thesis
dc.type.coarhttp://purl.org/coar/resource_type/c_7a1f
dc.type.coarversionhttp://purl.org/coar/version/c_ab4af688f83e57aa
dc.type.driveinfo:eu-repo/semantics/bachelorThesis
dc.type.localTesis de pregradospa
dc.type.versioninfo:eu-repo/semantics/acceptedVersion

Archivos

Bloque original

Mostrando 1 - 3 de 3
Cargando...
Miniatura
Nombre:
2021cristianalgecira
Tamaño:
2.26 MB
Formato:
Adobe Portable Document Format
Descripción:
Thumbnail USTA
Nombre:
2021cartaderechosautor
Tamaño:
100.92 KB
Formato:
Adobe Portable Document Format
Descripción:
Thumbnail USTA
Nombre:
2022cartaaprobaciónfacultad
Tamaño:
442.83 KB
Formato:
Adobe Portable Document Format
Descripción:

Bloque de licencias

Mostrando 1 - 1 de 1
Thumbnail USTA
Nombre:
license.txt
Tamaño:
807 B
Formato:
Item-specific license agreed upon to submission
Descripción: