Detección de fraude en tarjetas de crédito mediante técnicas de minería de datos

dc.contributor.advisorOrtiz Rico, Andrés Felipe
dc.contributor.authorGonzález Martínez, Edwin Fernando
dc.contributor.cvlachttp://scienti.colciencias.gov.co:8081/cvlac/visualizador/generarCurriculoCv.do?cod_rh=0000650579spa
dc.contributor.googlescholarhttps://scholar.google.es/citations?user=OuVxcUgAAAAJ&hl=esspa
dc.coverage.campusCRAI-USTA Bogotáspa
dc.date.accessioned2018-07-30T16:52:57Z
dc.date.available2018-07-30T16:52:57Z
dc.date.issued2018-06
dc.descriptionLa minería de datos y machine learning son herramientas altamente potenciales en la identificación de observaciones inusuales en tendencias de patrones, dado que son un conjunto de técnicas robustas que facilitan la toma de decisión, el proceso knowledge discovery in databases, kdd por sus siglas en inglés, es un campo de la estadística y ciencias de la computación que emplea diversas técnicas y metodologías para el proceso de identificar patrones valiosos en la extracción de la información nueva, útil y novedosa; una de las etapas más importantes es el data mining, donde se realiza la estimación de los parámetros de los modelos probabilísticos como son las redes neuronales, random forest, naive bayes, máquinas de soporte vectorial, modelos lineales generalizados logit, probit y log log; posteriormente serán evaluados y analizados con las métricas de clasificación accuracy, precisión, recall, f beta score y curva roc. El fraude se define como la acción contraria a la verdad y a la rectitud, que perjudica a la persona o entidad contra quien se comete, esto conlleva a pérdidas económicas y problemas legales; hay diferentes tipos de fraude, como son intruso a redes privadas, tarjeta de crédito, telecomunicaciones y lavado de activos. Este trabajo busca comparar la eficiencia de los modelos probabilísticos de la minería de datos, machine learning y los modelos lineales generalizados para ser aplicados a las transacciones con tarjeta de crédito y evaluar con las métricas de clasificación que modelo probabilístico es eficiente en la detección de predecir el fraude.spa
dc.description.abstractData mining and machine learning are highly potential tools in the identi_cation of unusual observations in pattern trends, since they are a set of robust techniques that facilitate decision making, the knowledge discovery in databases process, KDD for its acronym in English, is a _eld of statistics and computer science that employs various techniques and methodologies for the process of identifying valuable patterns in the extraction of new, useful and novel information; One of the most important stages is the data mining, where the estimation of the parameters of the probabilistic models such as neural networks, random forest, naive bayes, vectorial support machines, generalized lineal models logit, probit and log log; later they will be evaluated and analyzed with the classi_cation, accuracy, recall, f beta score and roc curve metrics. Fraud is defined as the action contrary to the truth and rectitude, which harms the person or entity against whom it is committed, this leads to economic losses and legal problems. There are different types of fraud, as they are intrusive to private networks, credit card, telecommunications and money laundering. This work seeks to compare the efficiency of the probabilistic models of data mining, machine learning and generalized linear models to be applied to credit card transactions and evaluate with the classi_cation metrics that probabilistic model is efficient in predicting the fraudspa
dc.description.degreelevelPregradospa
dc.description.degreenameProfesional en estadísticaspa
dc.description.domainhttp://unidadinvestigacion.usta.edu.cospa
dc.format.mimetypeapplication/pdfspa
dc.identifier.citationGonzález, E. (2018). Detección de fraude en tarjetas de crédito mediante técnicas de minería de datos. (Trabajo de pregrado). Universidad Santo Tomás. Bogotá, Colombiaspa
dc.identifier.instnameinstname:Universidad Santo Tomásspa
dc.identifier.reponamereponame:Repositorio Institucional Universidad Santo Tomásspa
dc.identifier.repourlrepourl:https://repository.usta.edu.cospa
dc.identifier.urihttp://repository.usta.edu.co/handle/11634/12529
dc.language.isospaspa
dc.publisherUniversidad Santo Tomásspa
dc.publisher.facultyFacultad de Estadísticaspa
dc.publisher.programPregrado Estadísticaspa
dc.relation.referencesAgus Sudjianto, Ming Yuan, Daniel Kern, Sheela Nair, Aijun Zhang & Fernando Cela-Díaz (2010) Statistical Methods for Fighting Financial Crimes. Technometrics, Vol. 52, No. 1 (February 2010)spa
dc.relation.referencesAmat, Joaquín Rodrigo (2017) Árboles de predicción: Bagging, Random Forest, Boosting y C5.0 https: //rpubs.com/Joaquin_AR/255596spa
dc.relation.referencesBolton Richard J & Hand David J. (2002) . Statistical Fraud Detection: A Review. Statistical Science, Vol. 17, No. 3 (Aug., 2002), pp. 235-249spa
dc.relation.referencesBreiman Leo (2001) Random Forests Statistics Department, University of California, Berkeley, CA 94720spa
dc.relation.referencesBurbidge Robert & Buxton Bernard (2001) An Introduction to Support Vector Machines for Data Mining . Computer Science Dept., UCL, Gower Street, WC1E 6BT, UKspa
dc.relation.referencesCampos Yepes John Jairo (2017) Modelos Apilados y factores que pueden afectar la eficiencia. Universidad Santo Tomás sede Bogotá, Trabajo de Gradospa
dc.relation.referencesCarneiro Nuno, González Carlos & Costa Miguel (2017) A data mining based system for credit-card fraud detection in e-tail .spa
dc.relation.referencesCordeiro Moutinho Gauss (2013) Modelos Lineales Generalizados y Extensiones. Departamento de Estadística e Informática - UFRPEspa
dc.relation.referencesFalcon Fraud Manager http://www.fico.com/en/products/fico-falcon-fraud-managerspa
dc.relation.referencesHan Jiawei, Kamber Micheline & Pei Jian (2014) Data Mining Concepts and Techniques Third Edition, Elsevier Science, ISBN libro electrónico 9780123814807spa
dc.relation.referencesManjarrez Lino (2014). Relaciones Neuronales Para Determinar la Atenuación del Valor de la Aceleración Máxima en Superficie de Sitios en Roca Para Zonas de Subducción. https://www.researchgate.net/publication/315762548spa
dc.relation.referencesParra Francisco (2017) Estadística y Machine Learning con R https://rpubs.com/PacoParra/293405spa
dc.relation.referencesReal Academia Española. Diccionario de la lengua española http://dle.rae.es/?id=IQS313ispa
dc.relation.referencesRincón Olmos, Jhon Alexander (2017) Comparación de Modelos Apilados Bajo los Esquemas de Redes Neuronales y Árboles de Clasificación. Universidad Santo Tomásspa
dc.relation.referencesRincón Suárez Luis Francisco (2009) Curso Básico de Modelos Lineales. Universidad Santo Tomásspa
dc.relation.referencesSantamaría Ruiz Wilfredy (2006) . Técnicas de Minería de Datos Aplicadas en la Detección de Fraude : Estado del Arte. https://www.researchgate.net/publication/ 240724702spa
dc.relation.referencesSandoval Ricardo (1991). Tarjeta de Crédito Bancaria. Editorial Jurídica de Chile ISBN: 956-10-0917-9spa
dc.relation.referencesSilvaz Juan Felipe (2010). Minería de datos para la Predicción de Fraudes en Tarjetas de Crédito. Universidad Distrital Francisco José de Caldas, Sede Bogotá.spa
dc.relation.referencesTorgo Luis (2011) Data Mining with R Learning With Case Studies Chapman & Hall / CRC, ISBN 9781439810187spa
dc.relation.referencesVila María Sanchéz Daniel & Cerda Luis. (2004) Reglas de Asociación Aplicadas a la Detección de Fraude con Tarjetas de Crédito. XII Congreso Español Sobre Tecnologías y Lógica Fuzzy.spa
dc.relation.referencesYanchang Zhao, Yonghua Cen, & Justin Cen (2013) Data Mining Applications with R Elsevier Science, ISBN libro electrónico 9780124115200spa
dc.rightsAtribución-NoComercial-SinDerivadas 2.5 Colombia*
dc.rights.accessrightsinfo:eu-repo/semantics/openAccess
dc.rights.coarhttp://purl.org/coar/access_right/c_abf2
dc.rights.localAbierto (Texto Completo)spa
dc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/2.5/co/*
dc.subject.keywordStatisticsspa
dc.subject.keywordData Miningspa
dc.subject.keywordAlgorithmsspa
dc.subject.keywordFraudspa
dc.subject.keywordPatternsspa
dc.subject.keywordCredit cardsspa
dc.subject.keywordMachine learningspa
dc.subject.lembEstadísticaspa
dc.subject.lembMinería de datosspa
dc.subject.lembAlgoritmosspa
dc.subject.lembFraude con tarjetas de créditospa
dc.subject.proposalAprendizaje Automáticospa
dc.subject.proposalPatronesspa
dc.titleDetección de fraude en tarjetas de crédito mediante técnicas de minería de datosspa
dc.typebachelor thesis
dc.type.categoryFormación de Recurso Humano para la Ctel: Trabajo de grado de pregradospa
dc.type.coarhttp://purl.org/coar/resource_type/c_7a1f
dc.type.coarversionhttp://purl.org/coar/version/c_ab4af688f83e57aa
dc.type.driveinfo:eu-repo/semantics/bachelorThesis
dc.type.localTesis de pregradospa
dc.type.versioninfo:eu-repo/semantics/acceptedVersion

Archivos

Bloque original

Mostrando 1 - 3 de 3
Cargando...
Miniatura
Nombre:
2018edwingonzalez.pdf
Tamaño:
1.78 MB
Formato:
Adobe Portable Document Format
Descripción:
Thumbnail USTA
Nombre:
cartadefacultad.pdf
Tamaño:
109.75 KB
Formato:
Adobe Portable Document Format
Descripción:
Thumbnail USTA
Nombre:
cartaderechosdeautor.pdf
Tamaño:
320.2 KB
Formato:
Adobe Portable Document Format
Descripción:

Bloque de licencias

Mostrando 1 - 1 de 1
Thumbnail USTA
Nombre:
license.txt
Tamaño:
1.71 KB
Formato:
Item-specific license agreed upon to submission
Descripción: