Detección de fraude en tarjetas de crédito mediante técnicas de minería de datos
dc.contributor.advisor | Ortiz Rico, Andrés Felipe | |
dc.contributor.author | González Martínez, Edwin Fernando | |
dc.contributor.cvlac | http://scienti.colciencias.gov.co:8081/cvlac/visualizador/generarCurriculoCv.do?cod_rh=0000650579 | spa |
dc.contributor.googlescholar | https://scholar.google.es/citations?user=OuVxcUgAAAAJ&hl=es | spa |
dc.coverage.campus | CRAI-USTA Bogotá | spa |
dc.date.accessioned | 2018-07-30T16:52:57Z | |
dc.date.available | 2018-07-30T16:52:57Z | |
dc.date.issued | 2018-06 | |
dc.description | La minería de datos y machine learning son herramientas altamente potenciales en la identificación de observaciones inusuales en tendencias de patrones, dado que son un conjunto de técnicas robustas que facilitan la toma de decisión, el proceso knowledge discovery in databases, kdd por sus siglas en inglés, es un campo de la estadística y ciencias de la computación que emplea diversas técnicas y metodologías para el proceso de identificar patrones valiosos en la extracción de la información nueva, útil y novedosa; una de las etapas más importantes es el data mining, donde se realiza la estimación de los parámetros de los modelos probabilísticos como son las redes neuronales, random forest, naive bayes, máquinas de soporte vectorial, modelos lineales generalizados logit, probit y log log; posteriormente serán evaluados y analizados con las métricas de clasificación accuracy, precisión, recall, f beta score y curva roc. El fraude se define como la acción contraria a la verdad y a la rectitud, que perjudica a la persona o entidad contra quien se comete, esto conlleva a pérdidas económicas y problemas legales; hay diferentes tipos de fraude, como son intruso a redes privadas, tarjeta de crédito, telecomunicaciones y lavado de activos. Este trabajo busca comparar la eficiencia de los modelos probabilísticos de la minería de datos, machine learning y los modelos lineales generalizados para ser aplicados a las transacciones con tarjeta de crédito y evaluar con las métricas de clasificación que modelo probabilístico es eficiente en la detección de predecir el fraude. | spa |
dc.description.abstract | Data mining and machine learning are highly potential tools in the identi_cation of unusual observations in pattern trends, since they are a set of robust techniques that facilitate decision making, the knowledge discovery in databases process, KDD for its acronym in English, is a _eld of statistics and computer science that employs various techniques and methodologies for the process of identifying valuable patterns in the extraction of new, useful and novel information; One of the most important stages is the data mining, where the estimation of the parameters of the probabilistic models such as neural networks, random forest, naive bayes, vectorial support machines, generalized lineal models logit, probit and log log; later they will be evaluated and analyzed with the classi_cation, accuracy, recall, f beta score and roc curve metrics. Fraud is defined as the action contrary to the truth and rectitude, which harms the person or entity against whom it is committed, this leads to economic losses and legal problems. There are different types of fraud, as they are intrusive to private networks, credit card, telecommunications and money laundering. This work seeks to compare the efficiency of the probabilistic models of data mining, machine learning and generalized linear models to be applied to credit card transactions and evaluate with the classi_cation metrics that probabilistic model is efficient in predicting the fraud | spa |
dc.description.degreelevel | Pregrado | spa |
dc.description.degreename | Profesional en estadística | spa |
dc.description.domain | http://unidadinvestigacion.usta.edu.co | spa |
dc.format.mimetype | application/pdf | spa |
dc.identifier.citation | González, E. (2018). Detección de fraude en tarjetas de crédito mediante técnicas de minería de datos. (Trabajo de pregrado). Universidad Santo Tomás. Bogotá, Colombia | spa |
dc.identifier.instname | instname:Universidad Santo Tomás | spa |
dc.identifier.reponame | reponame:Repositorio Institucional Universidad Santo Tomás | spa |
dc.identifier.repourl | repourl:https://repository.usta.edu.co | spa |
dc.identifier.uri | http://repository.usta.edu.co/handle/11634/12529 | |
dc.language.iso | spa | spa |
dc.publisher | Universidad Santo Tomás | spa |
dc.publisher.faculty | Facultad de Estadística | spa |
dc.publisher.program | Pregrado Estadística | spa |
dc.relation.references | Agus Sudjianto, Ming Yuan, Daniel Kern, Sheela Nair, Aijun Zhang & Fernando Cela-Díaz (2010) Statistical Methods for Fighting Financial Crimes. Technometrics, Vol. 52, No. 1 (February 2010) | spa |
dc.relation.references | Amat, Joaquín Rodrigo (2017) Árboles de predicción: Bagging, Random Forest, Boosting y C5.0 https: //rpubs.com/Joaquin_AR/255596 | spa |
dc.relation.references | Bolton Richard J & Hand David J. (2002) . Statistical Fraud Detection: A Review. Statistical Science, Vol. 17, No. 3 (Aug., 2002), pp. 235-249 | spa |
dc.relation.references | Breiman Leo (2001) Random Forests Statistics Department, University of California, Berkeley, CA 94720 | spa |
dc.relation.references | Burbidge Robert & Buxton Bernard (2001) An Introduction to Support Vector Machines for Data Mining . Computer Science Dept., UCL, Gower Street, WC1E 6BT, UK | spa |
dc.relation.references | Campos Yepes John Jairo (2017) Modelos Apilados y factores que pueden afectar la eficiencia. Universidad Santo Tomás sede Bogotá, Trabajo de Grado | spa |
dc.relation.references | Carneiro Nuno, González Carlos & Costa Miguel (2017) A data mining based system for credit-card fraud detection in e-tail . | spa |
dc.relation.references | Cordeiro Moutinho Gauss (2013) Modelos Lineales Generalizados y Extensiones. Departamento de Estadística e Informática - UFRPE | spa |
dc.relation.references | Falcon Fraud Manager http://www.fico.com/en/products/fico-falcon-fraud-manager | spa |
dc.relation.references | Han Jiawei, Kamber Micheline & Pei Jian (2014) Data Mining Concepts and Techniques Third Edition, Elsevier Science, ISBN libro electrónico 9780123814807 | spa |
dc.relation.references | Manjarrez Lino (2014). Relaciones Neuronales Para Determinar la Atenuación del Valor de la Aceleración Máxima en Superficie de Sitios en Roca Para Zonas de Subducción. https://www.researchgate.net/publication/315762548 | spa |
dc.relation.references | Parra Francisco (2017) Estadística y Machine Learning con R https://rpubs.com/PacoParra/293405 | spa |
dc.relation.references | Real Academia Española. Diccionario de la lengua española http://dle.rae.es/?id=IQS313i | spa |
dc.relation.references | Rincón Olmos, Jhon Alexander (2017) Comparación de Modelos Apilados Bajo los Esquemas de Redes Neuronales y Árboles de Clasificación. Universidad Santo Tomás | spa |
dc.relation.references | Rincón Suárez Luis Francisco (2009) Curso Básico de Modelos Lineales. Universidad Santo Tomás | spa |
dc.relation.references | Santamaría Ruiz Wilfredy (2006) . Técnicas de Minería de Datos Aplicadas en la Detección de Fraude : Estado del Arte. https://www.researchgate.net/publication/ 240724702 | spa |
dc.relation.references | Sandoval Ricardo (1991). Tarjeta de Crédito Bancaria. Editorial Jurídica de Chile ISBN: 956-10-0917-9 | spa |
dc.relation.references | Silvaz Juan Felipe (2010). Minería de datos para la Predicción de Fraudes en Tarjetas de Crédito. Universidad Distrital Francisco José de Caldas, Sede Bogotá. | spa |
dc.relation.references | Torgo Luis (2011) Data Mining with R Learning With Case Studies Chapman & Hall / CRC, ISBN 9781439810187 | spa |
dc.relation.references | Vila María Sanchéz Daniel & Cerda Luis. (2004) Reglas de Asociación Aplicadas a la Detección de Fraude con Tarjetas de Crédito. XII Congreso Español Sobre Tecnologías y Lógica Fuzzy. | spa |
dc.relation.references | Yanchang Zhao, Yonghua Cen, & Justin Cen (2013) Data Mining Applications with R Elsevier Science, ISBN libro electrónico 9780124115200 | spa |
dc.rights | Atribución-NoComercial-SinDerivadas 2.5 Colombia | * |
dc.rights.accessrights | info:eu-repo/semantics/openAccess | |
dc.rights.coar | http://purl.org/coar/access_right/c_abf2 | |
dc.rights.local | Abierto (Texto Completo) | spa |
dc.rights.uri | http://creativecommons.org/licenses/by-nc-nd/2.5/co/ | * |
dc.subject.keyword | Statistics | spa |
dc.subject.keyword | Data Mining | spa |
dc.subject.keyword | Algorithms | spa |
dc.subject.keyword | Fraud | spa |
dc.subject.keyword | Patterns | spa |
dc.subject.keyword | Credit cards | spa |
dc.subject.keyword | Machine learning | spa |
dc.subject.lemb | Estadística | spa |
dc.subject.lemb | Minería de datos | spa |
dc.subject.lemb | Algoritmos | spa |
dc.subject.lemb | Fraude con tarjetas de crédito | spa |
dc.subject.proposal | Aprendizaje Automático | spa |
dc.subject.proposal | Patrones | spa |
dc.title | Detección de fraude en tarjetas de crédito mediante técnicas de minería de datos | spa |
dc.type | bachelor thesis | |
dc.type.category | Formación de Recurso Humano para la Ctel: Trabajo de grado de pregrado | spa |
dc.type.coar | http://purl.org/coar/resource_type/c_7a1f | |
dc.type.coarversion | http://purl.org/coar/version/c_ab4af688f83e57aa | |
dc.type.drive | info:eu-repo/semantics/bachelorThesis | |
dc.type.local | Tesis de pregrado | spa |
dc.type.version | info:eu-repo/semantics/acceptedVersion |
Archivos
Bloque original
1 - 3 de 3
Cargando...
- Nombre:
- 2018edwingonzalez.pdf
- Tamaño:
- 1.78 MB
- Formato:
- Adobe Portable Document Format
- Descripción:

- Nombre:
- cartadefacultad.pdf
- Tamaño:
- 109.75 KB
- Formato:
- Adobe Portable Document Format
- Descripción:

- Nombre:
- cartaderechosdeautor.pdf
- Tamaño:
- 320.2 KB
- Formato:
- Adobe Portable Document Format
- Descripción:
Bloque de licencias
1 - 1 de 1

- Nombre:
- license.txt
- Tamaño:
- 1.71 KB
- Formato:
- Item-specific license agreed upon to submission
- Descripción: