Περίληψη
Ο τραπεζικός τομέας βρίσκεται στα πρόθυρα ενός σημαντικού μετασχηματισμού, με την κινητήρια δύναμη πίσω από αυτόν να είναι η Τεχνητή Νοημοσύνη (ΤΝ). Νέες εφαρμογές της τεχνητής νοημοσύνης έχουν ήδη προταθεί για την αντιμετώπιση προκλήσεων σε τομείς όπως η πιστοληπτική αξιολόγηση, η αξιολόγηση κινδύνου, η βελτίωση της εμπειρίας των πελατών και η αποτελεσματική διαχείριση του χαρτοφυλακίου. Ένα από τα πιο κρίσιμα ζητήματα στον ανωτέρω τομέα είναι ο εντοπισμός απάτης σε συναλλαγές. Πρόσφατα, εισήχθησαν μοντέλα βαθιάς μάθησης για την αντιμετώπιση αυτού του προβλήματος, στοχεύοντας στον εντοπισμό και την πρόβλεψη πιθανών δόλιων ενεργειών. Ο στόχος είναι να εκτιμηθεί η άγνωστη κατανομή των κανονικών/δόλιων συναλλαγών και, στη συνέχεια, να ανιχνευθούν αποκλίσεις που μπορεί να υποδηλώνουν πιθανή απάτη. Σε αυτήν τη διατριβή, παρουσιάζουμε ένα νέο πολυεπίπεδο μοντέλο βαθιάς μάθησης που στοχεύει στην αποτελεσματική διαχείριση των εισερχομένων ροών συναλλαγών και στον εντοπισμό των δόλιων ενεργειώ ...
Ο τραπεζικός τομέας βρίσκεται στα πρόθυρα ενός σημαντικού μετασχηματισμού, με την κινητήρια δύναμη πίσω από αυτόν να είναι η Τεχνητή Νοημοσύνη (ΤΝ). Νέες εφαρμογές της τεχνητής νοημοσύνης έχουν ήδη προταθεί για την αντιμετώπιση προκλήσεων σε τομείς όπως η πιστοληπτική αξιολόγηση, η αξιολόγηση κινδύνου, η βελτίωση της εμπειρίας των πελατών και η αποτελεσματική διαχείριση του χαρτοφυλακίου. Ένα από τα πιο κρίσιμα ζητήματα στον ανωτέρω τομέα είναι ο εντοπισμός απάτης σε συναλλαγές. Πρόσφατα, εισήχθησαν μοντέλα βαθιάς μάθησης για την αντιμετώπιση αυτού του προβλήματος, στοχεύοντας στον εντοπισμό και την πρόβλεψη πιθανών δόλιων ενεργειών. Ο στόχος είναι να εκτιμηθεί η άγνωστη κατανομή των κανονικών/δόλιων συναλλαγών και, στη συνέχεια, να ανιχνευθούν αποκλίσεις που μπορεί να υποδηλώνουν πιθανή απάτη. Σε αυτήν τη διατριβή, παρουσιάζουμε ένα νέο πολυεπίπεδο μοντέλο βαθιάς μάθησης που στοχεύει στην αποτελεσματική διαχείριση των εισερχομένων ροών συναλλαγών και στον εντοπισμό των δόλιων ενεργειών. Προτείνουμε τη χρήση αυτόματων κωδικοποιητών για την εκτέλεση επιλογής χαρακτηριστικών και την εκμάθηση της αναπαράστασης του κρυφού χώρου δεδομένων με βάση ένα μη γραμμικό μοντέλο βελτιστοποίησης. Στα προκαθορισμένα σημαντικά χαρακτηριστικά, εφαρμόζουμε στη συνέχεια ένα Συνελικτικό Νευρικό Δίκτυο(Convolutional Neural Network ή CNN) για τον εντοπισμό απάτης ή ένα Μοντέλο Μακράς Μνήμης με Βραχυπρόθεσμη Μνήμη (Long - Short Term Memory ή LSTM), συνδυάζοντας έτσι δύο διαφορετικά μπλοκ επεξεργασίας. Ο συνδυασμός που εφαρμόζουμε έχει ως στόχο την ανίχνευση απάτης σχετικά με την αποκαλυμμένη αναπαράσταση δεδομένων και όχι των αρχικών δεδομένων. Ένας άλλος στόχος αυτής της διατριβής είναι να παρουσιάσει μια νέα βελτίωση του αλγορίθμου L.I.M.E. που χρησιμοποιείται για την ερμηνεία μοντέλων μηχανικής μάθησης. Εκτός από τη χρήση μοντέλων για την πρόβλεψη, η δυνατότητα ερμηνείας των αποτελεσμάτων που έχει αποκτήσει ένα μοντέλο λαμβάνει αυξημένη προσοχή στη σύγχρονη έρευνα. Δεν είναι ακόμη σαφές πώς συνδέεται το ευρύ φάσμα των προτεινόμενων μεθόδων ερμηνείας και ποιες κοινές έννοιες μπορούν να χρησιμοποιηθούν για την αξιολόγησή τους. Η τεχνική που προτείνουμε χρησιμοποιεί έναν αυτόματο κωδικοποιητή για τη δημιουργία νέων δεδομένων (neighborhood) γύρω από το data point που μας ενδιαφέρει να ερμηνεύσουμε, αντί να βασιστεί σε απλή δημιουργία δεδομένων με μια κανονική κατανομή γύρω από αυτό.
περισσότερα
Περίληψη σε άλλη γλώσσα
The banking sector stands at the threshold of a profound transformation, and the driving force behind this revolution is Artificial Intelligence (AI). Innovative AI applications have already been put forth to address challenges across various domains, including credit scoring, risk assessment, enhancing client experiences, and portfolio management. Among the most pressing challenges in the banking sector is the detection of fraudulent activities within streams of transactions. Recently, deep learning models have emerged to tackle this specific issue, focusing on the identification and prediction of potential fraudulent events. The primary objective is twofold: first, to estimate the unknown distribution of normal and fraudulent transactions, and subsequently, to pinpoint anomalies that may signal potential fraud. Within the pages of this dissertation, we delve into a groundbreaking multistage deep learning model designed to effectively handle incoming transaction streams and detect fra ...
The banking sector stands at the threshold of a profound transformation, and the driving force behind this revolution is Artificial Intelligence (AI). Innovative AI applications have already been put forth to address challenges across various domains, including credit scoring, risk assessment, enhancing client experiences, and portfolio management. Among the most pressing challenges in the banking sector is the detection of fraudulent activities within streams of transactions. Recently, deep learning models have emerged to tackle this specific issue, focusing on the identification and prediction of potential fraudulent events. The primary objective is twofold: first, to estimate the unknown distribution of normal and fraudulent transactions, and subsequently, to pinpoint anomalies that may signal potential fraud. Within the pages of this dissertation, we delve into a groundbreaking multistage deep learning model designed to effectively handle incoming transaction streams and detect fraudulent activities. Our approach advocates the utilization of autoencoders for feature selection and the acquisition of latent data space representations based on nonlinear optimization models. On the carefully curated set of significant features, we then apply a deep Convolutional Neural Network (CNN) to detect instances of fraud. This amalgamation of techniques involves two distinct processing blocks and is tailored to identify fraud based on the exposed latent data representation rather than the initial data. Another facet of this dissertation aims to introduce a novel enhancement to the LIME algorithm, a tool used for interpreting machine learning models. Beyond model prediction, the growing emphasis in contemporary research lies in the ability to decipher what a model has learned. The interconnectedness of the myriad interpretation methods proposed in the field and the identification of common evaluation concepts remain unclear. Our proposed technique employs an autoencoder to generate new instances around the data point under scrutiny, in contrast to the conventional method of simple data creation using a Gaussian distribution centered around the point of interest.
περισσότερα