Εξαγωγή γνώσης από πολυμορφικά δεδομένα κειμένου με χρήση τεχνικών μηχανικής μάθησης σε γράφους και βαθιάς μηχανικής μάθησης με το μοντέλο μετασχηματιστή

Περίληψη

Ο στόχος της παρούσας διατριβής είναι η ανάπτυξη προσεγγίσεων που εξάγουν γνώση από πολυμορφικά (μη-δομημένα και δομημένα) δεδομένα κειμένου. Για να επιτευχθεί ο στόχος αυτός, βασιζόμαστε σε σύγχρονες προσεγγίσεις από τις ερευνητικές περιοχές της Μηχανικής Μάθησης (ΜΜ), της μάθησης βασισμένης σε γράφους, της Επεξεργασίας Φυσικής Γλώσσας (ΕΦΓ) και της Βαθιάς Μηχανικής Μάθησης (ΒΜΜ). Επιπροσθέτως, αυτή η διατριβή συνεισφέρει αρκετά ερευνητικά ευρήματα που περιλαμβάνουν: (i) ένα καινοτόμο πλαίσιο ΜΜ που βασίζεται σε γράφους, επ' ονόματι Graph-of-Docs, το οποίο μοντελοποιεί έγγραφα σε μια ενοποιημένη δομή γράφων και λύνει διάφορους περιορισμούς συμφραζομένων σε υπάρχουσα παραδοσιακά πλαίσια ΜΜ ή με οργάνωση γράφου·(ii) μελετούμε την ενσωμάτωση τεχνικών Θεωρίας Γράφων, Αναπαράστασης μάθησης και Γράφων Γνώσης (ΓΓ) στο προτεινόμενο πλαίσιο ως προς τη βελτίωση διάφορων προβλημάτων κατηγοριοποίησης ενώ εφαρμόζουμε το εν λόγω πλαίσιο σε αρκετές πραγματικές εφαρμογές· (iii) τεχνολογίες αιχμής μελ ...
περισσότερα

Περίληψη σε άλλη γλώσσα

The aim of this thesis is to develop novel approaches that extract meaningful knowledge from polymorphic (unstructured and structured) textual data. To achieve this, we rely on recent advancements from the areas of Machine Learning (ML), Graph-Based Learning, Natural Language Processing (NLP) and Deep Learning (DL). This thesis comprises a series of research contributions; specifically: (i) we introduce a novel graph-based ML framework (Graph-of-Docs), which models documents in a unified graph structure, while solving several contextual limitations of traditional machine and previous graph-based learning frameworks; (ii) we study the incorporation of Graph Theory, Representation Learning and Knowledge Graphs (KGs) in the proposed framework to improve various classification tasks, while applying this framework for several real-world applications; (iii) we study the state of the art in several NLP tasks, focusing on the benefits of utilizing the Transformer architecture in them; (iv) we ...
περισσότερα

Όλα τα τεκμήρια στο ΕΑΔΔ προστατεύονται από πνευματικά δικαιώματα.

Διεύθυνση Handle
http://hdl.handle.net/10442/hedi/58627
ND
58627
Εναλλακτικός τίτλος
Extracting knowledge from polymorphic textual data using graph-based machine learning and transformer-based deep learning techniques
Συγγραφέας
Γιαρέλης, Νικόλαος (Πατρώνυμο: Γεώργιος)
Ημερομηνία
2024
Ίδρυμα
Πανεπιστήμιο Πατρών. Σχολή Πολυτεχνική. Τμήμα Μηχανολόγων και Αεροναυπηγών Μηχανικών. Τομέας Διοίκησης και Οργάνωσης
Εξεταστική επιτροπή
Καρακαπιλίδης Νικόλαος
Χατζηλυγερούδης Ιωάννης
Τσαγκαράκης Εμμανουήλ
Μακρής Χρήστος
Κωτσιαντής Σωτήριος
Καλαμπόκης Ευάγγελος
Σταυρόπουλος Παναγιώτης
Επιστημονικό πεδίο
Επιστήμες Μηχανικού και ΤεχνολογίαΕπιστήμη Ηλεκτρολόγου Μηχανικού, Ηλεκτρονικού Μηχανικού, Μηχανικού Η/Υ ➨ Τεχνολογία μέσων
Λέξεις-κλειδιά
Θεωρία γράφων; Μάθηση σε γράφους; Μηχανική μάθηση σε γράφους; Γράφοι γνώσης; Μετασχηματιστής; Επεξεργασία φυσικής γλώσσας; Επεξεργασία φυσικής γλώσσας στα ελληνικά; Μηχανική μάθηση; Βαθιά μηχανική μάθηση; Γλωσσικά μοντέλα
Χώρα
Ελλάδα
Γλώσσα
Αγγλικά
Άλλα στοιχεία
εικ., πιν., σχημ., γραφ.
Στατιστικά χρήσης
ΠΡΟΒΟΛΕΣ
Αφορά στις μοναδικές επισκέψεις της διδακτορικής διατριβής για την χρονική περίοδο 07/2018 - 07/2023.
Πηγή: Google Analytics.
ΞΕΦΥΛΛΙΣΜΑΤΑ
Αφορά στο άνοιγμα του online αναγνώστη για την χρονική περίοδο 07/2018 - 07/2023.
Πηγή: Google Analytics.
ΜΕΤΑΦΟΡΤΩΣΕΙΣ
Αφορά στο σύνολο των μεταφορτώσων του αρχείου της διδακτορικής διατριβής.
Πηγή: Εθνικό Αρχείο Διδακτορικών Διατριβών.
ΧΡΗΣΤΕΣ
Αφορά στους συνδεδεμένους στο σύστημα χρήστες οι οποίοι έχουν αλληλεπιδράσει με τη διδακτορική διατριβή. Ως επί το πλείστον, αφορά τις μεταφορτώσεις.
Πηγή: Εθνικό Αρχείο Διδακτορικών Διατριβών.