Εξαγωγή και αναπαράσταση γνώσης από αδόμητα κείμενα βασισμένη σε γράφους και τεχνικές μηχανικής μάθησης
Περίληψη
Η παρούσα διατριβή επεκτείνει υπάρχοντα μοντέλα αναπαράστασης κειμένου που βασίζονται σε γράφους και προτείνει ένα νέο μοντέλο, το ‘graph-of-docs’, για την αναπαράσταση πολλαπλών εγγράφων κειμένου σε έναν ενιαίο γράφο. Σε αντίθεση με τις υπάρχουσες προσεγγίσεις, το graph-of-docs επιτρέπει τη διερεύνηση της σημασίας ενός όρου στο σύνολο των εγγράφων, μειώνει τη συνολική πολυπλοκότητα ανάγοντας κάθε γράφο λέξεων σε έναν κόμβο, και υποστηρίζει την εισαγωγή ακμών σχέσης μεταξύ των εγγράφων. Ως εκ τούτου, επιτρέπει τον υπολογισμό σημαντικών μετρικών σε σχέση με πολλαπλά έγγραφα και επιτρέπει τη συνύπαρξη ετερογενών δεδομένων στον ίδιο γράφο. Επιπλέον, η διατριβή προτείνει και αξιολογεί εμπειρικά το συνδυασμό των διανυσμάτων λέξεων (word embeddings), των αναπαραστάσεων κειμένου και των νευρωνικών δικτύων που βασίζονται σε γράφους για την βελτίωση κλασικών εφαρμογών της μηχανικής μάθησης, όπως η ταξινόμηση κειμένου, η παλινδρόμηση, και η επιλογή διακριτικών χαρακτηριστικών (feature selection) ...
περισσότερα
Περίληψη σε άλλη γλώσσα
In this dissertation, we build upon existing graph-based text representation models and introduce a novel one to represent multiple textual documents as a single graph, namely, the graph-of-docs text representation. As opposed to existing graph-based text representations, graph-of-docs enables the investigation of the importance of a term into a whole corpus of documents, masks the overall complexity by reducing each graph of words to a ‘document’ node, and supports the inclusion of relationship edges between documents. Hence, it enables the calculation of important metrics with respect to multiple documents and allows heterogeneous data to co-exist in a single graph. Along with the introduction of the graph-of-docs model, this dissertation proposes and empirically evaluates the combination of word embeddings, graph-based text representations and graph neural networks to advance classical machine learning tasks, including text classification, regression, feature engineering and feature ...
περισσότερα
Κατεβάστε τη διατριβή σε μορφή PDF (5.9 MB)
(Η υπηρεσία είναι διαθέσιμη μετά από δωρεάν εγγραφή)
|
Όλα τα τεκμήρια στο ΕΑΔΔ προστατεύονται από πνευματικά δικαιώματα.
|
Στατιστικά χρήσης
ΠΡΟΒΟΛΕΣ
Αφορά στις μοναδικές επισκέψεις της διδακτορικής διατριβής για την χρονική περίοδο 07/2018 - 07/2023.
Πηγή: Google Analytics.
Πηγή: Google Analytics.
ΞΕΦΥΛΛΙΣΜΑΤΑ
Αφορά στο άνοιγμα του online αναγνώστη για την χρονική περίοδο 07/2018 - 07/2023.
Πηγή: Google Analytics.
Πηγή: Google Analytics.
ΜΕΤΑΦΟΡΤΩΣΕΙΣ
Αφορά στο σύνολο των μεταφορτώσων του αρχείου της διδακτορικής διατριβής.
Πηγή: Εθνικό Αρχείο Διδακτορικών Διατριβών.
Πηγή: Εθνικό Αρχείο Διδακτορικών Διατριβών.
ΧΡΗΣΤΕΣ
Αφορά στους συνδεδεμένους στο σύστημα χρήστες οι οποίοι έχουν αλληλεπιδράσει με τη διδακτορική διατριβή. Ως επί το πλείστον, αφορά τις μεταφορτώσεις.
Πηγή: Εθνικό Αρχείο Διδακτορικών Διατριβών.
Πηγή: Εθνικό Αρχείο Διδακτορικών Διατριβών.