Αποσαφήνιση εννοιών λέξεων και μέτρα σημασιολογικής εγγύτητας βασισμένα στη χρήση γλωσσικών θησαυρών

Περίληψη

Η κατηγοριοποίηση κειμένων και η ανάκτηση πληροφορίας από κείμενα μελετάται εντατικά τις τελευταίες τέσσερις δεκατίες, και είναι ακόμη πιο επίκαιρη στην εποχή του παγκόσμιου ιστού, αφού το πλήθος των ηλεκτρονικών κειμένων αυξάνεται συνεχώς με μεγάλους ρυθμούς. Τα παραδοσιακά μοντέλα αναπαράστασης κειμένων στις δύο αυτές εφαρμογές, όπως το διανυσματικό μοντέλο, πάσχουν από το πρόβλημα της ανάγκης για ακριβή ταύτιση λέξεων ανάμεσα στα κείμενα, προκειμένου να υπολογίσουν την ομοιότητά τους. Ως συνέπεια, αγνοούν την σημασιολογική σχετικότητα ανάμεσα στα κείμενα και υποθέτουν ότι ένα ζευγάρι κειμένων πρέπει απαραίτητα να έχει κοινούς όρους ώστε να έχει κάποια ελάχιστη σχετικότητα. Η παρούσα διατριβή επιλύει αυτό το πρόβλημα προτείνοντας νέα μοντέλα για την αναπαράσταση των κειμένων, βασισμένα στην σημασιολογική πληροφορία που περιέχουν σημασιολογικοί θησαυροί, όπως το WordNet, και ταυτόχρονα νέους τρόπους υπολογισμού της σχετικότητας ανάμεσα στα κείμενα, οι οποίοι λαμβάνουν υπόψη την σημασι ...
περισσότερα

Περίληψη σε άλλη γλώσσα

As the immense amount of text data increases rapidly over the years, the need to improve the quality of algorithms in text related tasks is eminent. Traditional mod- els for representing documents, like the standard vector space model, often neglect the aspect of semantic relatedness between words, suffering from the restriction of exact keywords matching, in order to explore the similarity or relatedness between segments of text. In critical tasks, like text classification and retrieval, which have been studied over the past decades intensively, this assumption of exact keyword matching is often the reason for poor performance. This thesis comes to explore the potential of incorporating semantic relatedness between documents in several text related applications, like text classification, retrieval and paraphrasing recognition. Several aspects have been taken into account, like word sense disambiguation to extract semantic information from text and the use of a word thesaurus, namely W ...
περισσότερα

Όλα τα τεκμήρια στο ΕΑΔΔ προστατεύονται από πνευματικά δικαιώματα.

DOI
10.12681/eadd/17724
Διεύθυνση Handle
http://hdl.handle.net/10442/hedi/17724
ND
17724
Εναλλακτικός τίτλος
Word sense disambiguation and text relatedness based on word thesauri
Συγγραφέας
Τσατσαρώνης, Γεώργιος (Πατρώνυμο: Βασίλειος)
Ημερομηνία
2009
Ίδρυμα
Οικονομικό Πανεπιστήμιο Αθηνών. Σχολή Επιστημών και Τεχνολογίας της Πληροφορίας. Τμήμα Πληροφορικής
Εξεταστική επιτροπή
Βαζιργιάννης Μιχάλης
Ανδρουτσόπουλος Ίων
Γιαννακουδάκης Εμμανουήλ
Καλαμπούκης Θεόδωρος
Γιακουμάκης Εμμανουήλ
Σπυρόπουλος Κωνσταντίνος
Σιδέρη Μάρθα
Επιστημονικό πεδίο
Φυσικές Επιστήμες
Επιστήμη Ηλεκτρονικών Υπολογιστών και Πληροφορική
Λέξεις-κλειδιά
Αποσαφήνιση εννοιών λέξεων; Μέτρα σημασιολογικής ομοιότητας και εγγύτητας; Γλωσσικοί θησαυροί; Κατηγοριοποίηση κειμένων; Ανάκτηση πληροφοριών από κείμενα; Σημασιολογικά δίκτυα; Εξόρυξη γνώσης
Χώρα
Ελλάδα
Γλώσσα
Αγγλικά
Άλλα στοιχεία
χιι, 145 σ., πιν., σχημ., γραφ.
Στατιστικά χρήσης
ΠΡΟΒΟΛΕΣ
Αφορά στις μοναδικές επισκέψεις της διδακτορικής διατριβής για την χρονική περίοδο 07/2018 - 07/2023.
Πηγή: Google Analytics.
ΞΕΦΥΛΛΙΣΜΑΤΑ
Αφορά στο άνοιγμα του online αναγνώστη για την χρονική περίοδο 07/2018 - 07/2023.
Πηγή: Google Analytics.
ΜΕΤΑΦΟΡΤΩΣΕΙΣ
Αφορά στο σύνολο των μεταφορτώσων του αρχείου της διδακτορικής διατριβής.
Πηγή: Εθνικό Αρχείο Διδακτορικών Διατριβών.
ΧΡΗΣΤΕΣ
Αφορά στους συνδεδεμένους στο σύστημα χρήστες οι οποίοι έχουν αλληλεπιδράσει με τη διδακτορική διατριβή. Ως επί το πλείστον, αφορά τις μεταφορτώσεις.
Πηγή: Εθνικό Αρχείο Διδακτορικών Διατριβών.
Σχετικές εγγραφές (με βάση τις επισκέψεις των χρηστών)