Ανάπτυξη αλγορίθμων για την επεξεργασία δεδομένων φυσικής γλώσσας

Περίληψη

Στα πλαίσια της Διδακτορικής Διατριβής αναπτύχθηκε ένα σύστημα αυτόματης κατασκευής μορφολογικών λεξικών. Το σύστημα αυτό αποτελείται από τρία επιμέρους υποτμήματα συνδεδεμένα σειριακά, ώστε καθένα να λαμβάνει ως είσοδο την έξοδο του προηγουμένου. Το πρώτο υποσύστημα δέχεται ως είσοδο τη συλλογή κειμένων που θα αποτελέσει τη βάση δημιουργίας του μορφολογικού λεξικού και αναγνωρίζει τις λέξεις που υπάρχουν σε αυτήν δημιουργώντας μια λίστα μοναδικών λέξεων. Η λίστα αυτή αποτελεί την είσοδο του δεύτερου υποσυστήματος, που στοχεύει στο χωρισμό των λέξεων που έχουν αναγνωριστεί σε δύο τμήματα, το θέμα και την κατάληξη. Για την υλοποίηση του δεύτερου υποσυστήματος αναπτύχθηκαν τρεις διαφορετικές παραλλαγές: α. ένα ευρετικό σύστημα, β. ένα σύστημα που βασίζεται στην απόσταση Levenshtein και γ. ένα σύστημα που βασίζεται στους γενετικούς αλγορίθμους. Η τρίτη παραλλαγή είναι εκείνη που δίνει τα βέλτιστα αποτελέσματα και επιτρέπει μέσω ενός περιορισμένου συνόλου εκπαίδευσης την εύκολη προσαρμογή ...
περισσότερα

Όλα τα τεκμήρια στο ΕΑΔΔ προστατεύονται από πνευματικά δικαιώματα.

DOI
10.12681/eadd/18290
Διεύθυνση Handle
http://hdl.handle.net/10442/hedi/18290
ND
18290
Εναλλακτικός τίτλος
Development of algorithms for natural language processing
Συγγραφέας
Δετοράκης, Ζαχαρίας
Ημερομηνία
2009
Ίδρυμα
Εθνικό Μετσόβιο Πολυτεχνείο (ΕΜΠ). Σχολή Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών. Τομέας Σημάτων, Ελέγχου και Ρομποτικής
Εξεταστική επιτροπή
Καραγιάννης Γεώργιος
Τσανάκας Παναγιώτης
Ταμπουρατζής Γεώργιος
Σταφυλοπάτης Ανδρέας-Γεώργιος
Μαράτος Νικόλαος
Παπακωνσταντίνου Γεώργιος
Σταϊνχάουερ Γρηγόρης
Επιστημονικό πεδίο
Επιστήμες Μηχανικού και ΤεχνολογίαΕπιστήμη Ηλεκτρολόγου Μηχανικού, Ηλεκτρονικού Μηχανικού, Μηχανικού Η/Υ
Λέξεις-κλειδιά
Μορφολογική ανάλυση; Σύνθεση; Παραγωγή; Κλίση; Γενετικοί αλγόριθμοι; Ομαδοποίηση; Κλιτικά παραδείγματα; Επεξεργασία φυσικής γλώσσας
Χώρα
Ελλάδα
Γλώσσα
Ελληνικά
Άλλα στοιχεία
166 σ., εικ.
Στατιστικά χρήσης
ΠΡΟΒΟΛΕΣ
Αφορά στις μοναδικές επισκέψεις της διδακτορικής διατριβής για την χρονική περίοδο 07/2018 - 07/2023.
Πηγή: Google Analytics.
ΞΕΦΥΛΛΙΣΜΑΤΑ
Αφορά στο άνοιγμα του online αναγνώστη για την χρονική περίοδο 07/2018 - 07/2023.
Πηγή: Google Analytics.
ΜΕΤΑΦΟΡΤΩΣΕΙΣ
Αφορά στο σύνολο των μεταφορτώσων του αρχείου της διδακτορικής διατριβής.
Πηγή: Εθνικό Αρχείο Διδακτορικών Διατριβών.
ΧΡΗΣΤΕΣ
Αφορά στους συνδεδεμένους στο σύστημα χρήστες οι οποίοι έχουν αλληλεπιδράσει με τη διδακτορική διατριβή. Ως επί το πλείστον, αφορά τις μεταφορτώσεις.
Πηγή: Εθνικό Αρχείο Διδακτορικών Διατριβών.
Σχετικές εγγραφές (με βάση τις επισκέψεις των χρηστών)