Ανάπτυξη αλγορίθμων για την επεξεργασία δεδομένων φυσικής γλώσσας
Περίληψη
Στα πλαίσια της Διδακτορικής Διατριβής αναπτύχθηκε ένα σύστημα αυτόματης κατασκευής μορφολογικών λεξικών. Το σύστημα αυτό αποτελείται από τρία επιμέρους υποτμήματα συνδεδεμένα σειριακά, ώστε καθένα να λαμβάνει ως είσοδο την έξοδο του προηγουμένου. Το πρώτο υποσύστημα δέχεται ως είσοδο τη συλλογή κειμένων που θα αποτελέσει τη βάση δημιουργίας του μορφολογικού λεξικού και αναγνωρίζει τις λέξεις που υπάρχουν σε αυτήν δημιουργώντας μια λίστα μοναδικών λέξεων. Η λίστα αυτή αποτελεί την είσοδο του δεύτερου υποσυστήματος, που στοχεύει στο χωρισμό των λέξεων που έχουν αναγνωριστεί σε δύο τμήματα, το θέμα και την κατάληξη. Για την υλοποίηση του δεύτερου υποσυστήματος αναπτύχθηκαν τρεις διαφορετικές παραλλαγές: α. ένα ευρετικό σύστημα, β. ένα σύστημα που βασίζεται στην απόσταση Levenshtein και γ. ένα σύστημα που βασίζεται στους γενετικούς αλγορίθμους. Η τρίτη παραλλαγή είναι εκείνη που δίνει τα βέλτιστα αποτελέσματα και επιτρέπει μέσω ενός περιορισμένου συνόλου εκπαίδευσης την εύκολη προσαρμογή ...
περισσότερα
![]() | |
![]() | Κατεβάστε τη διατριβή σε μορφή PDF (54.58 MB)
(Η υπηρεσία είναι διαθέσιμη μετά από δωρεάν εγγραφή)
|
Όλα τα τεκμήρια στο ΕΑΔΔ προστατεύονται από πνευματικά δικαιώματα.
|
Στατιστικά χρήσης

ΠΡΟΒΟΛΕΣ
Αφορά στις μοναδικές επισκέψεις της διδακτορικής διατριβής για την χρονική περίοδο 07/2018 - 07/2023.
Πηγή: Google Analytics.
Πηγή: Google Analytics.

ΞΕΦΥΛΛΙΣΜΑΤΑ
Αφορά στο άνοιγμα του online αναγνώστη για την χρονική περίοδο 07/2018 - 07/2023.
Πηγή: Google Analytics.
Πηγή: Google Analytics.

ΜΕΤΑΦΟΡΤΩΣΕΙΣ
Αφορά στο σύνολο των μεταφορτώσων του αρχείου της διδακτορικής διατριβής.
Πηγή: Εθνικό Αρχείο Διδακτορικών Διατριβών.
Πηγή: Εθνικό Αρχείο Διδακτορικών Διατριβών.

ΧΡΗΣΤΕΣ
Αφορά στους συνδεδεμένους στο σύστημα χρήστες οι οποίοι έχουν αλληλεπιδράσει με τη διδακτορική διατριβή. Ως επί το πλείστον, αφορά τις μεταφορτώσεις.
Πηγή: Εθνικό Αρχείο Διδακτορικών Διατριβών.
Πηγή: Εθνικό Αρχείο Διδακτορικών Διατριβών.