Τεχνικές μηχανικής μάθησης για σημασιολογική δεικτοδότηση βιοϊατρικής βιβλιογραφίας με εκλεπτυσμένες έννοιες

Περίληψη

Αυτή η διατριβή εστιάζει σε τεχνικές μηχανικής μάθησης για την αυτοματοποιημένη δεικτοδότηση της βιοϊατρικής βιβλιογραφίας με σημασιολογικά σχετικές αλλά διακριτές εκλεπτυσμένες έννοιες, όπως υποκατηγορίες ασθενειών, διαφορετικές πρωτεΐνες της ίδιας οικογένειας ή διαφορετικά είδη οργανισμών που ανήκουν στο ίδιο γένος, το οποίο είναι πέρα από την τρέχουσα πρακτική. Συγκεκριμένα, διερευνά τις προκλήσεις και τις δυνατότητες σε αυτό το ανεξερεύνητο και απαιτητικό έργο προτείνοντας νέες μεθόδους μηχανικής μάθησης για την αντιμετώπισή του. Αυτές οι μέθοδοι συμπληρώνουν και βελτιώνουν τις υπάρχουσες προσεγγίσεις αναζήτησης, ανάκτησης και ενσωμάτωσης βιοϊατρικής γνώσης, εντοπίζοντας και αντιμετωπίζοντας συγκεκριμένα ανοιχτά ζητήματα και καθιστώντας τα επιμέρους στάδια της βιοϊατρικής έρευνας πιο αποτελεσματικά. Ειδικότερα, η παρούσα διατριβή διατυπώνει την εργασία της δεικτοδότησης της βιοϊατρικής βιβλιογραφίας με εκλεπτυσμένες έννοιες (Fine-Grained Semantic Indexing, FGSI), που εμποδίζεται α ...
περισσότερα

Περίληψη σε άλλη γλώσσα

This thesis focuses on machine-learning techniques for the automated indexing of biomedical literature with semantically related but distinct fine-grained concepts, such as disease subcategories, different proteins of the same family, or different species of organisms belonging to the same genus, which is beyond the current practice. Specifically, it investigates the challenges and potential in this unexplored and challenging task proposing new machine learning methods to tackle it. These methods complement and improve existing approaches for searching, retrieving, and integrating biomedical knowledge, identifying and addressing specific open issues, and making individual stages of biomedical research more efficient. In particular, this thesis formulates the task of Fine-Grained Semantic Indexing (FGSI) of the biomedical literature, hindered by the lack of ground truth labels. It introduces the Concept Occurrence (CO) heuristic as a strong and precise source of weak supervision and pro ...
περισσότερα

Όλα τα τεκμήρια στο ΕΑΔΔ προστατεύονται από πνευματικά δικαιώματα.

DOI
10.12681/eadd/57172
Διεύθυνση Handle
http://hdl.handle.net/10442/hedi/57172
ND
57172
Εναλλακτικός τίτλος
Machine learning techniques for fine-grained semantic indexing of biomedical literature
Συγγραφέας
Νεντίδης, Αναστάσιος (Πατρώνυμο: Γεώργιος)
Ημερομηνία
2024
Ίδρυμα
Αριστοτέλειο Πανεπιστήμιο Θεσσαλονίκης (ΑΠΘ). Σχολή Θετικών Επιστημών. Τμήμα Πληροφορικής
Εξεταστική επιτροπή
Τσουμάκας Γρηγόριος
Βασιλειάδης Νικόλαος
Παλιούρας Γεώργιος
Μεδίτσκος Γεώργιος
Παπαρρίζος Γιάννης
Παπαθεοδώρου Χρήστος
Γιαννακόπουλος Γιώργος
Επιστημονικό πεδίο
Φυσικές ΕπιστήμεςΕπιστήμη Ηλεκτρονικών Υπολογιστών και Πληροφορική ➨ Τεχνητή νοημοσύνη
Λέξεις-κλειδιά
Σημασιολογική δεικτοδότηση; Βιοϊατρική βιβλιογραφία; Επικεφαλίδες ιατρικών θεμάτων (MeSH); Μηχανική μάθηση; Ασθενώς επιβλεπόμενη μάθηση; Βαθειά μάθηση; Μάθηση χωρίς παραδείγματα
Χώρα
Ελλάδα
Γλώσσα
Αγγλικά
Άλλα στοιχεία
εικ., πιν., σχημ., γραφ.
Στατιστικά χρήσης
ΠΡΟΒΟΛΕΣ
Αφορά στις μοναδικές επισκέψεις της διδακτορικής διατριβής για την χρονική περίοδο 07/2018 - 07/2023.
Πηγή: Google Analytics.
ΞΕΦΥΛΛΙΣΜΑΤΑ
Αφορά στο άνοιγμα του online αναγνώστη για την χρονική περίοδο 07/2018 - 07/2023.
Πηγή: Google Analytics.
ΜΕΤΑΦΟΡΤΩΣΕΙΣ
Αφορά στο σύνολο των μεταφορτώσων του αρχείου της διδακτορικής διατριβής.
Πηγή: Εθνικό Αρχείο Διδακτορικών Διατριβών.
ΧΡΗΣΤΕΣ
Αφορά στους συνδεδεμένους στο σύστημα χρήστες οι οποίοι έχουν αλληλεπιδράσει με τη διδακτορική διατριβή. Ως επί το πλείστον, αφορά τις μεταφορτώσεις.
Πηγή: Εθνικό Αρχείο Διδακτορικών Διατριβών.