Ανάκτηση και κατηγοριοποίηση πολυμεσικών αντικειμένων

Περίληψη

Η παρούσα διατριβή ερευνά το πρόβλημα της ανάκτησης και κατηγοριοποίησης πολυμεσικού περιεχομένου. Στο πρώτο μέρος γίνεται μία διερεύνηση της εφαρμογής Λανθάνουσας Σημασιολογικής Ανάλυσης για ανάκτηση εικόνας σε συλλογές μεγάλης κλίμακας (LSA). Παρουσιάζεται μία αποτελεσματική προσέγγιση για την εφαρμογή LSA η οποία παρακάμπτει την Ανάλυση Ιδιαζουσών Τιμών (SVD) στον πίνακα χαρακτηριστικών, ξεπερνώντας με αυτόν τον τρόπο το πρόβλημα της εφαρμογής της μεθόδου σε σύνολα δεδομένων μεγάλης κλίμακας. Στη μελέτη αυτή διερευνάται ο συνδυασμός διαφορετικών αναπαραστάσεων εικόνας είτε σε πρώιμο στάδιο (Early fusion) είτε σε μεταγενέστερο (Late fusion) με στόχο την αποτελεσματικότερη ανάκτηση εικόνας. Επιπλέον, προτείνεται μία συνάρτηση πυρήνα (Kernel function) βασισμένη στην LSA η οποία συσχετίζει χαρακτηριστικά από διαφορετικές πηγές σε ένα κοινό λανθάνοντα χώρο. Η προτεινόμενη προσέγγιση συνδυάζει την ταξινόμηση με την ανάκτηση, αναπαριστώντας τις εικόνες με ένα σύνθετο διάνυσμα ενσωματώνοντα ...
περισσότερα

Περίληψη σε άλλη γλώσσα

In this thesis the problem of multimedia object classification and retrieval is studied. The first part examines the application of Latent Semantic Analysis to large scale image retrieval. An effective and efficient approach of applying LSA is presented skipping the SVD solution of the feature matrix and overcoming in this way the deficiencies of the method with large scale datasets. The study demonstrates that early fusion of several composite descriptors with visual words increase retrieval effectiveness. It also combines well with late fusion for mixed (textual and visual) ad hoc and modality classification. The results reported are comparable to state of the art algorithms. In addition, we propose an LSA based kernel function which effectively integrates low-level visual features with higher semantic ones into a common latent space that correlates multi-modal features (features from different sources) in the same latent space. The proposed approach also effectively incorporates cla ...
περισσότερα

Όλα τα τεκμήρια στο ΕΑΔΔ προστατεύονται από πνευματικά δικαιώματα.

DOI
10.12681/eadd/44612
Διεύθυνση Handle
http://hdl.handle.net/10442/hedi/44612
ND
44612
Εναλλακτικός τίτλος
Multimedia object classification and retrieval
Συγγραφέας
Σταθόπουλος, Σπυρίδωνας (Πατρώνυμο: Νικόλαος)
Ημερομηνία
2018
Ίδρυμα
Οικονομικό Πανεπιστήμιο Αθηνών. Σχολή Επιστημών και Τεχνολογίας της Πληροφορίας. Τμήμα Πληροφορικής
Εξεταστική επιτροπή
Καλάμπουκης Θεόδωρος
Βαζιργίαννης Μιχαήλ
Βασσάλος Πάρης
Γουνόπουλος Δημήτρης
Ανδρουτσόπουλος Ιων
Παπαϊωάννου Γεώργιο
Τίτσιας Μιχάηλ
Επιστημονικό πεδίο
Φυσικές ΕπιστήμεςΕπιστήμη Ηλεκτρονικών Υπολογιστών και Πληροφορική
Λέξεις-κλειδιά
Ανάκτηση εικόνας; Κατηγοριοποίηση εικόνας; Λανθάνουσα σημασιολογική ανάλυση; Συνελικτικά νευρωνικά δίκτυα; Αναπράσταση εικόνας
Χώρα
Ελλάδα
Γλώσσα
Αγγλικά
Άλλα στοιχεία
ιιι, 129 σ., εικ., πιν., σχημ., γραφ.
Στατιστικά χρήσης
ΠΡΟΒΟΛΕΣ
Αφορά στις μοναδικές επισκέψεις της διδακτορικής διατριβής για την χρονική περίοδο 07/2018 - 07/2023.
Πηγή: Google Analytics.
ΞΕΦΥΛΛΙΣΜΑΤΑ
Αφορά στο άνοιγμα του online αναγνώστη για την χρονική περίοδο 07/2018 - 07/2023.
Πηγή: Google Analytics.
ΜΕΤΑΦΟΡΤΩΣΕΙΣ
Αφορά στο σύνολο των μεταφορτώσων του αρχείου της διδακτορικής διατριβής.
Πηγή: Εθνικό Αρχείο Διδακτορικών Διατριβών.
ΧΡΗΣΤΕΣ
Αφορά στους συνδεδεμένους στο σύστημα χρήστες οι οποίοι έχουν αλληλεπιδράσει με τη διδακτορική διατριβή. Ως επί το πλείστον, αφορά τις μεταφορτώσεις.
Πηγή: Εθνικό Αρχείο Διδακτορικών Διατριβών.
Σχετικές εγγραφές (με βάση τις επισκέψεις των χρηστών)