Εκτίμηση σε πολλαπλά πεδία και παραγωγική μοντελοποίηση για σύνθεση εικόνων χεριών

Περίληψη

Η εκθετική ανάπτυξη των μεθοδολογιών υπολογιστικής όρασης, ιδιαίτερα των αρχιτεκτονικών βαθιάς μάθησης, έχει αυξήσει σημαντικά τη ζήτηση για δεδομένα υψηλής ποιότητας σε πολλούς τομείς, για την χρήση τους ως είσοδο ή έξοδο συστημάτων. Ενώ η παραγωγή συνθετικών δεδομένων έχει δει πολυάριθμες εξελίξεις σε πολλούς τομείς, δυστυχώς δεν ισχύει το ίδιο στον τομέα των εργασιών που σχετίζονται με το ανθρώπινο χέρι. Οι λίγες διαθέσιμες προσεγγίσεις σύνθεσης δεν επιτυγχάνουν ικανοποιητικό ρεαλισμό σε πολλαπλά πεδία (όπως το χρώμα, το βάθος, κλπ). Αυτή η διατριβή στοχεύει να αντιμετωπίσει αυτό το κενό, προτείνοντας νέες μεθοδολογίες για τη σύνθεση εικόνας χεριού στα πεδία του χρώματος και βάθους, εστιάζοντας συγκεκριμένα στην εκτίμηση βάθους, την αποτελεσματική πιθανολογική παραγωγική μοντελοποίηση και τη ελεγχόμενη παραγωγή δεδομένων. Για να αντιμετωπίσουμε το πρόβλημα εκτίμησης βάθους χεριού, στοχεύουμε στην εξισορρόπηση της ακρίβειας και της υπολογιστικής πολυπλοκότητας. Σε αυτή την κατεύθυνση ...
περισσότερα

Περίληψη σε άλλη γλώσσα

The exponential growth of computer vision methodologies, particularly deep learning architectures, has significantly increased the demand for high-quality data across multiple domains, to serve as input or output modalities. While synthetic data generation has seen numerous developments in many areas, unfortunately the same does not apply to the field of human hand-related tasks. The few available synthesis approaches fail to achieve satisfactory realism and multi-domain variety. This dissertation aims to address this gap by proposing novel methodologies for hand image synthesis in the RGB and depth domains, focusing specifically on depth estimation, efficient probabilistic generative modeling, and controllable data generation. To tackle the hand depth estimation problem, we aim at balancing accuracy and computational complexity. In that direction, we present a lightweight model based on the stacked-hourglass architecture for monocular RGB-to-depth estimation of hand images. Employing ...
περισσότερα

Όλα τα τεκμήρια στο ΕΑΔΔ προστατεύονται από πνευματικά δικαιώματα.

Διεύθυνση Handle
http://hdl.handle.net/10442/hedi/58574
ND
58574
Εναλλακτικός τίτλος
Multi-domain inference and generative modeling for hand image synthesis
Συγγραφέας
Νικοδήμου, Βασίλειος-Κλείτος (Πατρώνυμο: Βασίλης)
Ημερομηνία
2025
Ίδρυμα
Πανεπιστήμιο Κρήτης. Σχολή Θετικών και Τεχνολογικών Επιστημών. Τμήμα Επιστήμης Υπολογιστών
Εξεταστική επιτροπή
Αργυρός Αντώνιος
Τζιμηρόπουλος Γεώργιος
Ζαμπούλης Ξενοφών
Κομοντάκης Νικόλαος
Τσαγκατάκης Γρηγόριος
Ρούσσος Αναστάσιος
Τραχανιάς Παναγιώτης
Επιστημονικό πεδίο
Φυσικές ΕπιστήμεςΕπιστήμη Ηλεκτρονικών Υπολογιστών και Πληροφορική ➨ Τεχνητή νοημοσύνη
Φυσικές ΕπιστήμεςΕπιστήμη Ηλεκτρονικών Υπολογιστών και Πληροφορική ➨ Επιστήμη ηλεκτρονικών υπολογιστών και Πληροφορική, άλλοι τομείς
Λέξεις-κλειδιά
Συνθετικά Δεδομένα; Εκτίμηση βάθους χεριού; Πιθανολογική μοντελοποίηση; Τυχαίες μεταβλητές; Μοντελοποίηση υπό όρους; ∆ιαχωρισμός δεδομένων χεριού
Χώρα
Ελλάδα
Γλώσσα
Αγγλικά
Άλλα στοιχεία
εικ., πιν., σχημ., γραφ.
Στατιστικά χρήσης
ΠΡΟΒΟΛΕΣ
Αφορά στις μοναδικές επισκέψεις της διδακτορικής διατριβής για την χρονική περίοδο 07/2018 - 07/2023.
Πηγή: Google Analytics.
ΞΕΦΥΛΛΙΣΜΑΤΑ
Αφορά στο άνοιγμα του online αναγνώστη για την χρονική περίοδο 07/2018 - 07/2023.
Πηγή: Google Analytics.
0
ΜΕΤΑΦΟΡΤΩΣΕΙΣ
Αφορά στο σύνολο των μεταφορτώσων του αρχείου της διδακτορικής διατριβής.
Πηγή: Εθνικό Αρχείο Διδακτορικών Διατριβών.
0
ΧΡΗΣΤΕΣ
Αφορά στους συνδεδεμένους στο σύστημα χρήστες οι οποίοι έχουν αλληλεπιδράσει με τη διδακτορική διατριβή. Ως επί το πλείστον, αφορά τις μεταφορτώσεις.
Πηγή: Εθνικό Αρχείο Διδακτορικών Διατριβών.