Περίληψη
Η παρούσα διατριβή αποτελείται από δύο θεματικές ενότητες. Στην πρώτη ενότητα παρουσιάζεται μία μέθοδος μοντελοποίησης ενός συνόλου μη διατεταγμένων σημείων από ένα σύνολο ευθυγράμμων τμημάτων και η εφαρμογή της σε διάφορα προβλήματα υπολογιστικής όρασης. Η μέθοδος βασίζεται στην παρατήρηση ότι ένα σύνολο συνευθειακών σημείων χαρακτηρίζεται από έναν πίνακα συμμεταβλητότητας του οποίου η ελάχιστη ιδιοτιμή έχει πολύ μικρή τιμή και ορίζει μία έλλειψη με μεγάλη εκκεντρότητα. Αρχικά, το σύνολο των σημείων προσεγγίζεται από μία έλλειψη η οποία στη συνέχεια διαχωρίζεται επαναληπτικά σε περισσότερες ελλείψεις ώστε το σύνολο των σημείων να προσεγγιστεί από έναν αριθμό έκκεντρων ελλείψεων. Στη συνέχεια, λαμβάνει χώρα μία διαδικασία συγχώνευσης των ελλείψεων που έχουν συγγραμικούς μέγιστους άξονες για να μειωθεί η πολυπλοκότητα του μοντέλου. Πειραματικά αποτελέσματα δείχνουν την αποτελεσματικότητα της μεθόδου να συμπιέζει την πληροφορία μη δομημένων συνόλων σημείων αλλά και σχημάτων. Επίσης, παρο ...
Η παρούσα διατριβή αποτελείται από δύο θεματικές ενότητες. Στην πρώτη ενότητα παρουσιάζεται μία μέθοδος μοντελοποίησης ενός συνόλου μη διατεταγμένων σημείων από ένα σύνολο ευθυγράμμων τμημάτων και η εφαρμογή της σε διάφορα προβλήματα υπολογιστικής όρασης. Η μέθοδος βασίζεται στην παρατήρηση ότι ένα σύνολο συνευθειακών σημείων χαρακτηρίζεται από έναν πίνακα συμμεταβλητότητας του οποίου η ελάχιστη ιδιοτιμή έχει πολύ μικρή τιμή και ορίζει μία έλλειψη με μεγάλη εκκεντρότητα. Αρχικά, το σύνολο των σημείων προσεγγίζεται από μία έλλειψη η οποία στη συνέχεια διαχωρίζεται επαναληπτικά σε περισσότερες ελλείψεις ώστε το σύνολο των σημείων να προσεγγιστεί από έναν αριθμό έκκεντρων ελλείψεων. Στη συνέχεια, λαμβάνει χώρα μία διαδικασία συγχώνευσης των ελλείψεων που έχουν συγγραμικούς μέγιστους άξονες για να μειωθεί η πολυπλοκότητα του μοντέλου. Πειραματικά αποτελέσματα δείχνουν την αποτελεσματικότητα της μεθόδου να συμπιέζει την πληροφορία μη δομημένων συνόλων σημείων αλλά και σχημάτων. Επίσης, παρουσιάζεται η εφαρμογή της μεθόδου στον εντοπισμό του σημείου διαφυγής σε εικονοσειρές, στον εντοπισμό και χαρακτηρισμό εικόνων του βυθού του αμφιβληστροειδούς χιτώνα του οφθαλμού, στη δειγματοληψία χαρτών ακμών από 2Δ εικόνες καθώς και στην εξάλειψη του θορύβου και ακραίων μετρήσεων σε 2Δ σύνολα σημείων. Όλες αυτές οι μέθοδοι συγκρίνονται επιτυχώς με μεθόδους της βιβλιογραφίας.Το δεύτερο μέρος της διατριβής εστιάζει στο πρόβλημα της υπέρθεσης εικόνων και συ\-νόλων σημείων. Υπέρθεση είναι η διαδικασία της εκτίμησης του γεωμετρικού μετασχηματισμού που φέρνει σε αντιστοιχία δύο σύνολα σημείων ή εικόνες. Στην εργασία αυτή, οι εικόνες/σύνολα σημείων μοντελοποιούνται από μικτές κατανομές και η υπέρθεση επιτυγχάνεται με την ελαχιστοποίηση της απόστασης μεταξύ των κατανομών. Προτείνεται η μοντελοποίηση των δεδομένων με μικτές κανονικές κατανομές όσο και από μικτές κατανομές Student's t οι οποίες είναι εύρωστες σε δεδομένα που δεν ακολουθούν το κυρίαρχο μοντέλο.Επίσης, η διαδικασία της υπέρθεσης περιγράφεται ως ένα πρόβλημα Μπεϋζιανής παλινδρόμησης με τη μοντελοποίηση του μετασχηματισμού από μηχανές διανυσμάτων συνάφειας (RVM) τα οποία παρέχουν μία κλειστής μορφής λύση για το γεωμετρικό μετασχηματισμό. Στο πλαίσιο αυτό παρουσιάζεται ένας επαναληπτικός αλγόρι-μος που εκτελεί ένα βήμα αντιστοίχισης μεταξύ των εικονοστοιχείων/σημείων και στη συνέχεια με βάση αυτή την αντιστοίχιση εκτιμάει τον ελαστικό γεωμετρικό μετασχηματισμό που συνδέει τα δύο σύνολα.
περισσότερα
Περίληψη σε άλλη γλώσσα
This thesis is divided into two parts. The first part focuses on an algorithm that fits line segments to a set of unordered points and its application to computer vision problems.The method is based on the observation that a set of collinear points are characterized by a covariance matrix whose minimum eigenvalue is low and therefore defines an eccentric (elongated) ellipse. At first, a single ellipse is fitted to the whole set of points which is then iteratively split to a large number of highly eccentric ellipses. Then, a merge process follows in order to combine neighboring ellipses with almost collinear major axes to reduce the complexity of the model. Experimental results on various databases show that the proposed scheme is an efficient technique for modeling unordered sets of points and shapes by line segments. A number of computer vision application of the method are also presented: the localization of the vanishing point in an image sequence, the detection of retinal fundus im ...
This thesis is divided into two parts. The first part focuses on an algorithm that fits line segments to a set of unordered points and its application to computer vision problems.The method is based on the observation that a set of collinear points are characterized by a covariance matrix whose minimum eigenvalue is low and therefore defines an eccentric (elongated) ellipse. At first, a single ellipse is fitted to the whole set of points which is then iteratively split to a large number of highly eccentric ellipses. Then, a merge process follows in order to combine neighboring ellipses with almost collinear major axes to reduce the complexity of the model. Experimental results on various databases show that the proposed scheme is an efficient technique for modeling unordered sets of points and shapes by line segments. A number of computer vision application of the method are also presented: the localization of the vanishing point in an image sequence, the detection of retinal fundus image features, such as end-points, junctions, and crossovers, an algorithm for sampling image edges and a framework for modeling and removing outliers from a set of unordered points. All of the above methods were successfully compared to various alternative methods of the related literature and provided in general better results.The second part of the thesis focuses on the problem of image and point set registration. Registration is the process of determining the parameters of a geometric transformation that brings into alignment two images or point sets. In this work, the images/point sets to be registered are modeled by a mixture model and a method relying on the minimization of the distance between distributions is proposed. We address the problems of single and multimodal registration by employing both Gaussian mixture models and mixtures of Student's t distributions, which are robust to outliers. Moreover, we express the task of registration as a Bayesian regression problem with by modeling the non rigid transformation by relevance vector machines which provide a closed form solution for the estimation of the transformation. An iterative algorithm is presented which first determines the correspondence between pixels/points in the two data images/points sets and then the non rigid transformation is estimated based on that data association.
περισσότερα