Μέθοδοι ανάλυσης και ψηφιακής επεξεργασίας για την βελτίωση σημάτων ομιλίας και μουσικής σε χώρους με αντήχηση

Περίληψη

Η διατριβή αποτελείται από εννιά κεφάλαια δυο παραρτήματα καθώς και την σχετική βιβλιογραφία. Είναι γραμμένη στα αγγλικά ενώ περιλαμβάνει και ελληνική περίληψη. Στην παρούσα διατριβή αναπτύσσονται μέθοδοι ψηφιακής επεξεργασίας σήματος για την αφαίρεση αντήχησης από σήματα ομιλίας και μουσικής. Οι προτεινόμενοι αλγόριθμοι καλύπτουν ε να μεγάλο εύρος εφαρμογών αρχικά εστιάζοντας στην τυφλή (blind) αφαίρεση για μονοκαναλικά σήματα. Στοχεύοντας σε πιο ειδικά σενάρια χρήσης προτείνονται επίσης αμφιωτικοί αλγόριθμοι άλλα και τεχνικές που προϋποθέτουν την πραγματοποίηση κάποιας ακουστικής μέτρησης. Οι αλγόριθμοι επικεντρώνουν στην αφαίρεση της καθυστερημένης αντήχησης που είναι ιδιαίτερα επιβλαβής για την ποιότητα σημάτων ομιλίας και μουσικής και μειώνει την καταληπτότητα της ομιλίας. Επίσης επειδή αλλοιώνει σημαντικά τα στατιστικά των σημάτων μειώνει σημαντικά την απόδοση συστημάτων αυτόματης αναγνώρισης ομιλίας καθώς και άλλων αλγορίθμων ψηφιακής επεξεργασίας ομιλίας και μουσικής. Έτσι οι π ...
περισσότερα

Περίληψη σε άλλη γλώσσα

This thesis presents novel signal processing algorithms for speech and music dereverberation. The proposed algorithms focus on blind single-channel suppression of late reverberation however binaural and semi-blind methods have also been introduced Late reverberation is a particularly harmful distortion since it significantly decreases the perceived quality of the reverberant signals but also degrades the performance of Automatic Speech Recognition (ASR) systems and other speech and music processing algorithms. Hence the proposed deverberation methods can be either used as standalone enhancing techniques or implemented as preprocessing schemes prior to ASR or other applied systems. The main dereverberation method proposed here is a blind dereverberation technique based on perceptual reverberation modeling has been developed. This technique employs a computational auditory masking model and locates the signal regions where late reverberation is audible i.e. where it is unmasked from the ...
περισσότερα

Όλα τα τεκμήρια στο ΕΑΔΔ προστατεύονται από πνευματικά δικαιώματα.

DOI
10.12681/eadd/25733
Διεύθυνση Handle
http://hdl.handle.net/10442/hedi/25733
ND
25733
Εναλλακτικός τίτλος
Signal processing methods for enhancing speech and music signals in reverberant environments
Συγγραφέας
Τσιλφίδης, Αλέξανδρος (Πατρώνυμο: Βασίλειος)
Ημερομηνία
2011
Ίδρυμα
Πανεπιστήμιο Πατρών. Σχολή Πολυτεχνική. Τμήμα Ηλεκτρολόγων Μηχανικών και Τεχνολογίας Υπολογιστών. Τομέας Τηλεπικοινωνιών και Τεχνολογίας της Πληροφορίας
Εξεταστική επιτροπή
Μουρτζόπουλος Ιωάννης
Φακωτάκης Νικόλαος
Δερματάς Ευάγγελος
Αναστασόπουλος Βασίλειος
Μπερμπερίδης Κωνσταντίνος
Σκαρλάτος Δημήτριος
Τουμπακάρης Δημήτριος-Αλέξανδρος
Επιστημονικό πεδίο
Επιστήμες Μηχανικού και Τεχνολογία
Επιστήμη Ηλεκτρολόγου Μηχανικού, Ηλεκτρονικού Μηχανικού, Μηχανικού Η/Υ
Λέξεις-κλειδιά
Ψηφιακή επεξεργασία σημάτων; Ακουστική χώρων; Ψυχοακουστική; Αφαίρεση αντήχησης; Αφαίρεση ακουστικού θορύβου; Αυτόματη αναγνώριση ομιλίας; Επεξεργασία μουσικής
Χώρα
Ελλάδα
Γλώσσα
Αγγλικά
Άλλα στοιχεία
xxiv, 153, [χ.α.] σ., εικ.
Στατιστικά χρήσης
ΠΡΟΒΟΛΕΣ
Αφορά στις μοναδικές επισκέψεις της διδακτορικής διατριβής για την χρονική περίοδο 07/2018 - 07/2023.
Πηγή: Google Analytics.
ΞΕΦΥΛΛΙΣΜΑΤΑ
Αφορά στο άνοιγμα του online αναγνώστη για την χρονική περίοδο 07/2018 - 07/2023.
Πηγή: Google Analytics.
ΜΕΤΑΦΟΡΤΩΣΕΙΣ
Αφορά στο σύνολο των μεταφορτώσων του αρχείου της διδακτορικής διατριβής.
Πηγή: Εθνικό Αρχείο Διδακτορικών Διατριβών.
ΧΡΗΣΤΕΣ
Αφορά στους συνδεδεμένους στο σύστημα χρήστες οι οποίοι έχουν αλληλεπιδράσει με τη διδακτορική διατριβή. Ως επί το πλείστον, αφορά τις μεταφορτώσεις.
Πηγή: Εθνικό Αρχείο Διδακτορικών Διατριβών.
Σχετικές εγγραφές (με βάση τις επισκέψεις των χρηστών)