Αποκατάσταση της καταληπτότητας της ομιλίας σε σύνθετα ηχητικά περιβάλλοντα για άτομα με απώλεια ακοής με τη χρήση τεχνικών βαθιάς μάθησης
Περίληψη
Η αντίληψη της ομιλίας σε σύνθετα ηχητικά περιβάλλοντα, ιδίως σε συνθήκες με θόρυβο και πολλαπλούς ομιλητές, αποτελεί μία από τις σημαντικότερες προκλήσεις για άτομα με απώλεια ακοής, επηρεάζοντας σημαντικά την κοινωνική, ψυχολογική και εργασιακή τους ζωή. Η παρούσα διατριβή επικεντρώνεται στην αξιοποίηση της βαθιάς μάθησης ως εργαλείου για την επεξεργασία και την ανάλυση του ήχου, με ιδιαίτερη έμφαση στην αντίληψη της ομιλίας από άτομα με απώλεια ακοής. Συγκεκριμένα, επιδιώκεται η ανάπτυξη μεθόδων που ενσωματώνουν ψυχοακουστικούς και σημασιολογικούς παράγοντες του ηχητικού περιεχομένου, με στόχο την αποκατάσταση της καταληπτότητας της ομιλίας σε σύνθετα ηχητικά περιβάλλοντα. Στο πλαίσιο αυτό, αναπτύχθηκε μία μέθοδος που αξιοποιεί τεχνικές βαθιάς μάθησης για την επεξεργασία μονοφωνικών σημάτων ομιλίας, βασιζόμενη στη χρονική κωδικοποίηση του ήχου από το ανθρώπινο ακουστικό σύστημα. Η προτεινόμενη μέθοδος έδειξε βελτιωμένα αποτελέσματα ενίσχυσης της ομιλίας σε συνθήκες με θόρυβο υποβάθρ ...
περισσότερα
Περίληψη σε άλλη γλώσσα
Speech perception in complex acoustic environments, especially in conditions with background noise and multiple speakers, presents a substantial challenge for individuals with hearing loss, significantly impacting their social, psychological, and occupational lives. This dissertation focuses on leveraging deep learning for audio processing and analysis tasks, with a particular emphasis on enhancing speech perception in challenging listening conditions for individuals with hearing loss. Specifically, it aims to develop methods that leverage psychoacoustic and semantic factors to enhance speech intelligibility in noisy environments. In this context, a method utilizing deep learning techniques for single-channel speech signal processing was developed, based on the temporal coding mechanisms of the human auditory system. The proposed method showed improved objective results in the enhancement of speech in background noise. The research extends to the semantic audio analysis domain, aiming ...
περισσότερα
Κατεβάστε τη διατριβή σε μορφή PDF (7.34 MB)
(Η υπηρεσία είναι διαθέσιμη μετά από δωρεάν εγγραφή)
|
Όλα τα τεκμήρια στο ΕΑΔΔ προστατεύονται από πνευματικά δικαιώματα.
|
Στατιστικά χρήσης
ΠΡΟΒΟΛΕΣ
Αφορά στις μοναδικές επισκέψεις της διδακτορικής διατριβής για την χρονική περίοδο 07/2018 - 07/2023.
Πηγή: Google Analytics.
Πηγή: Google Analytics.
ΞΕΦΥΛΛΙΣΜΑΤΑ
Αφορά στο άνοιγμα του online αναγνώστη για την χρονική περίοδο 07/2018 - 07/2023.
Πηγή: Google Analytics.
Πηγή: Google Analytics.
ΜΕΤΑΦΟΡΤΩΣΕΙΣ
Αφορά στο σύνολο των μεταφορτώσων του αρχείου της διδακτορικής διατριβής.
Πηγή: Εθνικό Αρχείο Διδακτορικών Διατριβών.
Πηγή: Εθνικό Αρχείο Διδακτορικών Διατριβών.
ΧΡΗΣΤΕΣ
Αφορά στους συνδεδεμένους στο σύστημα χρήστες οι οποίοι έχουν αλληλεπιδράσει με τη διδακτορική διατριβή. Ως επί το πλείστον, αφορά τις μεταφορτώσεις.
Πηγή: Εθνικό Αρχείο Διδακτορικών Διατριβών.
Πηγή: Εθνικό Αρχείο Διδακτορικών Διατριβών.