Αλγόριθμοι βαθιάς ενισχυτικής μάθησης για ευφυείς πράκτορες σε εικονικά περιβάλλοντα
Περίληψη
Αντικείμενο της παρούσης διατριβής είναι η δημιουργία ευφυών πρακτόρων, βασισμένων σε μεθόδους βαθιάς ενισχυτικής μάθησης, και η εφαρμογή τους σε εικονικά περιβάλλοντα που αφορούν τους τομείς εικόνας, ήχου και πινάκων. Στο τομέα της εικόνας, εφαρμόσαμε βαθιά ενισχυτική μάθηση σε συνδυασμό με νευρωνική αφαιρετική μέθοδο καταστάσεων για τη δημιουργία ενός πράκτορα ικανού να περιηγείται σε περιβάλλον λαβύρινθου βασισμένου στο Minecract, χρησιμοποιώντας μόνο ακατέργαστη οπτική πληροφορία. Περαιτέρω, εφηύραμε μία βελτιωμένη εκδοχή της ε-greedy εξερεύνησης, βασισμένη σε ανταγωνιστικά νευρωνικά δίκτυα, και δείξαμε ότι ένας πράκτορας βαθιάς ενισχυτικής μάθησης που χρησιμοποιεί αυτή τη μέθοδο εξερεύνησης μπορεί να περιηγηθεί πιο αποδοτικά σε περιβάλλοντα λαβύρινθου του Minecraft και να παίζει το δισδιάστατο παιχνίδι πλατφόρμας Super Mario Bros. Στο τομέα του ήχου, δημιουργήσαμε ένα περιβάλλον, χρησιμοποιώντας τη μηχανή του Unity, όπου ομιλητές είναι παρόντες σε διάφορα σημεία μέσα σε ένα δωμάτι ...
περισσότερα
Περίληψη σε άλλη γλώσσα
The objective of the present dissertation is the construction of intelligent agents, based on deep reinforcement learning methods, and their application on virtual environments spanning visual, auditory and tabular domains. In the visual domain, we applied deep reinforcement learning in conjunction with neural state abstraction to create an agent capable of navigating a maze environment based on Minecraft using only raw visual information. Furthermore, we devised an improved version of ε-greedy exploration based on adversarial neural networks and showed that a deep reinforcement learning agent using this exploration scheme can more efficiently navigate Minecraft maze environments and play a two-dimensional side-scrolling game called Super Mario Bros. In the auditory domain, we created an environment, using the Unity game engine, where a number of human speakers are present in various places within a room, and created a deep reinforcement learning agent capable of navigating the room an ...
περισσότερα
Κατεβάστε τη διατριβή σε μορφή PDF (2.77 MB)
(Η υπηρεσία είναι διαθέσιμη μετά από δωρεάν εγγραφή)
|
Όλα τα τεκμήρια στο ΕΑΔΔ προστατεύονται από πνευματικά δικαιώματα.
|
Στατιστικά χρήσης
ΠΡΟΒΟΛΕΣ
Αφορά στις μοναδικές επισκέψεις της διδακτορικής διατριβής για την χρονική περίοδο 07/2018 - 07/2023.
Πηγή: Google Analytics.
Πηγή: Google Analytics.
ΞΕΦΥΛΛΙΣΜΑΤΑ
Αφορά στο άνοιγμα του online αναγνώστη για την χρονική περίοδο 07/2018 - 07/2023.
Πηγή: Google Analytics.
Πηγή: Google Analytics.
ΜΕΤΑΦΟΡΤΩΣΕΙΣ
Αφορά στο σύνολο των μεταφορτώσων του αρχείου της διδακτορικής διατριβής.
Πηγή: Εθνικό Αρχείο Διδακτορικών Διατριβών.
Πηγή: Εθνικό Αρχείο Διδακτορικών Διατριβών.
ΧΡΗΣΤΕΣ
Αφορά στους συνδεδεμένους στο σύστημα χρήστες οι οποίοι έχουν αλληλεπιδράσει με τη διδακτορική διατριβή. Ως επί το πλείστον, αφορά τις μεταφορτώσεις.
Πηγή: Εθνικό Αρχείο Διδακτορικών Διατριβών.
Πηγή: Εθνικό Αρχείο Διδακτορικών Διατριβών.