Μέθοδοι βαθιάς ενισχυτικής μάθησης
Περίληψη
Το αντικείμενο της παρούσας διατριβής είναι οι μέθοδοι Βαθιάς Ενισχυτικής Μάθησης (Deep Reinforcement Learning). Η διατριβή εξερευνά υπάρχουσες τεχνικές Βαθιάς Ενισχυτικής Μάθησης, ενώ επίσης παρουσιάζει νέες, οι οποίες έχουν βελτιωμένες επιδόσεις σε κοινά περιβάλλοντα αξιολόγησης σε σύγκριση με μεθόδους αιχμής της σχετικής βιβλιογραφίας, ενώ ταυτόχρονα βελτιώνουν συγκεκριμένες πτυχές τους, και πιο συγκεκριμένα, τη δειγματική αποδοτικότητα (sample-efficiency) και την ικανότητα γενίκευσης (generalization). Τέλος, παρουσιάζονται διάφορες εφαρμογές τεχνικών Μηχανικής Μάθησης σε παιχνίδια.
Περίληψη σε άλλη γλώσσα
This thesis focuses on Deep Reinforcement Learning (Deep RL) methods and their applications in games. It provides an in-depth analysis of existing state-of-the-art Deep RL methods and introduces novel techniques based on the concept of meta-RL for achieving high performance with improved sample-efficiency. Along with the theoretical foundations of Machine Learning (ML) and RL, game AI applications are also considered. This chapter summarizes the presented contributions and discusses future directions of the work on current open issues in the field. Τhe first contribution of this thesis includes a comprehensive overview of Deep RL and state-of-the-art algorithms that have achieved impressive results on various platforms and environments. The analysis delves deeply into these models, offering valuable insights and proposing new implementations that combine core Deep RL algorithms with different host algorithms. The functionalities and properties of each algorithm are also thoroughly exam ...
περισσότερα
Κατεβάστε τη διατριβή σε μορφή PDF (16.61 MB)
(Η υπηρεσία είναι διαθέσιμη μετά από δωρεάν εγγραφή)
|
Όλα τα τεκμήρια στο ΕΑΔΔ προστατεύονται από πνευματικά δικαιώματα.
|
Στατιστικά χρήσης
ΠΡΟΒΟΛΕΣ
Αφορά στις μοναδικές επισκέψεις της διδακτορικής διατριβής για την χρονική περίοδο 07/2018 - 07/2023.
Πηγή: Google Analytics.
Πηγή: Google Analytics.
ΞΕΦΥΛΛΙΣΜΑΤΑ
Αφορά στο άνοιγμα του online αναγνώστη για την χρονική περίοδο 07/2018 - 07/2023.
Πηγή: Google Analytics.
Πηγή: Google Analytics.
ΜΕΤΑΦΟΡΤΩΣΕΙΣ
Αφορά στο σύνολο των μεταφορτώσων του αρχείου της διδακτορικής διατριβής.
Πηγή: Εθνικό Αρχείο Διδακτορικών Διατριβών.
Πηγή: Εθνικό Αρχείο Διδακτορικών Διατριβών.
ΧΡΗΣΤΕΣ
Αφορά στους συνδεδεμένους στο σύστημα χρήστες οι οποίοι έχουν αλληλεπιδράσει με τη διδακτορική διατριβή. Ως επί το πλείστον, αφορά τις μεταφορτώσεις.
Πηγή: Εθνικό Αρχείο Διδακτορικών Διατριβών.
Πηγή: Εθνικό Αρχείο Διδακτορικών Διατριβών.