Παρουσίαση/Προβολή
Δυναμικός Προγραμματισμός
(754) - Απόστολος Μπουρνέτας
Περιγραφή Μαθήματος
Στο μάθημα γίνεται μια συστηματική και εις βάθος εισαγωγή στο Δυναμικό Προγραμματισμό και τις εφαρμογές του.
Με την επιτυχή παρακολούθηση και ολοκλήρωση του μαθήματος ο φοιτητής είναι σε θέση:
- Να χρησιμοποιεί την αρχή του Bellman για την επίλυση ντετερμινιστικών προβλημάτων βελτιστοποίησης, στα οποία οι αποφάσεις λαμβάνονται ακολουθιακά, όπως το πρόβλημα ελαχιστοποίησης διαδρομής σε δίκτυο, προβλήματα ελέγχου αποθεμάτων, προβλήματα προγραμματισμού παραγωγής και προβλήματα καταμερισμού πόρων.
- Να μοντελοποιεί προβλήματα αποφάσεων που λαμβάνονται ακολουθιακά και στα οποία υπεισέρχεται τυχαιότητα στο πλαίσιο του Στοχαστικού Δυναμικού Προγραμματισμού με πεπερασμένους χώρους καταστάσεων και αποφάσεων και πεπερασμένο χρονικό ορίζοντα.
- Να βρίσκει τη μορφή της βέλτιστης πολιτικής σε προβλήματα Στοχαστικού Δυναμικού Προγραμματισμού με επαγωγικά επιχειρήματα, όπως σε στοχαστικά δίκτυα, συστήματα ελέγχου αποθεμάτων με στοχαστική ζήτηση, σε συστήματα συντήρησης σε στοχαστικό περιβάλλον κλπ.
- Να χρησιμοποιεί τις βασικές υπολογιστικές τεχνικές των διαδοχικών προσεγγίσεων τιμών, της βελτίωσης πολιτικής και του γραμμικού προγραμματισμού για την εύρεση της βέλτιστης πολιτικής ενός προβλήματος Στοχαστικού Δυναμικού Προγραμματισμού σε πεπερασμένο χρονικό ορίζοντα.
- Να γνωρίζει το θεωρητικό πλαίσιο του αποπληθωρισμένου Δυναμικού Προγραμματισμού σε άπειρο χρονικό ορίζοντα και να το χρησιμοποιεί για την επίλυση προβλημάτων (αποδείξεις ύπαρξης βέλτιστης στάσιμης πολιτικής και των εξισώσεων βελτιστοποίησης, αλγόριθμοι διαδοχικών προσεγγίσεων της τιμής, βελτίωσης της πολιτικής και γραμμικού προγραμματισμού).
ΠΕΡΙΕΧΟΜΕΝΟ ΜΑΘΗΜΑΤΟΣ
- Ντετερμινιστικός Δυναμικός Προγραμματισμός:
- Ελαχιστοποίηση διαδρομής σε δίκτυα
- Προβλήματα ελέγχου αποθεμάτων
- Προβλήματα προγραμματισμού παραγωγής
- Προβλήματα καταμερισμού πόρων, πρόβλημα γυλιού κλπ.
- Στοχαστικός Δυναμικός Προγραμματισμός με αριθμήσιμο χώρο καταστάσεων και πεπερασμένες δέσμες αποφάσεων σε πεπερασμένο χρονικό ορίζοντα:
- Υπολογιστικές Τεχνικές:
- Διαδοχικές προσεγγίσεις τιμής
- Βελτίωση πολιτικής
- Γραμμικός προγραμματισμός
- Αποπληθωρισμένος Στοχαστικός Δυναμικός Προγραμματισμός σε άπειρο ορίζοντα:
- Αποδείξεις ύπαρξης βέλτιστης στάσιμης πολιτικής και των εξισώσεων βελτιστοποίησης
- Αλγόριθμοι
- Ελαχιστοποίηση μέσου κόστους σε άπειρο ορίζοντα
- Αποδείξεις ύπαρξης βέλτιστης στάσιμης πολιτικής και των εξισώσεων βελτιστοποίησης
- Αλγόριθμοι
- Δυναμικός Προγραμματισμός και Ενισχυμένη Μάθηση
ΒΙΒΛΙΟΓΡΑΦΙΑ
1. Μπουρνέτας, Α. Ν. και Οικονόμου Α. (2023). "Στοχαστικά Μοντέλα στην Επιχειρησιακή Έρευνα", Σημειώσεις.
2. Ross, S. (1983) "Introduction to Stochastic Dynamic Programming", Academic Press.
3. Puterman M. L. (2014). "Markov Decision Processes : Discrete Stochastic Dynamic Programming", Wiley-Interscience.
4. Sennott L. I. (1999). "Stochastic Dynamic Programming and the Control of Queueing Systems", Wiley.
Ημερομηνία δημιουργίας
Δευτέρα 2 Οκτωβρίου 2023
-
Δεν υπάρχει περίγραμμα