Παρουσίαση/Προβολή
Στοχαστικές Μέθοδοι στην Επιχειρησιακή Έρευνα ΙΙ
(MATH274) - Κων/νος Μηλολιδάκης
Περιγραφή Μαθήματος
Αντικείμενο του μαθήματος αποτελεί ο Δυναμικός Προγραμματισμός (Δ.Π.)ο οποίος εξετάζει διαδικασίες που εξελίσσονται μέσα στο χρόνο, συνήθως διακριτό, και οι οποίες επηρεάζονται από αποφάσεις που παίρνει κάποιος ελεγκτής της διαδικασίας. Στην περίπτωση του διακριτού χρόνου, η οποία αφορά το μάθημα, η διαδικασία εξελίσσεται σε στάδια και απόφαση παίρνεται σε κάθε στάδιο. Οι αποφάσεις σωρεύουν πληρωμές και επηρεάζουν την κατάσταση της διαδικασίας κατά το επόμενο στάδιο. Σκοπός είναι να δοθεί κάποιος, ει δυνατόν πλήρης, χαρακτηρισμός της ακολουθίας αποφάσεων που μεγιστοποιεί τη συνολική πληρωμή (ή, φυσικά, ελαχιστοποιεί το συνολικό κόστος). καθώς επίσης και να υπολογιστεί, ει δυνατόν, η τιμή της βέλτιστης πληρωμής. Η «αντικειμενική συνάρτηση» επομένως είναι η συνολική πληρωμή την οποία αποφέρει η τροχιά που διαγράφει η διαδικασία και ο περιορισμός κάτω από τον οποίο δουλεύουμε είναι ότι οι εφικτές τροχιές οφείλουν να είναι συνεκτικές.
Το γενικό μοντέλο έχει διάφορους βαθμούς δυσκολίας. Οι βασικές διακρίσεις αφορούν τη δυναμική της διαδικασίας (αν οι μεταπηδήσεις είναι ντετερμινιστικές ή τυχαίες), τον χρονικό ορίζοντα της διαδικασίας (πεπερασμένος ή άπειρος), το πλήθος των δυνατών καταστάσεων ή/και αποφάσεων (πεπερασμένο, αριθμήσιμο, συνεχές), τη γνώση που διαθέτει ο ελεγκτής της διαδικασίας για την εκάστοτε κατάσταση του συστήματος (πλήρη ή μερική) και τέλος το διακριτό ή συνεχές του χρόνου.
Ο Δυναμικός Προγραμματισμός (Δ.Π.), που στη Βιβλιογραφία απαντάται και με τους όρους «Ελεγχόμενες Διαδικασίες Markov» καθώς και «Στοχαστικός Έλεγχος σε Διακριτό Χρόνο», έχει πλουσιότατες εφαρμογές και θεωρείται βασικό μάθημα σε κατευθύνσεις Επιχειρησιακής Έρευνας, Διοίκησης Επιχειρήσεων, Financial Mathematics, κ.α. Το μάθημα έχουν βρει ιδιαίτερα χρήσιμο φοιτητές που συνέχισαν μεταπτυχιακά στις παραπάνω κατευθύνσεις. Ενδεικτικά παραδείγματα εφαρμογών αποτελούν οι περιοχές του ελέγχου της κίνησης πάνω σε δίκτυα, της βέλτιστης κατανομής πόρων, της αξιοπιστίας συστημάτων, των αλυσίδων ανεφοδιασμού και ελέγχου αποθεμάτων, των κλινικών δοκιμών, του βέλτιστου σταματήματος (π.χ. εξακολουθητικός έλεγχος υποθέσεων στη στατιστική, άσκηση δικαιωμάτων στα χρηματοοικονομικά μαθηματικά, κ.λπ.). Η διαθέσιμη βιβλιογραφία στα ελληνικά είναι εξαιρετικά φτωχή, αλλά στα αγγλικά υπάρχει πλουσιότατη (και εξειδικευμένη, αν κάποιος επιθυμεί). Οι διδακτικές σημειώσεις περιέχουν παραπομπές στη διεθνή βιβλιογραφία, αλλά επίσης υπερ-επαρκούν για τους σκοπούς και τα πλαίσια που θα κινηθούμε.
Στο μάθημα θα ασχοληθούμε αποκλειστικά με μοντέλα διακριτού χρόνου πλήρους πληροφόρησης. Το μάθημα χωρίζεται σε τρεις ενότητες: (α) Ντετερμινιστικός Δ.Π. πεπερασμένου χρονικού ορίζοντα, (β) Στοχαστικός Δ.Π. πεπερασμένου χρονικού ορίζοντα, (γ) Στοχαστικός Δ.Π. άπειρου χρονικού ορίζοντα. Θα δοθούν Διδακτικές Σημειώσεις, καλογραμμένες αλλά χειρόγραφες. Θα υπάρχει μια επιπλέον ώρα ασκήσεων φροντιστηριακού χαρακτήρα, οι οποίες θα παρουσιάζονται από μεταπτυχιακό φοιτητή/φοιτήτρια. Θα βρείτε επίσης λυμένες ασκήσεις στην e-class, πολλές από τις οποίες ήταν θέματα εξετάσεων παρελθόντων ετών. Στο μάθημα θα δοθεί μία πρόοδος πάνω στις πρώτες δύο ενότητες του μαθήματος και μια τελική εξέταση. Ο βαθμός στο μάθημα θα είναι είτε ο μέσος όρος προόδου και τελικής εξέτασης είτε ο βαθμός της τελικής εξέτασης (ό,τι συμφέρει το φοιτητή).
Από πλευράς προαπαιτουμένων γνώσεων δεν απαιτούνται ούτε Στοχαστικές Ανελίξεις ούτε Θεωρία Ουρών Αναμονής ούτε Στοχαστικές Μέθοδοι στην Επιχειρησιακή Έρευνα Ι. Απαιτείται μια κάποια μαθηματική ωριμότητα, αντίληψη της επαγωγικής λογικής και αποδεικτικής διαδικασίας, και κάποια αίσθηση της έννοιας της δεσμευμένης μέσης τιμής μιας κατανομής πιθανότητας.
Ημερομηνία δημιουργίας
Κυριακή 21 Φεβρουαρίου 2010
-
Δεν υπάρχει περίγραμμα