Ενισχυτική μάθηση

Η ενισχυτική μάθηση (reinforcement learning) στην επιστήμη των υπολογιστών είναι ένας γενικός όρος που έχει δοθεί σε μια οικογένεια τεχνικών στις οποίες το σύστημα μάθησης προσπαθεί να μάθει μέσα από την άμεση αλληλεπίδραση με το περιβάλλον. Εφαρμόζεται στον έλεγχο κίνησης ρομπότ, στη βελτιστοποίηση εργασιών σε εργοστάσια, στη μάθηση επιτραπέζιων παιχνιδιών, κτλ. Η έννοια της ενισχυτικής μάθησης είναι εμπνευσμένη από τα αντίστοιχα ανάλογα της μάθησης με επιβράβευση και τιμωρία που συναντώνται ως μοντέλα μάθησης των έμβιων όντων. Σκοπός του συστήματος μάθησης είναι να μεγιστοποιήσει μια συνάρτηση του αριθμητικού σήματος ενίσχυσης (ανταμοιβή), για παράδειγμα την αναμενόμενη τιμή του σήματος ενίσχυσης στο επόμενο βήμα. Το σύστημα δεν καθοδηγείται από κάποιον εξωτερικό επιβλέποντα για το ποια ενέργεια θα πρέπει να ακολουθήσει αλλά πρέπει να ανακαλύψει μόνο του ποιες ενέργειες είναι αυτές που θα του αποφέρουν το μεγαλύτερο κέρδος.

Βιβλιογραφία Επεξεργασία

  • Βλαχάβας, Ιωάννης· Κεφάλας, Πέτρος· Βασιλειάδης, Νικόλαος· Κόκκορας, Φώτης· Σακελλαρίου, Ηλίας (Φεβρουάριος 2006). Τεχνητή Νοημοσύνη (3η έκδοση). Εκδόσεις Πανεπιστημίου Μακεδονίας. 
🔥 Top keywords: ColdplayΜίλτος ΤεντόγλουΆλμα εις μήκοςΠύλη:ΚύριαΚατάλογος των Ελληνικών ρεκόρ στον στίβοΔέσποινα ΣτυλιανοπούλουΛούης ΤσάτουμαςΠρωτάθλημα Ελλάδας καλαθοσφαίρισης ανδρώνΕιδικό:ΑναζήτησηΒαγγέλης ΜαρινάκηςΠαναθηναϊκός (καλαθοσφαίριση ανδρών)Παγκόσμια ρεκόρ στίβουΟλυμπιακός Σ.Φ.Π. (καλαθοσφαίριση ανδρών)Κώστας ΣλούκαςΚόσμος (πολιτικό κόμμα)Ελληνικές ευρωεκλογές 2024ΣύμηΧρήστης:Marios EliopoulosΤο φως που σβήνειΠέτρος Σ. ΚόκκαληςΕλληνικές ευρωεκλογές 2019Λίνα ΝικολακοπούλουΝέα Αριστερά (Ελλάδα)Αϊζάια ΚάναανΠλατεία ΟυρουγουάηςΕλληνική ΛύσηΚατάλογος των μελών του Ευρωπαϊκού Κοινοβουλίου για την Ελλάδα, 2019-2024Δημήτρης ΓιαννακόπουλοςΜαρίνα ΨάλτηΟλυμπιακός Σ.Φ.Π. (ποδόσφαιρο)Μιλτιάδης ΜαρινάκηςΛαγοκέφαλοςΝίκη (πολιτικό κόμμα)Αγία ΚαλλιόπηΠλεύση ΕλευθερίαςΚατάλογος πολιτικών κομμάτων της ΕλλάδαςΕυρωπαϊκό ΚοινοβούλιοΕλλάδαΕθνικό Μέτωπο (Ελλάδα)