Pastiprināšanas mācības (RL) tiek piešķirta atlīdzības un sodu sistēma. Mācību pastiprināšana ir plašāka nekā uzraudzīta vai nekontrolēta mācīšanās, lai sasniegtu mērķi vai tikai gūtu labumu no stimuliem un sodiem, ko rada saskarsme ar vidi.
Kāda veida atlīdzības un sodi tiek piešķirti kā atsauksmes?
Pirmā ir vērtējoša atgriezeniskā saite kā pastiprinājums, kur atlīdzības un sodi tiek izmantoti, lai veidotu audzēkņu uzvedību, izmantojot pastiprinošus mācīšanās mehānismus.
Kādi ir atlīdzības un soda veidi?
Tagad apvienosim šos četrus terminus: pozitīvs pastiprinājums, negatīvs pastiprinājums, pozitīvs sods un negatīvs sods (1. tabula). Kaut kas tiek pievienots, lai palielinātu uzvedības iespējamību. Kaut kas ir pievienots, lai samazinātu uzvedības iespējamību.
Kāda veida mācīšanās ir balstīta uz atlīdzības un soda pieeju?
Netieši, bez apzinātas apstrādes, indivīdi uzzina par katra konteksta un darbības atlīdzības un soda vērtību. Šie asociatīvās mācīšanās procesi savukārt ietekmē varbūtību, ka indivīdi atkārtoti iesaistīsies šādās darbībās vai meklēs šo kontekstu.
Kā atlīdzība un sods ietekmē mācīšanos?
Kopumā mēs redzējām nelielu atlīdzības ietekmi uz mācīšanos vai saglabāšanu. Sods neietekmēja prasmju saglabāšanu, bet bija nozīmīgs,no uzdevuma atkarīga ietekme uz mācīšanos. SRTT sodā uzlabots ātrums ar minimālu ietekmi uz precizitāti. Turpretim sods pasliktināja FDN darbību.