Penguatan (reinforcement)
Penguatan
adalah proses belajar untuk meningkatkan kemungkinan dari sebuah perilaku
dengan memberikan atau menghilangkan rangsangan. Prinsip penguatan dibagi
menjadi dua, yaitu penguatan positif dan penguatan negatif.
a. Positive
Reinforcement (Penguatan Positif)
Penguatan positif (positive
reinforcement) adalah suatu rangsangan yang diberikan untuk memperkuat
kemungkinan munculnya suatu perilaku yang baik sehingga respons menjadi
meningkat karena diikuti dengan stimulus
yang mendukung. Sebagai contoh, seorang anak yang pada dasarnya memiliki sifat
pemalu diminta oleh guru maju ke depan kelas untuk menceritakan sebuah gambar
yang dibuat oleh anak itu sendiri. Setelah anak tersebut membacakan cerita,
guru memberikan pujian kepada anak tersebut dan teman-teman sekelasnya bertepuk
tangan. Ketika hal tersebut berlangsung berulang-ulang, maka pada akhirnya anak
tersebut menjadi lebih berani untuk maju ke depan kelas, bahkan kemungkinan
sifat pemalunya akan hilang.
Rangsangan yang diberikan untuk
penguatan positif dapat berupa hal-hal dasar seperti, makanan, minuman, sex,
dan kenyamanan pisikal. Selain itu, beberapa hal-hal lain seperti uang,
persahabatan, cinta, pujian, penghargaan, perhatian, dan kesuksesan karir juga
dapat digunakan sebagai rangsangan penguatan positif.
Dua hal penting dalam menggunakan penguatan
positif adalah timing (pengaturan waktu)
dan konsistensi dalam pemberian penguatan. Timing (pengaturan waktu) ->
stimulus positif harus diberikan dalam jangka
waktu yang singkat mengikuti respon dari objek. Consistency -> merupakan
sifat dasar dari awal proses blajar berdasarkan jadwal pemberian penguatan
positif dimana penguat positif harus diberikan setelah ada respon dari objek.
Penguatan berkesinambungan merupakan
penguatan perilaku setiap kali perilaku tersebut muncul. Ketika penguatan
berkesinambungan muncul maka seseorang akan belajar dengan cepat, tetapi ketika
penguatan berkesinambungan tersebut berhenti maka perilaku juga ikut mengalami
pelenyapan. Penguatan sebagian ( partial reinforcement) mengikuti sebuah
perilaku hanya sebagian waktu. Setiap orang tidak memenangkan setiap
pertandingan kapan saja, setiap orang tidak selalu mendapat penguatan ketika
mendapat masalah. Jadwal penguatan adalah jadwal untuk menentukan kapan sebuah perilaku akan dikuatkan. Terdapat
empat jadwal pemberian penguatan positif, antara lain:
1. Fixed
Ratio (Jadwal rasio tetap) merupakan
penguatan positif yang diberikan untuk memperkuat prilaku setelah sejumlah respon. Sebagai contoh,hal ini sering
digunakan dalam dunia bisnis , dimana dalam perusahaan, setiap karyawan akan
diberikan penguatan positif berupa bonus apabila karyawan tersebut melakukan
empat kali kinerja yang sangat baik, tetapi bukan sesudah setiap kali melakukan
kinerja baik.
2. Variable
Ratio (Jadwal rasio bervariasi) merupakan penguatan positif yang diberikan
setelah respon muncul beberapa kali,
tetapi dalam basis yang tidak tetap dan tidak dapat diprediksi. Misalnya,
seorang guru memuji respon murid-muridnya, pujian guru rata-rata diberikan
setelah respon ke lima, tetapi selanjutnya bisa berubah yaitu pada respon ke dua,
pada respon ke delapan, pada repon ke tujuh, pada respon yang ke tiga, dan pada
respon yang lainnya yang tidak dapat ditentukan.
3. Fixed
Interval (Jadwal interval tetap), dimana objek menyadari waktu kapan ia akan
menerima penguat positif sehingga selama jangka waktu dia tidak menerima
penguat positif, respon objek akan berkurang kemudian akan meningkat lagi ketika mendekati waktu mendapat penguat
positif. Sebagai contoh, seorang pelajar yang mendapat hadiah dari orangtuanya
karena memperoleh nilai bagus di semester awal akan bersemangat belajar saat
awal memulai pelajaran baru dalam
semester berikutnya, tetapi semangat tersebut akan berangsur-angsur turun
selama pertengahan semester dan akan
kembali meningkat saat mendekati ujian semester (dikarenakan dia tahu bahwa dia
akan mendapat penguat positif berupa hadiah kembali jika memperoleh nilai
bagus).
4. Variable
Interval (Jadwal interval bervariasi) dimana suatu respon diperkuat setelah
sejumlah variasi waktu berlalu. Sebagai contoh, seorang guru memuji keaktifan
para muridnya pada menit ke tiga, kemudian memuji setelah menit ke lima,
setelah delapan menit berlalu, setelah lima belas menit berlalu, dan
seterusnya. Guru tersebut juga akan memberi tugas pada interval yang
berbeda-beda. Pada dasarnya, jadwal interval bervariasi akan menjadi penguat
yang lebih baik dibandingkan jadwal
interval tetap. Sebagai contoh, jika seorang guru memberikan tugas dalam waktu
yang tidak dapat ditentukan, murid-murid akan lebih bersiap dan lebih bekerja
keras setiap waktu. Hal ini akan berbeda jika jadwal pemberian tugas itu
bersifat tetap, misalnya hanya pada setiap hari Jumat, maka para murid tersebut
hanya akan bersiap ketika mendekati hari jumat dan pada hari lainnya mereka
tidak akan bekerja keras sehingga akan timbul pola bersiap-berhenti.
Shaping
adalah
mengajari perilaku baru dengan memperkuat perilaku yang mirip dengan perilaku
sasaran. Sebagai contoh pada awalnya , kita memperkuat setiap respon yang mirip
dengan perilaku yang diharapkan, kemudian kita memperkuat respon yang lebih
mirip dengan sasaran, dan seterusnya sampai seseorang melakukan perilaku
sasaran tersebut.
Shaping
(Pembentukan) dapat dilihat contohnya dalam dunia pendidikan. Seorang guru
memiliki murid yang memiliki nilai bahasa Inggris kurang dari 50. Guru tersebut
memasang target nilai 100 untuk anak tersebut dengan adanya pemberian ganjaran
berupa hadiah jika setiap kali anak tersebut mendapat nilai mendekati nilai 100.
Secara berkala anak tersebut pasti akan mulai terus mendapat nilai semakin
mendekati 100, yaitu 70, 80, 90, kemudian mencapai target yang dibuat oleh guru
tersebut. Shaping akan sangat efektif digunakan dalam kehidupan kita.
Terdapat
dua tipe penguat positif, yaitu penguat primer dan penguat sekunder.
1. Primary reinforcers (Penguat primer)
merupakan penguat secara alami yang tidak memerlukan pembelajaran untuk
menghasilkan efek menyenangkan. Misalnya, seseorang secara alami dapat
menentukan makanan kesukaan sehingga ketika stimulus yang diberikan berupa
makanan kesukaan orang tersebut maka ia akan memberikan respon yang positif.
2. Secondary reinforcers (Penguat sekunder)
merupakan penguat yang diperoleh dari hasil pembelajaran (berupa pengalaman).
Misalnya, seroang anak mendapat pujian atau hadiah setelah menolong orang lain
sehingga ia kelak akan suka menolong orang lain.
b. Negative Reinforcement (Penguatan Negatif)
Negative Reinforcement adalah
peningkatan frekwensi suatu perilaku positif karena hilangnya rangsangan yang merugikan (tidak menyenangkan). Sebagai contoh, seorang ibu yang memarahi anaknya setiap pagi
karena tidak membersihkan tempat tidur, tetapi suatu pagi si anak tersebut
membersihkan tempat tidurnya tanpa di suruh dan si ibu tidak memarahinya, pada
akhirnya si anak akan semakin rajin membersihkan tempat tidurnya diringi dengan
berkurangnya frekwensi sikap kemarahan dari ibunya.
Perbedaan
mutlak penguatan negatif dengan penguatan positif terletak pada penghilangan
dan penambahan stimulus yang sama-sama bertujuan untuk meningkatkan suatu
perilaku yang baik.
* Penguatan Positif + Stimulus =>
Perilaku baik
* Penguatan Negatif – Stimulus =>
Perilaku baik
Dua
tipe kondisi penguatan negatif
1. Escape conditioning merupakan
penguatan perilaku karena adanya suatu kejadian menghasilkan efek negatif. Beberapa stimulus atau kejadian yang bilamana
dihentikan atau dihilangkan akan meningkatkan
atau memelihara kekuatan respon. Escape Conditioning
adalah bentuk
penguatan negatif karena sesuatu yang negatif dihilangkan. Sebagai contoh,
seorang anak yang dikurung di dalam kamar selama satu jam
akan menangis sejadi-jadinya kemudian orang tua yang tidak tega membiarkannya
keluar dari kamarnya. Dalam kasus ini, telah terjadi penguatan negatif dimana
anak akan terbiasa melakukan hal tersebut jika di kurung di dalam kamar.
2.
Penghindaran (Avoidance conditioning) yaitu respon untuk mencegah sesuatu yang
tidak menyenangkan atau melakukan pencegahan.