Теорія оперантного навчання

Теорія оперантного навчання Б.Ф. Скіннера

У підставі теорії оперантного обумовлення Скіннера лежить той простий факт, що не завжди дії живої істоти є реакцією на ту чи іншу комбінацію зовнішніх впливів - стимулів. Досить часто (на думку Скіннера, в більшості випадків) поведінка виглядає так, як ніби-то йому не передують ніякі видимі стимули.

У знаменитих дослідах Скіннера лабораторний щур містилася в порожній ящик з педаллю всередині (так званий "ящик Скіннера" ​​см нижче.) І отримувала повну свободу дій. В процесі хаотичного дослідження ящика щур неминуче зачіпала педаль і отримувала порцію їжі. Після кількох випадкових натискань на педаль у щура формувалася нова форма поведінки, яка не була пов'язана ні з якими попередніми стимулами. Тепер, зголоднівши, щур доцільно слідувала до педалі і, натиснувши на неї - отримувала бажане.

Таким чином, ключова відмінність оперантного обумовлення від класичного полягає в тому, що в разі оперантного обумовлення живий організм своєю поведінкою активно впливає на навколишнє середовище і стикається з тими чи іншими наслідками. У разі формування умовного рефлексу * см нижче) такого впливу не спостерігається. Тварини в дослідах Павлова були спеціально, з метою дотримання чистоти експерименту, позбавлені будь-якої можливості впливати на оточення. У цьому сенсі оперантное поведінка активно і направлено на дослідження навколишнього світу, респондентное поведінку реактивно і лише слід тих чи інших впливів, в процесі класичного обумовлення (див нижче), яка придбала для організму певний сигнальне вплив.

Але сама по собі дослідницька активність нічого не дає - вона лише збільшує шанси зустріти ті чи інші наслідки. Те, яким чином видозмінюється поведінку, залежить в першу чергу від характеру наслідків - від того, будуть ці наслідки приємними або неприємними. Приємні наслідки Скіннера називав "підкріпленням" (див нижче).

Експериментуючи з різними типами підкріплення, Скіннер вивів одну безперечну і завжди відтворену закономірність: зразки поведінки (операнти), слідом за якими йдуть приємні наслідки, в майбутньому зустрічаються частіше. Щур частіше натискає на педаль, якщо безпосередньо слідом за цим дією вона отримує шматочок їжі.

Голуб, поміщений в клітку, на підлозі якої є червона пляма, лише випадковим чином може клюнути в нього. Але якщо відразу слідом за цим він отримає їжу - зернятко, то цей оперант (дія в розрахунку на успіх) буде частіше зустрічатися в майбутньому. Людина, якого смачно нагодують в одному з ресторанів міста, буде частіше ходити в цей ресторан, навіть якщо він досить далеко розташований від будинку. Цю закономірність Скіннер назвав "законом вигоди (придбання)" (див нижче), іноді його ще називають першим законом оперантного навчання.

Закон придбання означав для Скіннера і його послідовників наступне: якщо перед терапевтом або вчителем постає завдання сформувати нові звички, нові зразки поведінки, то єдиний спосіб, який дає передбачувані і надійні результати, полягає в тому, що ми спеціально створюємо позитивні наслідки для так званого " цільового "поведінки, тобто поведінки, з яким ми б хотіли частіше зустрічатися надалі.

Підкріплюючи це поведінка, ми обов'язково доб'ємося свого, це поведінка буде зустрічатися частіше.

Логічним здається й інший спосіб модифікації поведінки. Багато хто припускає, що поведінка, яке карається, штрафується, тобто веде до наслідків, для індивіда неприємним, має зникнути. Цьому висновку, однак, Скіннер не знайшов підтвердження. З його точки зору, покарання (див нижче) - досить спірне спосіб відучити від небажаної поведінки, оскільки поведінка, за яким слідують неприємні наслідки, нікуди не зникає, воно лише видозмінюється найнесподіванішим чином. Людина в разі штрафу змушений шукати інші форми поведінки, щоб уникнути штрафу. Часто виявляється так, що ці нові форми бувають ще менш бажаними, ніж ті, які викликали покарання.

Звичайно, людина (або будь-яке інше жива істота) схильний уникати неприємних подій. Це факт. Однак передбачити, до чого приведуть його пошуки альтернативних форм поведінки - практично неможливо, якщо тільки не надавати йому допомогу - не продемонстрували в явній формі зразки поведінки, які дозволять покарання уникнути. І тут Скіннер ще раз нагадував про те, що уникнення негативних наслідків саме викликає позитивні наслідки, тобто саме є підкріпленням. І цю форму підкріплення, звичайно, можна використовувати.

Принципово в цілях зміни поведінки можна використовувати п'ять різних типів наслідків. По-перше, це позитивне і негативне підкріплення, яке веде до зміцнення способів поведінки, слідом за якими воно слід. Далі слід позитивне і негативне покарання, що веде до непередбачуваних наслідків, і ігнорування - тобто абсолютна відсутність наслідків, яке веде до згасання поведінки і (як ми побачимо далі) - до стану вивченої безпорадності.

Практичне застосування теорії оперантного навчання

Матеріал підручника був складається таким чином, що передбачає можливість різним чином, переходячи на різні сторінки або пункти програми і витрачаючи різний час, все ж прийти до кінцевого результату.

Підготовлені учні, здатні вчитися швидко - швидко засвоюють матеріал, ті ж, кому потрібно чимало часу і докладні пояснення, отримують і те й інше, причому незалежно від швидкості навчання - кожен отримує негайне підкріплення, підтвердження свого успіху (або допомога у вигляді нових матеріалів і текстів).

Не зупиняючись детально на змісті програмованого навчання (див. Тализіна, 1969, 1975), відзначимо лише деякі принципи, загальні для нього і поведінкової психотерапії:

1. Швидкість навчання і план "послідовного наближення" до цільового поведінки строго індивідуальні для кожної людини.

2. Саме терапевт, який ставить завдання і планує режим підкріплення, в кінцевому рахунку відповідає за успіх терапії.

3. Терапевтичні (навчальні) заходи плануються так, що більш складні завдання ставляться після того, як виконання попереднього завдання привело до очевидного успіху.

4. Програма постійно переглядається і коригується залежно від успіхів клієнта.

У сфері менеджменту ідеї Скіннера знайшли вираз в плануванні і послідовному здійсненні в організаціях "середовища моментального підкріплення" цінних для організації дій (див. Пітерс і Уотермен, 1986).

Правоохоронні органи все частіше штрафи замінюють або системою підкріплень, або надають провинився на вибір можливість заплатити штраф або взяти участь у тренінгу, який його навчить альтернативних форм поведінки. Але найбільш радикальні зміни ідеї Скіннера справили в психотерапії, заклавши основу абсолютно нової її гілки - терапії і модифікації поведінки.

Обмеження теорії оперантного навчання

В теорії оперантного навчання Скіннера залишився ряд нез'ясованих моментів, які обмежували її всебічне використання і не давали відповідей на ряд питань, що виникають в психотерапевтичної практиці.

Деякі сумніви викликало (і продовжує викликати) твердження про те, що покарання веде до непередбачуваних наслідків. Адже абсолютно очевидно, що сильний штраф швидко усуває небажану поведінку. Якщо дитина лізе цвяхом в розетку, то гучний окрик на деякий час припинить це цікаве заняття.

Більшість людей абсолютно очевидно перестають робити те, що викликає неприємні наслідки. Ідея Скіннера про те, що в даному випадку ми маємо справу з негативним підкріпленням - тобто людині приємним стає відсутність покарання, і він починає частіше робити (або не робити) то, що дозволяє уникнути покарання, лише частково пояснює реальність.

Ще одне "темна пляма" в теорії Скіннера, яке досить скоро стало очевидним для психологів і психотерапевтів, полягає в тому, що з неї не зрозуміло, як з'являються абсолютно нові форми поведінки.

З теорії випливало, що позитивне, нове, здорове поведінка повинна підкріплюватися, і краще, якщо це підкріплення не систематично і не відстрочено. Цей досить надійний принцип можна застосувати до простих навичкам, ймовірність спонтанного появи яких досить висока.

Якщо ж мова йде про складні навичках (наприклад, рішення математичних задач), то досить довго ймовірно, доведеться тримати напоготові підкріплення, перш ніж в результаті спонтанної пошукової активності буде знайдено спосіб їх вирішення. Іншими словами, не дуже зрозуміло, як підштовхнути людину до тих зразків поведінки, які слід підкріплювати і щодо яких він не має жодного уявлення.

Відповіді на ці питання були знайдені іншими психологами поведінкового напрямку.