Оперантное поведінку, методика вироблення оперантного умовного рефлексу - основи психології

Б. Скіннер ввів в експериментальну зоопсихології методи вивчення спонтанного поведінки тварин. Їх суть зводиться до того, що тварині дозволяється здійснювати довільні дії, а оператор, змінюючи тактику підкріплення, намагається керувати поведінкою досліджуваної особини. Для позначення спонтанного поведінки тварини, яке відбувається без очевидного стимулу. існує спеціальну назву - оперантное дію. Цей термін був введений Б. Скіннер для підкреслення відмінностей з так званим реактивним поведінкою, яке проявляється у відповідь на певний стимул.

Прикладом оперантного поведінки є навчання Клевань "ключа" голубом. Голуба поміщають в камеру з годівницею з вбудованою лампочкою і невеликим кружком на рівні голови. Гурток забезпечений пристроєм для включення електричного кола і носить назву "ключа". Спочатку голуба привчають до поєднання світло-корм. Коли загоряється світло, то видається їжа. Голуби швидко звикають до цього і запам'ятовують послідовність подій. Потім оператор починає підводити голуба до клювання ключа. Для цього корм починають давати тільки тоді, коли голуб підходить до ключа. Потім тільки після витягування шиї на рівень ключа. Зрештою виникає момент, коли голуб клює ключ. Після цього їжа видається виключно за Клевань ключа. Оскільки ключ з'єднаний з електричним колом годівниці, то далі навчання відбувається без участі оператора.

При такому підході вирішальне значення має форма подачі підкріплення. В основному, Б. Скіннер запозичив методи роботи з підкріпленням І.П. Павлова, хоча і модифікував їх форми. Наприклад, нагородженням по постійному співвідношенню називається підкріплення голуба при кожному третьому Клевань ключа. Варіацій форм підкріплення Б. Скіннер ввів дуже багато, що дозволило йому домогтися вироблення дуже складного оперантного поведінки. Він вважав, що у його методики подачі підкріплення взагалі немає меж впливу на поведінку тварин, а їх Оперантное діям можна надавати будь-яку форму. Згодом це не підтвердилося. Багатьох тварин не вдається навчити навіть простих дій, оскільки оперантная завдання вступає в конфлікт з інстинктивною поведінкою (3).

Процедура інструментального навчання полягає в тому, що позитивне або негативне підкріплення подається при певної реакції тваринного - "правильної" або "неправильної" з точки зору експериментатора.

Інструментальне научение класифікується в залежності від застосовуваних методик.

а) "Проби і помилки" по-Торндайк. Методика розроблена в 1898 році. Проблемна клітина (проблемний ящик) Торндайка є клітину, яку можна відкрити зсередини, натиснувши на важіль. Ув'язнені в клітці тварина спочатку намагається втекти, хаотично і без упину рухаючись по клітці, але через деякий час випадково натискає на важіль і відкриває дверцята. Тварина знову повертають в клітку. Друга і третя спроби тваринного вийти з клітки можуть бути випадковим повторенням, але поступово тварина зосереджує свою поведінку близько важеля. Після ряду проб тварина, як його тільки замикають в клітці, натискає на важіль і звільняється. Тварина навчається виключати зі свого поведінки все, що не веде до підкріпленню і збільшує число рухових реакцій, які при попередніх спробах приводили до підкріпленню. Але на початку досліду в поведінці тварини немає певної системи - перший підкріплення тварина отримує випадково.

"Закон ефекту" Торндайка говорить: "Для реакції, яку слід винагороду чи стан задоволення, можливість повторення зростає, а для реакції, викликає шкідливе чи неприємне наслідок, ймовірність повторення знижується".

Більшість сучасних психологів погоджуються з тим, що для пояснення поведінки дорослої людини "закон ефекту" має обмежену сферу застосування.

б) Вільно-оперантная методика за Скіннер. Це варіація методики, застосованої Торндайком. Відмінність від методики "проб і помилок" в тому, що тварина піддається не окремим пробам, а може здійснювати будь-яку реакцію в будь-який час. Зазвичай в інструментальної установці перебуває пристосування, наприклад, важіль, на який тварина має впливати. У дослідах, проведених Скиннером в 1938 році, лабораторна пацюк натискає на важіль і отримує їжу. На початку досвіду тварина не робить необхідну реакцію, але за поведінку, що наближається до реакції, яку хочуть сформувати, підкріплення отримає. Спочатку підкріплюється перебування пацюки в тій частині клітини, де розташований важіль. Потім підкріплюють піднімання лапи у напрямку до важелю. Поступово вимоги до реакції, яка заслуговує на підкріплення, підвищуються. В кінцевому підсумку підкріплюють вже саме натискання на важіль.

Цікаві дослідження з вироблення оперантних реакцій у дельфінів були проведені американською дослідницею Прайер. У кожній серії проб підкріплювалися різні реакції. Після того, як будь-яка реакція підкріплювалася, у наступних серіях ця реакція вже не дозволяла тварині отримати підкріплення. Коли був вичерпаний весь репертуар реакцій, на які здатні дельфіни, тварини стали виробляти безліч нових, "творчих" реакцій.

в) Методики з негативним підкріпленням. Тварина має вести себе так, як встановлено експериментатором, щоб уникнути больових стимулів. У найбільш поширеному варіанті цієї методики використовується човникова камера. Вона складається з двох відділень, забарвлених в різні кольори. Відділення повідомляються між собою прорізом. Процедура починається з ряду проб, що супроводжуються сигналом, наприклад, зумером. Тварині дається кілька секунд, щоб покинути стартову камеру і перейти в іншу частину установки. Якщо тварина цього не зробить, воно отримає удар електрострумом через електроди на підлозі камери. У міру повторення ряду проб відсоток успішних избеганий зростає. Було показано, що навіть серед споріднених видів тварин успішніше навчаються ті тварини, які в природі ведуть більш активний спосіб життя.

г) Вироблення диференціювання. У цих дослідах тварині пропонують два або кілька стимулів і надають можливість як-небудь реагувати. Реакції на один із стимулів підкріплюються, на інші - ні. Навчені полягає в підвищенні відсотка реакцій на «правильний» стимул. Наприклад, мавпа буде завжди отримувати банан, якщо буде з двох пропонованих стимулів вибирати стимул червоного кольору. Існує дуже багато варіантів вироблення диференціювання. Деякі завдання здатні вирішити тільки тварини з досить розвиненим інтелектом.

Одночасна диференціювання. Всі стимули пред'являються в один і той же час. Завдання тваринного - вибрати правильний стимул.

· Послідовна диференціювання. Стимули пред'являються по одному. Тварина має гальмувати реакцію у присутності неправильного стимула.

· Переробка диференціювання. Значення позитивного стимулу змінюється від одного завдання до іншого. Наприклад, тварина повинна вибирати між червоним і зеленим стимулом, причому червоний - позитивний. Через деякий час, не інформуючи тварина, починають підкріплювати зелений стимул. Багато видів тварин виявляють здатність покращувати рішення таких задач при їх повторенні, тобто виробляють установку на научение.

· Відстрочені реакції диференціювання. Приманку на очах у тварини поміщають під один з двох предметів. Через тривалий проміжок часу тварина має обрати стимул, який підкріплюється.

д) Навчені в лабіринті. Це одна з форм дифференцировок. Перший лабіринт для пацюків побудував Вільям Смолл в 1900 році. Найпростіший лабіринт нагадує за формою літери У чи Т. Тварина має йти прямо до точки вибору. Складні лабіринти мають багато точок вибору. Шлях через лабіринт представляє найчастіше дорогу в гніздо щури або, рідше, дорогу до корму. Іноді знаходження "правильного" шляху підкріплюється можливістю пацюки вбити миша.

У дослідах з лабіринтами фіксуються час розв'язування задачі і число помилок, тобто число тупиків, в які заходила пацюк. Була виявлена цікава закономірність - число помилок починає падати спочатку навчання поблизу кінця шляху, у мети, і лише потім - на початку лабіринту. Поступово пацюки навчаються вибирати найкоротший шлях до мети.

е) Научение рішенню завдань на абстрактні поняття. Досліди проводяться на приматах. Під абстрактним розуміється часткове властивість сприйманого, загальне принаймні для двох об'єктів, різних за іншим своїм характеристикам. Абстрактне поняття люди позначають словом, наприклад: "більший" чи "чорний" або "квадрат". У тварин немає описового мови, отже, у них немає понять, тим не менш, багато примати здатні вирішувати завдання на диференціювання стимулів, що відрізняються абстрактним ознакою. Наприклад, із серії пропонованих стимулів, щоб отримати підкріплення, мавпа повинна вибирати стимул, більший за розміром, причому відносно більший.

Мавп також навчали вибирати стимул за ознакою відмінності. Тварині пред'являли три стимул-об'єкта, два з яких однакові. Щоб отримати підкріплення, мавпа повинна була вибрати "третій зайвий". Ставилися завдання на вибір за зразком. Нарешті, давалися завдання на чергування. Тварина має по черзі вибирати то один, то інший об'єкт (наприклад, то правий, то лівий). Більш складними завданнями, з якими примати все ж справлялися, були завдання на подвійне і потрійне чергування, а також завдання чергування відстрочених реакцій.