Оперантное обумовлення 1
Оперантное обумовлення. У цирку дресирувальники по-спонукає звірів зробити якусь дію, а потім хвалять їх і дають маленький шматочок їжі. Після того як тварина навчилося робити це нове дію, його спонукають до вчинення наступного дії. Якщо дія не те, яке потрібно дресирувальника, то він не дає тварині шматочка їжі, т. Е. Не заохочує його. Тварина починає вдосконалення-шать різні спроби і в підсумку реалізує потрібну дію.
· Оперантное обумовлення -наученіе, в ході кото-рого придбання нового досвіду і реалізаторів ція його в поведінці призводять до досягнення певної мети.
Якщо ми подивимося за поведінкою власної собаки, коли вона у дворі голок-рает з м'ячем, то ми помітимо, що вона може його кусати, притискати до землі і отпус-кати чи підкидати його. У природних умовах проживання організми не тільки відповідають на стимули, але і впливають на середу. Але як тільки організм зробив нову дію, подальшій появі цієї дії в поведінковому репертуарі буде залежати від того, який був його результат. Так, собака частіше буде підкидати м'яч, якщо ми будемо заохочувати це дія погладжуванням або шматочком ласою їжі.
Оперантное обумовлення (від лат. Оperatic- дію) означає таке научіння, в ході якого придбання певного нового досвіду і реалізація його поведінці призводять до досягнення певної мети. Воно дозволяє нам впливати на середовище і притаманне не тільки людям, а й більш простим істотам, так як павук або тарган. Сам термін був введений Б. Ф. Скіннер, хоча процедуру o п e рантного обумовлення використовували століттями для дресирування тварин. У Скіннера також був попередник, який впритул наблизився до опису цієї форми навчання.
На рубежі XIX і XX ст. американський дослідник Е. Торндайк намагався з'ясувати, чи існує у тварин розум, або інтелект. Для цього він побудував «проблемний ящик» (рис. 6-2), в який поміщав голодних котів. Поза клітини перебувала їжа, як правило, риба. Тварина могло відкрити дверку ящика тільки в тому випадку, якщо воно натиснув на педаль всередині ящика або потягнуло за важіль. Але коти спочатку намагалися дістати приманку, просовуючи лапи крізь ґрати клітки. Після серії невдач вони зазвичай обстежують-вали все всередині, виробляли різноманітні дії. Зрештою тварина наступало на важіль, і дверцята від-кривает. В результаті численних повторних про-цедур тварини поступово переставали здійснювати лиш-ня дії і відразу натискали на педаль.
Торндайк назвав це навчанням шляхом проб і помилок, оскільки перед тим як тварина навчається здійснювати потрібний акт, воно реалізує безліч помилкових. Таке навчення можна представити графічно. На рис. 6-3 з-Браже графік, або крива навчання, де по лінії абсцис відкладено кількість процедур, а по лінії ординат - час, за яке тварина відкриває дверку. Але нього можна побачити, що чим більше разів тварина потрапляло в проблемний ящик, тим швидше воно звідти виходило або, іншими словами, тим менше відбувалося помилок перед реалізацією потрібної дії.
Важливо зупинитися на одному моменті, який був відзначений американським ис-слідчим і зведений в ранг закону. Він виявив, що ті дії, які по-заохочувати, т. Е. Підкріплюються, з більшою ймовірністю виникали в наступних пробах, а ті, які не підкріплювалися, не використовувалися твариною в наступних пробах. Іншими словами, тварина навчається здійснювати тільки ті дії, за якими слід було підкріплення - це і є закон ефекту.
Найрадикальніший представник біхевіоризму, Б. Ф. Скіннер, вважав, що оперантное поведінку спонтанно і виникає без будь-яких очевидних стимулів, а реактивне поведінка є наслідком якогось стимулу. Оперантное поведінку можна модифікувати шляхом підкріплення. По суті, поведінка можна контролюватися-вать і їм можна управляти, створивши відповідний порядок підкріплення. Скіннер багато експериментував, в основному з пацюками і голу-бямі, і стверджував, що закономірності навчання одина-підступи як для тварин, так і для людини.
Розберемо типовий експеримент Скіннера. Голодно-го голуба садять в так званий «ящик Скіннера» (рис. 6-4). Усередині ящика немає нічого, крім кнопки і на-ходячи під нею годівниці. Голодна птах, потрапивши в клітину, починає все обстежити, розглядати і в ре-док вдаряє дзьобом по кнопці. Знову повторюється пошук: голуб клює підлогу або годівницю, в результаті знову клює кнопку. Так тварина протягом деякого ча-мени кілька разів клює кнопку. Кількість Клевань по кнопці, скажімо, за півгодини, умовно приймають за вихідний оперантний рівень. Далі включають годівницю, і тепер голуб після кожного удару по кнопці отримує зернятко. Через деякий час птах навчається клювати кнопку, так як це дію підкріплюється. Чим більше вона клює кнопку, тим більше вона отримує їжі. Якщо голуб буде клювати кнопку з високою частотою, то ця дія характеризується високим оперант ним рівнем, якщо буде клювати її рідко, то дія буде мати низький оперантний рівень.
Оперантний рівень, таким чином, показує рівень навченості підкріплюється актом. Але що буде, якщо перестати подавати підкріплення? Як і в класичному зумовлювання, відбудеться згасання оперантного поведінки. Наведемо приклад. Маленький хлопчик виявляв істеричні форми поведінки, якщо батьки не приділяли йому потрібної уваги, особливо перед сном. Так як батьків така поведінка сильно турбувало, вони весь час заспокоювали його і цим підкріплювали подальшій появі істерики. Їм порадили перестати звертати увагу на дитину, як би сильно не плакав. Скасування підкріплення у формі уваги повинна була привести до пригнічення, т. Е. До зникнення всіх істеричних проявів, що і сталося. Плач хлопчика зник вже через один тиждень.
Процедуру оперантного обумовлення застосовують для навчання тварин складних форм поведінки, які не виникли б у природних умовах. Наприклад, ведмедя можна навчити водити мопед, а дельфіна - стрибати через палаючий коло. Поведінка такої складності можна виробити у тварин, застосовуючи процедуру формування поведінки. Для прикладу наведемо ситуацію навчання кролика потягування кільця.
У невеликій клітці в одному кутку знаходиться автоматична годівниця, навпаки, в іншому кутку, - кільце. Голодний кролик, потрапивши в клітину, в перші хвилини все обнюхує, стає на задні лапи і визирає з клітки. Експериментатор починає подавати годівницю з їжею. Годівниця працює з шумом, тому тварина не відразу залазить в неї. Після того як кролик звик до шуму, він уже пов'язує його з появою їжі і сміливо залазить в годівницю за нею. Через деякий час перестають подавати їжу, після чого кролик знову починає здійснювати пошукову поведінку. Коли тварина повертає в сторону кільця, знову подають годівницю з їжею. Після безлічі реалізацій повороту кролику починають давати їжу тільки в тому випадку, якщо він підходить до кільця. Коли підхід до кільця сформований, знову перестають подавати їжу. Тварина починає пошукову поведінку, повторює всі форми вивчених раніше актів, починає гризти кільце і тягне його. Спрацьовує годівниця. Через деякий час тварина вже навчається потягування за кільце.
У оперантному навчанні особливу роль займає підкріплені-ня. Підкріпленням називається будь-який предмет або подія, яка значимо для організму і заради досягнення якого їм чиниться поведінку. Виділяють позитивне підкріплення і негативне підкріплення. В якості позитивного підкріплення завжди виступають біологічно необхідні для організму об'єкти, наприклад їжа, вода, статевий партнер і т. Д. У людей до біологічно необхідних об'єктів додаються продукти культури або культурні цінності. Негативне підкріплення небезпечно для життя, тому організм намагається уникнути його або запобігти його дію. Як негативний під-кріплення дослідники часто використовують електричний струм або гучний звук, а процедуру навчання в таких випадках прийнято називати аверзівним обумовлення третьому (від англ. Aversive - здобич).
· Підкріплення - предмет або подія, яка значимо для організму.
Тепер нам стає зрозуміло, чому Скіннер вважав, що поведінкою можна маніпулювати через підкріплення. Але насправді все виявилося набагато складніше. Мак-Фарленд повідомляє, що деякі дослідники намагалися навчити курчат стояти спокійно на рівному майданчику, щоб отримати винагороду, але ті весь час шкребли підлогу. Інші намагалися навчити свиню вкладати в скарбничку особливу монету. Але свиня ні за яке підкріплення не хотіла навчитися цьому, вона багато-кратно роняла на підлогу монету і піднімала знову. Проводили також дослідження з голубами, в ході яких їх навчали клювати кнопку або змахувати крилами. Виявилося, що птахи швидше навчалися клювати кнопку, якщо в якості підкріплення виступала їжа (позитивне підкріплення), а змахувати крилами - якщо цим поведінкою вони уникали удару електричного струму (негативне підкріплення). З точки зору Скіннера, голуби повинні були навчитися клювати кнопку або струшувати крилами незалежно від роду підкріплення.
Такий парадокс пояснили етологи - дослідники поведінки тварин в природних-ських умовах. У голубів акт Клевань є частиною харчової поведінки, тому голуб швидше навчається клювати кнопку, якщо за цим слід підкріплені-ня у вигляді їжі. А взмахіваніе крилами є частиною ізбегательной поведінки, так як птахи здійснюють цей акт перед тим як злетіти. Обмеження такого роду показують, що навчення пов'язано з наявним досвідом тваринного, а також з вродженими формами поведінки.