оперантное навчення

оперантное навчення

Навчені на основі освіти інструментальних умовних рефлексів

Батьком інструментальної форми навчання вважається Е. Торндайк, який ще в кінці минулого століття назвав таку форму навчання навчанням "методом проб, помилок і випадкового успіху". Торндайк проводив досліди, в яких кішки і інші тварини повинні були натискати на засувки або тягнути за пружини, щоб, відкривши дверцята, вийти з ящика і отримати зовні їжу. Яжікі були зроблені так, що їжа була помітна. Голодна кішка, вперше посаджена в ящик, виробляє безліч дій, в тому числі тягнеться до їжі через щілини і шкребе предмети, що знаходяться всередині скриньки. Нарешті вона випадково вдаряє по замикаючого механізму і вискакує назовні. При наступних пробах дії кішки поступово концентруються поблизу цього механізму, і інша активність з часом припиняється. Нарешті кішка стає здатною правильно поводитися, як тільки її помістять в ящик. За словами Д. Мак-Фарленд: "Циркові дресирувальники знали про навчанні тако типу протягом століть, але Торндайк перший досліджував його систематично і створив на основі своїх спостережень струнку теорію".

Але вітчизняному Новомосковсктелю більш відомий американський вчений Беррес Фредерік Скіннер, який вніс основний внесок у вивчення закономірностей утворення інструментальних умовних рефлексів. Запропоноване ним визначення оперантного навчання і оперантного умовного рефлексу зараз найбільш вживані при характеристиці інструментальної форми навчання. Може бути не дуже систематично, але популярно і талановито оперантний метод навчання і оперантний метод дресирування викладено в роботах американського психолога і дресирувальника Карен Прайор.

Замість кількаразового застосування сполучень, характерного для класичної вироблення умовних рефлексів, Скіннер розробив методику вільного оперантного поведінки, при якій тварині дозволяють здійснювати різні дії, потрібні з яких підкріплюють. Найчастіше для таких дослідів вибиралися щури і голуби, хоча використовувалися і інші тварини, а також людина. Знаменитий "ящик Скіннера" ​​насправді являє собою ящик з однієї зі сторін якого є педаль (важіль), який з'єднаний з годівницею. Зовні за стінкою розташований складний механізм, функція якого полягає в тому, що після кожного натискання на педаль в годівницю падає гранула корму. Як тільки щура саджають в ящик, вона починає активно досліджувати його - обнюхувати і дертися на стінки. При цьому випадково натискає на педаль після чого в годівницю падає корм. Зазвичай тварина цього не помічає, але знайшовши їжу, з'їдає її. Продовжуючи обстежити ящик, щур знову випадково натискає на педаль і поступово виявляє залежність між цим процесом і результатом. Як тільки тимчасова связт стане для неї зрозумілою, щур починає натискати на педаль, коли захоче їсти. Характерно, що спочатку щур натискає на важіль дуже рідко, потім число натиснень починає повільно зростати. Після приблизно 140 хвилин досвіду число натиснень раптом зростає дуже швидко. Зовсім не обов'язково чекати від тваринного випадкового натискання на важіль. Цю дію можна спровокувати (ініціювати) різними способами, наприклад, для навчання голуба клювати педаль, до неї можна приклеїти зернятко. Якщо говорити про напрацювання форм поведінки пов'язаних з харчовою потребою, то рекомендується знизити масу тіла тварини до 80% (!) Від початкової, тобто створити у тварини виражену харчову потребу (мотивацію).

В "ящику Скіннера" ​​тварина може освоїти не тільки форми харчової поведінки. Наприклад, якщо з'єднати важіль з обігрівачем повітря, щур швидко навчається підтримувати оптимальну для себе температуру, регулярно відключаючи і включаючи обігрівач натиском на важіль.

Хоча відкриття і вивчення інструментальних умовних рефлексів вважається заслугою американської науки, вони досліджувалися і в школі І.П. Павлова (наприклад, А.Г. Івановим-Смоленським, Г. Зеленим). Відомий польський вчений Ю.М. Конорскі, який також є учнем Павлова, вважається одним із творців теорії про інструментальні умовні рефлекси, які він називав умовними рефлексами другого типу.

Однак ще раніше вУкаіни виявив цю форму навчання і використовував її в своїй роботі талановитий цирковий дресирувальник В.Л. Дуров.

Обстаятельства і ситуації в які потрапляють тварини змушують їх робити ті чи інші форми поведінки, пріспособліваясь або активно пручаючись. Вчені назвали таку поведінку Оперантное (від латинського operatio - дія). Дії тварин призводять до яких-небудь наслідків або результатів, від яких залежить, чи будуть вони повторювати ці дії або уникати їх. Тобто інструментальні умовні рефлекси будуються на основі активної цілеспрямованої діяльності тварини. Послідовність подій і результат їх в даному випадку, залежать не тільки від зовнішньої сигналізації, але і від поведінки самої тварини. Таким чином, перша відмінність інструментального умовного рефлексу від класичного полягає в активній, цілеспрямованій діяльності того, хто навчається тварини. Другою відмінністю є те, що інструментальний рефлекс не чути лежить в його основі безумовну реакцію, в той час як класичний умовний рефлекс частково або повністю відтворює її.

При утворенні інструментальних умовних рефлексів основну роль грає "внутрішня активність тваринного" - його потреба і мотивація. Тобто в основі поведінки лежить не зовнішня сигналізація, а внутрішня потреба тварини. І вважається, що вибір реакції тваринам визначається не викликає її подразником, а встановленням тимчасової послідовності між реакцією, виконуваної тваринам в даній ситуації і підкріплюють подразником. При класичних умовних рефлексах зв'язок встановлюється між стимулами і результатом, а при інструментальному навчанні, вона виникає між реакцією і результатом. Таким чином, дія тваринного набуває сигнальну функцію по відношенню до результату (підкріпленню).

Ефективність навчання в формі освіти інструментальних умовних рефлексів полягає не тільки в тому, що тварина сама прагне вчинити будь-яку дію, але і в тому, що підкріплення - це не просто подія, пов'язана тимчасової послідовністю з будь-яким сигналом, а завжди задоволення домінуючою потреби, тому й стає біологічно важливим, а дії призводять до нього - біологічно доцільними.

Незважаючи на уявну близькість інструментальних умовних рефлексів руховим класичним рефлексам, спеціальними дослідженнями було доведено існування відмінностей між ними. В одному з них собака повинна була до тих пір реагувати на перший подразник, поки не пред'являвся другий, за яким слід було харчове підкріплення. Виявилося, що перший подразник викликав інструментальну реакцію, що не супроводжується слиновиділення, тоді як другий викликав слиновиділення.

Але слід зазначити, що хоча природна поведінка тварин в основному інструментально, в формуванні поведінкового акту важко розрізнити роль і участь того чи іншого виду умовного рефлексу.

Етапи оперантного навчання:

1. Створення стану виражена потреба у тварини.

2. Первинна ініціація потрібного поведінки (поведінкового акту) одним із способів дресирування. При цьому уникають способи больового впливу (оборонного поведінки) і предпочитаются способи, засновані на відборі поведінки.

3. Створення умов при яких тварини самостійно відтворюють первинно ініційоване поведінку.

4. Введення стимулу, санкціонує цей поведінковий акт.

5. Використання властивостей підкріплення і тренувального процесу для закріплення поведінкового акту до навички.

Як відомо, потреба, викликаючи мотивоване поведеніе6 активізує механізми пам'яті, сприяє збереженню уваги і досить довго підтримує необхідну поведінку і загальну рухову активність тварини.

Ініціювати потрібну поведінку можна будь-яким способом, проте в оперантной дресируванню найбільш вживані способи відбору поведінки, посилення поведінкового акту або його елемента і наведення. Важливо вчасно припинити застосування допоміжних способів, домагаючись самостійності тварини.

Введення команди можна здійснити як на другому етапі, так і після відпрацювання необхідного дії.

При оперантному навчанні підкріпленню надається особливе значення, так як воно визначає швидкість і ефективність навчання. При цьому враховують знак, величину, режим і час підкріплення. З підкріпленням пов'язано кілька "золотих" правил дресирування:

1. Закріплюється то, що підкріплюється.

2. Скасування позитивного підкріплення несе інформацію негативного підкріплення.

3. варіабельності режим підкріплення сприяє швидшому закріпленню дії та повільнішого його угашенію.

Багаторазове повторення дії, пов'язане зі зміною режиму підкріплення і зміною мотивації, забезпечує автоматизацію поведінкового акту до навички.