Научение в результате оперантного обусловливания
Как
мы видели, реактивные формы поведения
возникают в результате таких событий,
при которых организм в основном пассивно
испытывает
внешние воздействия на какие – то его
врожденные структуры.
Между
тем для животных организмов особенно
характерна активность:
в любое время
организм должен взаимодействовать со
средой, стремясь удовлетворять свои
потребности или избегать опасных
ситуаций. Поэтому обстоятельства, в
которые попадает организм и к которым
он вынужден приспосабливаться, выбирая
те или иные действия, способствуют
формированию многих новых форм поведения.
Бихевиористы
назвали такие формы поведения оперантными
(от лат. operatio
– действие),
поскольку в этом случае все начинается
с действия, совершаемого над окружающей
средой; оно вызывает какие – то
последствия, от которых и зависит, будет
ли организм повторять это действие или,
наоборот, избегать его. Таким образом,
выработка подобных форм поведения
осуществляется в результате закрепления
тех действий, последствия которых для
организма желательны, и отказа от
действий, приводящих к нежелательным
последствиям.
К оперантному
научению можно отнести три разновидности:
научение методом проб и ошибок, путем
формирования реакции и путем наблюдения.
Научение методом проб и ошибок
При
научении методом проб
и ошибок индивидуум,
встретившись с каким – либо препятствием,
совершает попытки преодолеть его и при
этом, постепенно отказываясь от
неэффективных действий, находит в конце
концов решение задачи.
Такой
тип научения был открыт Торндайком
(Thorndike,
1890) – одним
из первых ученых, заинтересовавшихся
процессами научения (рис. 7,2). В своих
опытах Торндайк использовал так
называемые проблемные клетки, в которые
он помещал голодных кошек (рис. 7.3).
Некоторые клетки открывались в том
случае, если животное тянуло за веревку,
а в других нужно было приподнять запорный
крючок. Торндайк подсчитывал, сколько
попыток и сколько времени требовалось
кошке для того,
чтобы решить стоящую перед ней задачу
– выйти из клетки и получить пищу,
помещенную снаружи.
Рис. 7.2. Эдуард Торндайк,
американский психолог (1874 – 1949). Он
впервые стал изучать решение животными
задач в лабораторных условиях. Работы
Торндайка привели его к теории научения
методом проб и ошибок и к закону эффекта,
на котором основана эта теория.
Рис. 7.3. «Проблемная
клетка», разработанная Торндайком в
1911 году. Кошка, помещенная в такую клетку,
должна была методом проб и ошибок
научиться нажимать на деревянную педаль,
что благодаря системе блоков и веревок
позволяло открывать дверцу.
Наблюдая
за животными, Торндайк заметил, что
сначала их действия были чисто случайными,
но в конце концов кошка «нечаянно»
задевала веревку или крючок, освобождалась
и получала вознаграждение. Однако по
мере увеличения числа попыток действия
животных все больше сосредоточивались
вокруг «ключевого» участка клетки, и
число ошибок, а также и время, проведенное
в клетке, быстро сокращалось. Торндайк
представил эти результаты в виде кривых
(рис. 7.4) и вывел закономерности, позволяющие
объяснить эффективность такого метода
«проб и ошибок». Согласно важнейшей из
этих закономерностей – закону
эффекта, –
в случае,
если какое-то действие приводит к
желательным результатам, вероятность
его повторения возрастает, а если к
нежелательным последствиям – снижается
(см. документ 7.2).
Рис. 7.4. Кривые научения
методом проб и ошибок. Сходные кривые
получал Торндайк по данным своих опытов
на кошках. Видно, что чем больше проб
совершает животное, тем меньше становится
число ошибок.
Однако научение
методом проб и ошибок само по себе не
очень эффективно. Если бы новые формы
поведения удавалось «изобрести» лишь
случайным образом, было бы трудно
объяснить быстрое приобретение новых
навыков людьми и домашними животными.
Без сомнения, вполне вероятно, что на
протяжении миллионов лет именно такой
процесс приводил к выработке различных
навыков у наших предков. Но не менее
очевидно, что по мере совершенствования
этих навыков и упрочения власти человека
над окружающей средой постепенно
складывались новые способы формирования
и передачи новых типов поведения.
Скиннер
– признанный вождь американских
бихевиористов в последние 30 лет –
систематизировал теорию Торндайка,
пытаясь объяснить, каким образом в
структурированной среде формируется
множество различных типов поведения.
При этом Скиннер вскрыл принципы
оперантного
обусловливания и
формирования
реакций путем
последовательных приближений.
Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]
- #
- #
- #
- #
- #
- #
- #
- #
- #
- #
- #
Научение – это выработка в процессе онтогенеза приспособительных форм поведения. Научение обеспечивает постоянное пополнение и изменение наших знаний, а также приобретение новых навыков и умений. Для научения необходима память, т.к. она представляет механизм, с помощью которого накапливается прошлый опыт, который может стать источником адаптивного поведения. Научение требует определённого времени и реализуется с помощью нейрофизиологических механизмов разного уровня: межклеточного, внутриклеточного, молекулярного.
Существует несколько классификаций научения. Все виды научения делят на две группы: неассоциативное и ассоциативное, кроме того, выделяют простое и сложное научение. По критерию активности животного или человека в ходе научения выделяют 4 группы научения:
I.Пассивное (реактивное) научение имеет место во всех случаях, когда организм, не прилагая целенаправленных усилий реагирует на какие-то внешние факторы и когда в нервной системе формируются новые следы памяти. Формами пассивного научения являются: привыкание, сенситизация, импринтинг и классические условные рефлексы.
А) Привыкание (габитуация) – выражается в ослаблении поведенческой реакции при повторных предъявлениях стимула. Примером поведенческого привыкания является угасание ориентировочного рефлекса в случае многократно повторяющегося раздражителя, не имеющего значения для организма. Благодаря привыканию мы можем игнорировать раздражители, не несущие никакой новизны и не имеющие для нас значения, сосредоточивая внимание на более важных явлениях. Привыкание – это особый приспособительный нервный процесс, его не следует путать с утомлением и адаптацией анализаторов, т.к. его можно вызвать изменением стимула.
Б) Сенситизация – усиление реакции организма на повторяющийся стимул, если он вызывает каждый раз неприятные ощущения (например, жужжание мухи, писк комара). В данном случае научение носит негативный характер. В основе механизма этого вида научения лежит механизм синаптического облегчения (посттетанической потенциации), которое улучшает проведение в синапсах после короткого раздражения афферентных путей.
В) Импринтинг – запечатление в памяти новорождённого окружающей действительности. Это особая форма научения, основанная на врождённой предрасположенности к определённым сочетаниям раздражителей и возникающих ответных реакциях в ранний период развития организма. В отличие от ассоциативного или инструментального обучения импринтинг может реализоваться только в определённый период онтогенеза, так называемый сенситивный (чувствительный) период. Первые данные о наличии чувствительных периодов в раннем онтогенезе, при которых происходит запечатление, были получены Конрадом Лоренцом на выводковых птицах. Учёный назвал такой тип обучения импринтингом. Различают несколько форм проявления импринтинга:
- 1. Запечатление образов и объектов: родителей, братьев, сестёр, вида пищи т.д.
- 2. Усвоение поведенческих актов (дети повторяют действия родителей). Это так называемое имитационное поведение, разновидностью этого импринтинга является половой импринтинг – половое поведение особей внутри своего вида.
- 3. Реакция следования – автоматическое следование новорождённого за родителями. Реакция следования происходит не только за запечатлённым объектом, но и за близкими ему по форме. При этом запечатляться может любой предмет.
Считают, что двигательным эквивалентом реакции следования животных у ребёнка является улыбка, смена мимики, реакция оживления уже на втором месяце жизни.
Импринтинг имеет сходство как с безусловными, так и условными рефлексами:
- также как и безусловные рефлексы эти реакции сохраняются, как правило, в течение всей жизни.
- являются врождёнными, однако для их проявления требуются определённые условия. Например, реакция следования является врождённой, но в процессе жизни превращается в приобретённую (если изолировать детёныша от родителей сразу после рождения на определённый промежуток времени, то реакция следования не формируется, т.е. конкретная реакция по наследству не передаётся, имеется только готовность к её выполнению у новорождённого).
Импринтинг отличается и от безусловных, и от условных рефлексов:
- он проявляется в определённые критические (сенситивные) периоды.
- запечатление происходит очень быстро, иногда с первого раза.
Открытие сенситивных периодов в развитии головного мозга и поведения птиц явилось стимулом для проведения исследований на млекопитающих. Наблюдение за развитием детей свидетельствует о том, что важную роль в нервно-психическом развитии ребёнка имеет импринтинг, влияющий на будущее поведение, предопределяя его на долгие годы, По-видимому, в развитии детей имеются критические периоды, но они сдвинуты на более поздние сроки, чем у животных. В частности, существует мнение, что возраст от 6 недель до 6 месяцев является критическим для формирования отношений ребёнка с матерью.
- Классические условные рефлексы по И.П.Павлову – положительные и отрицательные.
II. Оперантное научение (от лат. оperatio –действие) – это научение, в ходе которого организм добивается полезного результата с помощью активного поведения. Имеется три вида оперантного научения – метод проб и ошибок, инструментальный условный рефлекс и самораздражение.
А) Метод проб и ошибок. Амер. Уч. Э.Торндайк (один из основоположников бихевиоризма, от англ. behavior – поведение) помещал кошек в проблемные клетки, которые открывались в том случае, если кошка предпринимала какие-либо действия. Когда кошка выходила из клетки, она получала пищу. По мере повторения этой процедуры (увеличения числа проб и ошибок) скорость выполнения задачи возрастала.
Б) Инструментальный условный рефлекс – научение действию с помощью вознаграждения (подкрепления). Этот вид оперантного научения происходит по сигналу в отличие от научения методом проб и ошибок, который осуществляется без сигнала. Например, животное по световому сигналу нажимает на рычаг и выключает электрический ток, чтобы избежать раздражения, т.е. использует какой-то инструмент, отсюда и название этого вида научения.
В) Самораздражение структур мозга для получения удовольствия, положительных эмоций. Если крысе вживить раздражающий электрод в латеральную область гипоталамуса, поместить её в камеру Скиннера и предоставить ей возможность осуществлять самораздражение, нажимая на рычаг, крыса будет осуществлять самораздражение настолько интенсивно, что возникает опасность её гибели от истощения.
III. Когнитивное научение (рассудочное) основано на формировании функциональной структуры среды, т.е. на извлечении законов связей между её отдельными компонентами. К когнитивному научению относится: научение путём наблюдения, рассудочная деятельность, психонервная деятельность. Некоторые исследователи к этой форме научения относят вероятностное прогнозирование.
А) Научение путём наблюдения, в результате которого выполняются действия путём непосредственного наблюдения за действием других. Различают два вида этого научения: простое подражание и викарное научение.
- 1. Простое подражание. Например, обезьяна в общении с исследователями научилась мыть банан перед едой, не понимая, зачем она это делает.
- 2. Викарное научение. Осуществляется также с помощью наблюдения, но при этом результат действия оценивается. Такое научение свойственно только человеку. Особенно часто используют научение путём наблюдения дети, причем в раннем детстве оно является преимущественно подражательным. С возрастом начинает преобладать викарное научение.
Б) Рассудочная деятельность. Представление о рассудочной деятельности животных ввёл в научный оборот в 1960 г. Л.В.Крушинский. Наиболее характерное свойство элементарной рассудочной деятельности животных заключается в их способности улавливать простейшие эмпирические законы, связывающие предметы и явления окружающей среды, и возможность оперировать этими законами при построении программ поведения в новых ситуациях.Рассудочная деятельность отличается от любых форм обучения тем, что она осуществляется при первой же встрече организма с необычной ситуацией, создавшейся в среде его обитания. Наблюдения за поведением животных привели Л.В.Крушинского к заключению о том, что их способность к экстраполяции направления движения раздражителя можно рассматривать как одно из элементарных проявлений рассудочной деятельности. Под экстраполяцией понималась способность животных определять направление дальнейшего перемещения значимого для него раздражителя.
Для исследования способности животных к экстраполяции (экстраполяционным рефлексам) в лаборатории Л.В.Крушинского проводился эксперимент, сущность которого заключалась в следующем: перед животным помещалась ширма с щелью. За ширмой располагали две кормушки, одна из которых пустая, а другая с пищей. После того, как животное в течение нескольких секунд подкармливалось через щель, кормушки раздвигались в разные стороны. Животное должно было определить направление движения кормушки с кормом и, обежав ширму, достичь её.
При исследовании способности к экстраполяции разных представителей животного мира, оказалось, что первое место среди млекопитающих занимали волки и красные лисицы. У птиц самая высокая способность к экстраполяции наблюдается в семействе врановых птиц. Рептилии, в частности, ящерицы и крокодилы, решали задачу уже при первых её предъявлениях, тогда как рыбы и амфибии с ней не справлялись.
В лаборатории Л.В.Крушинского исследовался также вопрос о соотношении обучаемости и элементарной рассудочной деятельности. Результаты показали, что доля правильных решений задачи при многократном её предъявлении уменьшается у тех видов животных, для которых был характерен высокий показатель при первом предъявлении, и наоборот – постепенное увеличение доли правильных решений у плохо экстраполирующих животных. Таким образом был установлен парадоксальный результат: у животных с высоким уровнем рассудочной деятельности многократное предъявление экстраполяционной задачи ухудшает её решение. По мнению Л.В.Крушинского, это объясняется тем, что правильное решение вызывает резкое возбуждение головного мозга, что приводит при следующих предъявлениях к ухудшению решения задачи. А у животных с невысоким уровнем рассудочной деятельности нарушений деятельности мозга не происходит, в результате обучению правильному решению задачи проходит успешно. Следовательно, степень развития рассудочной деятельности обусловливает тот исходный фон, с которого начинается формирование поведения при участии индивидуального опыта. Чем выше уровень элементарной рассудочной деятельности, тем пластичнее и адаптивнее поведение.
Таким образом сложное приспособительное поведение животных, с точки зрения Л.В.Крушинского, строится из трёх основных компонентов ВНД: инстинктов, условных рефлексов и рассудочной деятельности, благодаря которой организм сразу вырабатывает программу адаптивного поведения в новых условиях, внезапно сложившихся ситуациях и способен выбрать наиболее адекватную тактику поведения в новой обстановке, прогнозируя развитие событий.
В) Психонервная деятельность (или образное поведение, или образная память). Психонервная деятельность исследовалась И.С. Бериташвили в 1926 г. Суть психонервной деятельности состоит в том, что у высших позвоночных животных при первом же восприятии конкретных явлений окружающей действительности (пищи, врага и т.д.) возникает определённый образ. Этот образ сохраняется, и, каждый раз, когда он воспроизводится при восприятии данной среды или какого-либо его компонента, животное ведёт себя точно так же, как и при непосредственном восприятии. И.С. Бериташвили считал, что нервным субстратом психонервной деятельности является неокортекс. В отличие от условнорефлекторной деятельности психонервный образ
- не требует повторяемости, а формируется сразу;
- быстро перестаёт вызывать определённое поведение, если не сопровождается удовлетворением биологической потребности;
- требует обязательного участия коры головного мозга, прежде всего её лобных отделов;
- психонервная деятельность определяет включение и выключение условных и безусловных рефлексов, а также последовательность их протекания.
Индивидуальное поведение, первично направляемое психонервным образом, при повторной тренировке автоматизируется и осуществляется по всем закономерностям условнорефлекторной деятельности.
Г) Вероятностное прогнозирование, под которым понимается предвосхищение будущего, основанное на вероятностной структуре прошлого опыта и информации о наличной ситуации. Оба эти фактора являются основой для создания гипотез о предстоящем будущем. В соответствии с таким прогнозом осуществляется подготовка к действиям в предстоящей ситуации, приводящим к наибольшей вероятности достижения цели. Высшие позвоночные и человек в своей деятельности постоянно опираются на вероятностное прогнозирование. Например, когда человек переходит улицу, он прогнозирует ситуацию на проезжей части и интервал времени для безопасного пересечения дороги.
IV. Научение путём инсайта (озарения) – это внезапное нестандартное правильное решение задачи. Этот вид научения является следствием объединения опыта, накопленного в памяти, с той информацией, которой располагает индивид при решении проблемы.
В заключение необходимо отметить, что в конкретных ситуациях для достижения приспособительного результата индивид чаще всего использует не один, а несколько видов научения.
Глава 7. Научение
Адаптация и научение
Жизнь любого организма — это прежде всего непрерывная адаптация к условиям столь же непрерывно меняющейся среды.
Из предыдущих глав мы уже знаем, что существование живых организмов сводится к постоянной выработке форм поведения, направленных на восстановление какого-то нарушенного равновесия или на достижение определенных целей. Это универсальный закон, которому подчиняется все существующее — от атома до Вселенной. Для Вселенной прийти в равновесие, т. е. перестать расширяться, означало бы тепловую смерть. Для нас же — «частиц мироздания» — равновесие может означать лишь биологическую смерть или по меньшей мере психическую смерть. Только такая судьба может ожидать тех, кто перестанет приспосабливаться к окружающей среде.
У животных эта непрерывная адаптация осуществляется благодаря все более и более сложным процессам — от рефлексов до мышления.
В первой главе мы уже убедились в том, что по мере продвижения вверх по ступеням иерархии живых существ стереотипные, предопределенные или запрограммированные формы поведения (у примитивных животных) постепенно уступают место более гибкому и пластичному поведению, позволяющему организмам адаптироваться к тем разнообразным ситуациям, с которыми они ежедневно сталкиваются.
Если рефлекторные и инстинктивные типы поведения не могут претерпевать значительных изменений, то, напротив, приобретенные поведенческие реакции могут изменяться, иногда очень существенно и притом необратимо. Эти изменения происходят в результате того опыта, который в то или иное время приобретает индивидуум.
Именно необратимость или хотя бы стойкость изменений служит отличительной чертой приобретенных форм поведения. Поведенческие реакции порой изменяются и при болезнях, утомлении или сотрясении мозга. Однако изменения в этих случаях — в отличие от научения — бывают лишь временными.
Виды научения
Научение может осуществляться на разных уровнях в зависимости от того, каков его нервный механизм и насколько важны или сложны те структуры, которые в нем участвуют. Некоторые виды научения могут происходить уже на уровне рецепторов или спинного мозга; для других же необходимо участие подкорковых структур или даже миллиардов нервных цепей коры головного мозга.
Одни формы научения осуществляются автоматически и непроизвольно. Другие требуют такого программирования, на которое может быть способен лишь развитый мозг высших млекопитающих и в особенности человека.
Мы можем выделить три категории научения, различающиеся по степени участия в них организма как целого. Речь идет соответственно о выработке 1) реактивного поведения, 2) оперантного поведения и 3) такого поведения, которое требует участия мыслительных процессов в обработке информации (когнитивное научение).
Когда создаются новые формы реактивного поведения, организм пассивно реагирует на какие-то внешние факторы и в нервной системе как бы незаметно и более или менее непроизвольно возникают изменения нейронных цепей и формируются новые следы памяти. К таким типам научения относятся следующие (перечислены в порядке усложнения): привыкание (габитуация) и сенсибилизация, импринтинг и условные рефлексы.
Оперантное поведение — это действия, для выработки которых нужно, чтобы организм активно «экспериментировал» с окружающей средой и таким образом устанавливал связи между различными ситуациями. Такие формы поведения возникают при научении путем проб и ошибок, методом формирования реакций и путем наблюдения.
Во всех этих случаях организм изменяет поведение в результате взаимодействия со средой. Именно от того, какие сигналы поступают извне, зависит, какая именно реакция организма будет закрепляться. «Выбор» реакции при этом определяется тем, каковы ее последствия в отношении удовлетворения потребностей или избегания нежелательной ситуации.
К третьей группе относятся формы поведения, обусловленные когнитивным научением. Здесь уже речь идет не просто об ассоциативной связи между какими-то двумя ситуациями или между ситуацией и ответом организма, а об оценке данной ситуации с учетом прошлого опыта и возможных ее последствий. В результате этой оценки принимается наиболее подходящее решение. К такому типу научения можно отнести латентное научение, выработку психомоторных навыков, инсайт и в особенности научение путем рассуждений.
В последующих разделах мы рассмотрим каждый из этих типов научения с тем, чтобы подробнее описать их и оценить их значение для поведения организма.
Научение реактивным формам поведения
Реактивное поведение можно определить как реакцию организма на тот или иной раздражитель (или ситуацию-раздражитель) (Malcuit, Pomerlau, 1977). Именно поэтому мы можем отнести к этим формам научения не только классическое обусловливание, но и такие более примитивные явления, как привыкание и сенсибилизация.
Привыкание и сенсибилизация
Это чрезвычайно примитивные виды научения, при которых у организма вырабатывается относительно устойчивая и постоянная реакция на повторные стимулы. Эти две зачаточные формы научения проявляются в изменении степени активации организма данным стимулом: в случае привыкания активация уменьшается, а в случае сенсибилизации увеличивается.
Как уже говорилось в главе 4, привыкание (габитуация) наступает, когда организм — в результате изменений на уровне рецепторов или ретикулярной формации — «научается» игнорировать какой-то повторный или постоянный раздражитель, «убедившись», что он не имеет особого значения для той деятельности, которая в данный момент осуществляется. В отличие от этого при утомлении снижается внимание ко всем действующим раздражителям.
Сенсибилизация — это процесс, противоположный привыканию. При сенсибилизации повторение стимула ведёт к более сильной активации организма, и последний становится все более и более чувствительным к данному стимулу; в результате раздражитель, не вызывавший при однократном воздействии никакой реакции, повторяясь, начинает провоцировать то или иное поведение. Представим себе, например, что в комнате, где мы работаем, жужжит назойливая муха или же из плохо завернутого крана в раковину мерно падают капли воды. Эти раздражители становятся для нас постепенно все труднее переносимыми. Можно привести и другие примеры — царапину на музыкальной пластинке, вызывающую при каждом прослушивании треск, который мы уже заранее ожидаем, или слова-паразиты вроде «так сказать», «значит» и т. п. в лекциях некоторых преподавателей; иногда такие слова повторяются настолько часто, что могут полностью отвлекать внимание студентов от содержания лекции.
Импринтинг
У низших позвоночных животных к реактивным типам научения можно отнести также импринтинг. Об этом явлении мы уже говорили в первой главе и поэтому здесь на нем останавливаться не будем. Напомним только, что речь идет о наследственно запрограммированном и необратимом формировании привязанности новорожденного животного к первому движущемуся объекту, который попадает в поле его зрения в первые часы жизни.
Условные рефлексы
Условные рефлексы возникают в результате формирования связи между специфическим стимулом, вызывающим тот или иной врождённый рефлекс, и каким-либо индифферентным стимулом. В результате индифферентный раздражитель сам по себе начинает вызывать данный рефлекс.
У всех нас к моменту появления на свет уже имеется ряд врождённых рефлексов, таких как выделение слюны при попадании в рот пищи или моргание в ответ на громкий звук. К врождённым рефлексам относятся также отдергивание руки при воздействии болевого раздражителя или коленный рефлекс — разгибание ноги при ударе по коленному сухожилию. Для проявления таких рефлексов не нужно никакого предварительного опыта и никаких других условий, кроме специфического стимула. Иными словами, это безусловные рефлексы — они автоматически включаются в ответ на определенные раздражители, тоже называемые безусловными. Например, когда раздается громкий звонок, мы можем вздрогнуть, но слюноотделение у нас не начнется; электрический удар, полученный конечностью, заставит нас отдернуть эту конечность, но не моргнуть; и т. д.
Бывает, однако, что одновременно со специфическим раздражителем, вызывающим какой-либо безусловный рефлекс, действует другой раздражитель, не имеющий с ним ничего общего. Если такая связь между двумя раздражителями достаточно ясна или часто повторяется, то индифферентный раздражитель сам по себе начинает вызывать тот же рефлекс.
Это явление было открыто русским физиологом И. П. Павловым в 1903 году. В ходе своих опытов Павлов обратил внимание на то, что звон миски, в которую накладывали пищу, вскоре начинал сам по себе вызывать у собаки слюноотделение. Таким образом, индифферентный звуковой стимул, если он просто сочетается во времени с безусловным пищевым раздражителем, может приобрести способность вызывать тот же рефлекс. В связи с этим Павлов назвал такие раздражители условными, а вызываемое ими рефлекторное слюноотделение — условным рефлексом (рис. 7.1).
Рис. 7.1. И. П. Павлов и его сотрудники. На фотографии представлена также одна из знаменитых собак, на которых Павлов с 1901 года изучал выработку классических условных рефлексов.
Достаточно быстро было доказано, что при формировании таких рефлексов действительно происходит образование условной связи с безусловным раздражителем. Павлов показал, что достаточно было прекратить предъявление безусловного стимула, чтобы и условный сигнал быстро переставал действовать. Например, если после подачи звукового сигнала животному не выдавалась пища, то этот сигнал вскоре уже не вызывал слюноотделения. Далее мы еще вернёмся к этому феномену угасания, характерному для большинства видов научения путем обусловливания.
С физиологической точки зрения обусловливание можно объяснить тем, что к уже существующей прямой связи между специфическим сенсорным сигналом и безусловным рефлексом как бы пристраивается новый сигнал. В результате этот новый сигнал приобретает возможность сам по себе вызывать тот же рефлекс.
Итак, мы уже знаем, что звонок, подаваемый одновременно с пищей, может в дальнейшем сам по себе вызывать слюноотделение. Точно так же можно добиться того, чтобы электрический удар, наносимый одновременно с сильным звуком, вызывал моргание или, наоборот, чтобы сильный звук в сочетании с ударом тока приводил к отдергиванию конечности, и т. п.
По мнению Павлова, таким ассоциативным обусловливанием можно объяснить большинство приобретенных форм поведения. Такой же точки зрения придерживался и бихевиорист Уотсон, который через несколько лет после Павлова показал, как могли бы развиваться некоторые эмоциональные реакции, не включённые от рождения в естественный репертуар индивидуума (см. документ 7.1).
Научение в результате оперантного обусловливания
Как мы видели, реактивные формы поведения возникают в результате таких событий, при которых организм в основном пассивно испытывает внешние воздействия на какие-то его врождённые структуры.
Между тем для животных организмов особенно характерна активность: в любое время организм должен взаимодействовать со средой, стремясь удовлетворять свои потребности или избегать опасных ситуаций. Поэтому обстоятельства, в которые попадает организм и к которым он вынужден приспосабливаться, выбирая те или иные действия, способствуют формированию многих новых форм поведения.
Бихевиористы назвали такие формы поведения оперантными (от лат. operatio — действие), поскольку в этом случае все начинается с действия, совершаемого над окружающей средой; оно вызывает какие-то последствия, от которых и зависит, будет ли организм повторять это действие или, наоборот, избегать его. Таким образом, выработка подобных форм поведения осуществляется в результате закрепления тех действий, последствия которых для организма желательны, и отказа от действий, приводящих к нежелательным последствиям.
К оперантному научению можно отнести три разновидности: научение методом проб и ошибок, путем формирования реакции и путем наблюдения.
Научение методом проб и ошибок
При научении методом проб и ошибок индивидуум, встретившись с каким-либо препятствием, совершает попытки преодолеть его и при этом, постепенно отказываясь от неэффективных действий, находит в конце концов решение задачи.
Такой тип научения был открыт Торндайком (Thorndike, 1890) — одним из первых ученых, заинтересовавшихся процессами научения (рис. 7.2). В своих опытах Торндайк использовал так называемые проблемные клетки, в которые он помещал голодных кошек (рис. 7.3). Некоторые клетки открывались в том случае, если животное тянуло за верёвку, а в других нужно было приподнять запорный крючок. Торндайк подсчитывал, сколько попыток и сколько времени требовалось кошке для того, чтобы решить стоящую перед ней задачу — выйти из клетки и получить пищу, помещенную снаружи.
Рис. 7.2. Эдуард Торндайк, американский психолог (1874–1949). Он впервые стал изучать решение животными задач в лабораторных условиях. Работы Торндайка привели его к теории научения методом проб и ошибок и к закону эффекта, на котором основана эта теория.
Рис. 7.3. «Проблемная клетка», разработанная Торндайком в 1911 году. Кошка, помещенная в такую клетку, должна была методом проб и ошибок научиться нажимать на деревянную педаль, что благодаря системе блоков и верёвок позволяло открывать дверцу.
Наблюдая за животными, Торндайк заметил, что сначала их действия были чисто случайными, но в конце концов кошка «нечаянно» задевала верёвку или крючок, освобождалась и получала вознаграждение. Однако по мере увеличения числа попыток действия животных все больше сосредоточивались вокруг «ключевого» участка клетки, и число ошибок, а также и время, проведенное в клетке, быстро сокращалось. Торндайк представил эти результаты в виде кривых (рис. 7.4) и вывел закономерности, позволяющие объяснить эффективность такого метода «проб и ошибок». Согласно важнейшей из этих закономерностей — закону эффекта, — в случае, если какое-то действие приводит к желательным результатам, вероятность его повторения возрастает, а если к нежелательным последствиям — снижается (см. документ 7.2).
Рис. 7.4. Кривые научения методом проб и ошибок. Сходные кривые получал Торндайк по данным своих опытов на кошках. Видно, что чем больше проб совершает животное, тем меньше становится число ошибок.
Однако научение методом проб и ошибок само по себе не очень эффективно. Если бы новые формы поведения удавалось «изобрести» лишь случайным образом, было бы трудно объяснить быстрое приобретение новых навыков людьми и домашними животными. Без сомнения, вполне вероятно, что на протяжении миллионов лет именно такой процесс приводил к выработке различных навыков у наших предков. Но не менее очевидно, что по мере совершенствования этих навыков и упрочения власти человека над окружающей средой постепенно складывались новые способы формирования и передачи новых типов поведения.
Скиннер — признанный вождь американских бихевиористов в последние 30 лет — систематизировал теорию Торндайка, пытаясь объяснить, каким образом в структурированной среде формируется множество различных типов поведения. При этом Скиннер вскрыл принципы оперантного обусловливания и формирования реакций путем последовательных приближений.
Формирование реакций
С точки зрения Скиннера, поведение не всегда возникает чисто случайным образом — нередко оно формируется в результате отбора под действием подкрепляющего фактора. Таким фактором может быть любой стимул, появляющийся или исчезающий после той или иной поведенческой реакции и повышающий вероятность того, что эта реакция будет повторена с целью получить подкрепление. Это позволяет объяснить формирование очень сложных поведенческих реакций поэтапно, каждый этап при этом будет подкрепляться.
Исходя из этих соображений, Скиннер разработал способ формирования поведения путем последовательных приближений, составляющий основу оперантного обусловливания. Этот способ состоит в том, что весь путь от исходного поведения (еще до начала обучения) до конечной реакции, которую исследователь стремится выработать у животного, разбивается на несколько этапов. В дальнейшем остается лишь последовательно и систематически подкреплять каждый из этих этапов и таким образом подводить животное к нужной форме поведения. При таком способе обучения животное вознаграждают за каждое действие, приближающее его к конечной цели, и у него постепенно вырабатывается заданное поведение.
Допустим, что нам нужно обучить голубя ударять клювом по маленькому светящемуся кружку, когда он захочет получить вознаграждение в виде зернышка (рис. 7.5). Вначале мы будем давать ему зернышко каждый раз, когда он зайдет в ту половину клетки, где находится светящийся кружок. Далее мы будем вознаграждать его лишь в том случае, если он не только зашел в эту половину клетки, но еще и повернулся головой к стенке, на которой находится кружок. На третьем этапе можно, например, давать зернышко при сочетании этих двух условий, если вдобавок еще клюв животного направлен в сторону кружка. Затем постепенно можно заставить голубя касаться клювом кружка и, наконец, ударять по нему с целью получить вознаграждение. Как мы видим, при таком методе обучения к очередному этапу переходят лишь тогда, когда уже сформировалась поведенческая реакция, необходимая на предыдущем этапе (рис. 7.6).
Рис. 7.5. Голубь в клетке Скиннера реагирует на световой сигнал, появляющийся перед ним на стенке при освещении пластмассового диска с другой стороны. В ответ на такой сигнал голубь ударяет по диску клювом, чтобы в кормушке появилось зерно.
Рис. 7.6. Крыса, помещенная в клетку Скиннера, должна при появлении определенного стимула нажать на рычаг, за что получает пищевое вознаграждение.
По мнению Скиннера и других бихевиористов, именно так происходит выработка большинства поведенческих реакций у человека. Действительно, можно привести множество примеров, как будто бы частично подтверждающих это.
С позиций Скиннера можно объяснить очень быстрое обучение ребенка первым словам (не распространяя, однако, эту концепцию на освоение языка в целом). Вначале, когда ребенок еще только начинает произносить какие-то членораздельные звуки, лепет «ме-ме-ме» уже вызывает восторг окружающих, и особенно счастливой мамы, которой уже кажется, что дитя зовет именно ее. Однако вскоре энтузиазм родителей по поводу таких звуков остывает до тех пор, пока младенец ко всеобщей радости не выговорит «мо… мо». Потом и эти звуки перестают для новорожденного подкрепляться, пока не появится сравнительно членораздельное «мо-мо». В свою очередь это слово по тем же причинам вскоре сменится сочетанием «мома», и наконец ребенок отчетливо выговорит свое первое слово — «мама». Все же остальные звуки будут восприниматься окружающими лишь как «детский лепет» в буквальном смысле слова, и они постепенно исчезнут из «лексикона» новорожденного.
Таким образом, в результате избирательного поощрения со стороны членов семьи младенец отбрасывает те неправильные реакции, за которые он не получает социального подкрепления, и сохраняет лишь те, которые наиболее близки к ожидаемому результату.
Формирование реакции играет роль не только в воспитании ребенка, но также в отношениях между супругами и в различных аспектах социальной жизни. Каждый раз, когда индивидуум или социальный институт хочет добиться той или иной поведенческой реакции от партнера или от группы населения, он вполне может запланировать и реализовать такие подкрепляющие факторы, которые повышали бы вероятность желательного поведения. Однако ясно, что подобные методы часто находятся на грани манипулирования личностью и не всегда практикуются исключительно для ее блага.
Кроме того, как мы уже знаем из главы 6, сторонники когнитивного подхода к мотивации полагают, что внешняя мотивация, создаваемая подкреплением, чаще всего приводит к исчезновению внутренней мотивации, присутствующей на первых этапах во многих видах поведения у человека (см. документ 7.3).
Для того чтобы лучше разобраться в приведенных примерах, нам нужно теперь вернуться к некоторым аспектам подкрепления.
Различные стороны процесса подкрепления
Подкрепление — это такое воздействие, при котором появление или исчезновение какого-то стимула в результате той или иной поведенческой реакции повышает вероятность повторения этой реакции. Например, если голодное животное каждый раз будет находить в определенном углу помещения пищу, то оно будет все чаще направляться в этот угол (хорошим примером могут служить эксперименты Олдса, в которых были открыты центры удовольствия; см. документ 6.4). И напротив, если после зажигания красной лампочки животное будет получать удар током, а избежать его можно будет только перепрыгнув из одной половины клетки в другую, то вероятность такой реакции на красную лампочку будет возрастать. В первом случае потребление пищи или удовольствие, получаемое при электростимуляции мозга, играет роль положительного подкрепления. Во втором случае речь идет об отрицательном подкреплении [52] — предотвращении электрического удара.
Часто смешивают отрицательное подкрепление с наказанием. Однако, как мы уже знаем, подкрепление всегда увеличивает вероятность повторения данной поведенческой реакции, а наказание, наоборот, приводит к исчезновению такой реакции, которая сочтена нежелательной. Значит, в отличие от подкрепления при наказании стремятся либо подать аверсивный раздражитель (например, нанести животному удар током или отшлепать ребенка), либо лишить вознаграждения (вкусной еды или ласки) каждый раз, когда проявляется такая форма поведения, которую нужно устранить.
Скиннер и многие психологи принципиально отрицают наказание как средство воспитания, предпочитая в основном использование положительных подкрепляющих факторов, которые способствуют выработке у ребенка социально адекватного поведения, а не подавлению социально неадекватного. По их мнению, нежелательные формы поведения легко могли бы исчезнуть, если бы те, кому доверен процесс воспитания, осуществляли его правильно и не были вынуждены наказывать за то, что они сами вначале непроизвольно поощряли.
Кроме того, бихевиористы различают первичное и вторичное подкрепление. Первичное подкрепление — это удовлетворение физиологических потребностей, таких как голод, жажда, сон и т. п. Что касается вторичного подкрепления, то здесь речь идет об удовлетворении, как-то связанном с другими подкрепляющими факторами (первичными или вторичными). Когда мы получаем гонорар или диплом за выполненную работу, когда ребенка награждают игрушкой или военного — орденом [53], когда человек получает престижную должность — во всех этих случаях действует вторичное подкрепление, удовлетворение социальных потребностей, повышающее самоуважение у лиц, у которых оно высоко развито или, наоборот, поколеблено.
Угасание, дифференцировка и генерализация
Мы уже видели, что как при реактивном, так и при оперантном научении приобретенная реакция сохраняется лишь до тех пор, пока ее поддерживают безусловным раздражителем (в первом случае) или специальным подкреплением (во втором случае). Если же эти подкрепляющие факторы перестают действовать, то выработанное на их основе поведение быстро угасает и после нескольких попыток прекращается вовсе. Например, если сразу после звонка не следует подача пищи, у собаки вскоре перестает в ответ на этот стимул выделяться слюна. Точно так же, если в семье новорожденного ребенка вдруг перестанут интересоваться звуками, которые он произносит, его словарный запас, скорее всего, не будет развиваться быстро и адекватным образом. Все это проявления процесса угасания.
Важно отметить, что речь здесь идет именно об угасании, а не об исчезновении или «стирании следов». Дело в том, что если снова начать предъявлять безусловный раздражитель или подкрепляющий фактор, то исчезнувшее было поведение почти сразу же восстанавливается.
С угасанием тесно связана так называемая дифференцировка. При дифференцировке те поведенческие реакции, которые перестают сопровождаться безусловным раздражителем или подкреплением, исчезают, и сохраняются лишь такие реакции, при которых эти факторы продолжают действовать. Например, если внезапно прекратить подачу пищи после звука колокольчика, но продолжать давать ее в сочетании со звуком зуммера, то слюноотделение на первый из этих звуковых раздражителей прекратится, а на второй сохранится. Точно так же и наш младенец в приведенном выше примере постепенно перестанет издавать неподкрепляемые звуки, и будет повторять лишь те, за которыми следует социальное поощрение.
Важнейшую роль в научении путем выработки условных связей играет процесс генерализации [54]. Именно благодаря этому явлению вновь образованная связь распространяется на все то, что похоже на безусловный раздражитель или на ситуацию, в которой происходило подкрепление. Например, в опытах Уотсона и Рейнер у маленького Альберта (см. документ 7.1) быстро выработался страх перед всеми белыми пушистыми предметами — от бороды деда Мороза до мехового воротника на пальто матери. Все мы знаем, как быстро наступает генерализация у плаксивых детей — сначала они хнычут, требуя конфету, а потом — уже всегда, как только им чего-нибудь захочется, будь то игрушка в магазине или телевизионная передача, идущая по параллельному каналу одновременно с любимой передачей родителей (табл. 7.1).
Таблица 7.1. Сравнение реактивного и оперантного обусловливания
Бихевиористы предложили множество различных сфер применения методов обусловливания в различных областях человеческой деятельности. Чаще всего реактивное и оперантное научение используется в психотерапии, когда врач пытается применить соответствующие принципы для помощи определенным больным. Подобные примеры приведены в документах 3.1 и 3.2. Подробнее мы рассмотрим этот вопрос в главе 12.
В области образования Скиннер выдвинул, в частности, концепцию программированного обучения. По его мысли такое обучение может освободить ученика и преподавателя от скучного процесса простой передачи знаний: учащийся будет постепенно продвигаться в освоении той или иной темы в собственном ритме и маленькими шажками, каждый из которых подкрепляется [55]; из этих шажков и состоит процесс последовательного приближения (Skinner, 1969). Однако очень скоро обнаружилось, что такое обучение быстро достигает своего «потолка», и это связано именно с тем, что от учащегося требуются лишь минимальные усилия и поэтому подкрепление вскоре становится неэффективным. В результате учащемуся такое обучение быстро надоедает. Кроме того, для постоянного поддержания мотивации у учащегося и упорядоченной передачи знаний, видимо, необходим личный контакт с учителем. Все это, вероятно, можно объяснить с помощью принципов, лежащих в основе социального научения, и в частности научения путем наблюдения. Но еще ближе к истине, наверное, те ученые, которые стоят на позициях когнитивного научения. К этому вопросу мы вернёмся в последующих разделах.
Научение путем наблюдения (подражания модели)
Итак, многие виды поведения, иногда довольно сложные, могут быть объяснены в свете принципов оперантного обусловливания и метода формирования реакций. Вместе с тем множество форм социальной активности индивидуума основано на наблюдении над другими особями из его ближайшего окружения, которые служат моделью для подражания. При этом может иметь место как чистое подражание, так и викарное научение.
Подражание — это способ научения, при котором организм воспроизводит действия модели, не всегда понимая их значение. Оно свойственно в основном приматам. Японские этологи наблюдали над стадами обезьян в их естественной среде. Когда ученые смогли подходить близко к самым молодым животным, они стали в их присутствии мыть в воде бататы перед едой. Исследователи быстро убедились в том, что молодые обезьянки начали подражать такому поведению, а через некоторое время оно появилось и у их матерей. Вскоре этот навык усвоили все особи стада, за исключением самых старых, которые были к этому совершенно неспособны. Речь в данном случае идет именно о чистом подражании, так как животные не могут оценить то значение, которое подобный навык имеет для человека.
Что касается викарного научения, то здесь индивидуум полностью усваивает ту или иную форму поведения другой особи, включая понимание последствий этого поведения для модели. Бандура и его коллеги (рис. 7.7) в лабораторных экспериментах показали, что такое научение зависит от многих факторов. Например, люди подражают главным образом каким-то знаменитостям или тем, перед кем они преклоняются. В то же время усвоение поведения модели облегчается, если предмет подражания «доступен» — как с точки зрения возможности контактирования с ним, так и в отношении степени сложности его поведения. Кроме того, если модель за свой поступок (даже агрессивный) получила поощрение, то ей подражают охотнее, чем в том случае, если она была наказана. Известно также, что живым моделям всегда подражают чаще, чем героям фильмов, в том числе мультипликационных (рис. 7.8).
Рис. 7.7. Альберт Бандура, американский психолог, один из наиболее известных современных бихевиористов. В своих исследованиях он пытается проверить теорию «научения путем наблюдения», которую называют также теорией социального научения.
Рис. 7.8. Научение путем наблюдения. Понаблюдав за моделью-человеком, «избивающим» резиновую куклу (вверху), маленький мальчик (в середине) или девочка (внизу) в соответствующей ситуации воспроизводят это поведение.
Здесь уместно напомнить, что сторонники теории социального обучения все же признают большую роль телевидения и героев телефильмов в развитии агрессивных наклонностей у молодежи (см. досье 6.1).
Поскольку субъект в данном случае наблюдает за поведением модели и оценивает последствия, к которым оно приводит для самой модели, здесь должны участвовать когнитивные процессы, так что этот вид научения можно было бы отнести к следующей, третьей группе. Однако он встречается лишь в особых ситуациях, и его часто только с большим трудом можно обнаружить в нашей повседневной жизни. В самом деле, имеется мало свидетельств в пользу того, что подражание, наблюдаемое в искусственных лабораторных условиях или в каких-то специфических жизненных ситуациях, будет повторяться во всех случаях при сходных обстоятельствах.
Как отмечал сам Бандура (Bandura, 1977), модель «учит» какому-то поведению, однако использование результатов такого обучения в большой мере зависит от уровня эмоциональной активации субъекта в данный момент и от ее оценки ситуации. Иными словами, при викарном научении в мозгу создаются какие-то связи, но только когнитивные процессы — процессы анализа конкретных обстоятельств — будут в дальнейшем определять, станет ли человек в том или ином случае прибегать к этим связям. Поэтому мы и отнесли такое научение к выработке оперантных форм поведения: при викарном научении просто воспроизводится то или иное поведение в зависимости от его последствий, но не происходит, как при истинно когнитивных формах научения, переработки информации с целью формирования новой поведенческой программы.
Когнитивные формы научения
Исходя из принципов научения путем формирования реакций или путем наблюдения, легко можно объяснить усвоение каких-то эмоциональных или социальных поведенческих реакций или выработку навыков. Если, однако, мы хотим понять, как человек учится, например, печатать на машинке или играть на музыкальном инструменте (гитаре, кларнете и т. п.), наша задача становится более трудной. Еще сложнее объяснить, как человек может научиться ездить по столичному городу, и уже совсем невозможно понять на основе упомянутых принципов, каким образом мы описываем структуру окружающей среды с помощью понятий или научаемся мыслить и выражать наши мысли словами.
В этом разделе мы попытаемся с позиций когнитивного подхода описать и даже понять, как формируются различные виды поведения на основе выработки «когнитивных карт» (при латентном научении), «когнитивных стратегий» (главным образом при выработке двигательных навыков) и, наконец, на основе интуиции и мышления.
Латентное научение
Из главы 5 мы уже знаем, что в организм все время поступает поток сигналов от окружающей среды, на которые он должен реагировать. Некоторые из этих сигналов ясно осознаются, другие воспринимаются менее четко, а третьи, вероятно, вообще не доходят до сознания, хотя и сохраняются в памяти на уровне низших нервных центров.
Согласно представлениям Толмена (Tolman, 1948) (рис. 7.9) — одного из пионеров когнитивного подхода в теории научения — все эти сигналы обрабатываются и преобразуются мозгом. При этом в мозгу создаются своего рода карты окружающей среды, или когнитивные карты, с помощью которых организм определяет, какие реакции будут наиболее адекватными в какой-либо новой ситуации или при внезапном изменении привычных обстоятельств.
Рис. 7.9. Эдуард Толмен, американский психолог (1886–1961). Он был представителем бихевиоризма и обогатил его представлением о «промежуточных переменных» в цепи стимул — реакция. Согласно Толмену, существуют внутримозговые процессы, детерминированные генетически или приобретенные в результате предшествующего опыта, которые могут изменять реакцию на тот или иной стимул. К промежуточным переменным относятся и так называемые когнитивные карты.
Толмен пришел к этому выводу, когда установил, что обучение крыс в лабиринте не происходит чисто механически, как считали в те времена бихевиористы (Hull, 1943). Если бы речь шла о простом механическом усвоении, то в случае перекрытия обычного пути в лабиринте или изменения каких-то условий крысе пришлось бы отыскивать новый маршрут, ведущий к цели. Толмен же, напротив, обнаружил, что если крыса уже научилась находить пищу по кратчайшему пути, то после закрытия этого пути она спонтанно меняет свой маршрут и без какого бы то ни было нового научения и новых ошибок находит пищу, но идет теперь по другому, более длинному пути. В других экспериментах он показал, что если залить коридоры лабиринта водой, то крыса все равно находит правильный путь, но уже вплавь. При этом, разумеется, используются уже совершенно иные двигательные реакции.
Таким образом, по мнению Толмена, животные усваивают не связь между стимулом и реакцией, а значение стимула как своего рода «дорожного указателя». По формулировке Толмена, они узнают, «что к чему ведёт». При обучении в лабиринте в единое целое интегрируются запахи, особенности того или иного угла или стенки и связи между различными элементами. Животное как бы располагает эти элементы в пространстве, преобразуя совокупность относительно разнородных стимулов в единое структурированное целое.
В случае когда речь идет о сложных формах научения, подкрепление становится необходимым не столько в самом процессе усвоения новой информации, сколько при ее использовании. Это в особенности касается выработки сложных психомоторных навыков.
Обучение сложным психомоторным навыкам
Всякий, кто пытался научиться играть на музыкальном инструменте, например на фортепиано или гитаре, знает, какими вдохновляющими бывают первые успехи в управлении пальцами и в их правильном расположении на инструменте (достигаются ли они путем формирования реакции или путем наблюдения). К сожалению, картина становится совершенно иной, когда начинается настоящее обучение. Большинство тех, кто бросает занятия, оставляют их именно на этой критической стадии, где должны сформироваться когнитивные стратегии, направленные на выработку строгих последовательностей движений и на их программирование в зависимости от желаемого результата (Fitts, Rosner, 1967). Это когнитивная стадия, на которой все внимание учащегося сосредоточивается на расшифровке нотного текста, аппликатуре, ритме и мелодическом рисунке.
По мере того как налаживаются связи между всеми этими элементами навыков, стратегия постепенно меняется. Забота о том, какие элементы и в какой последовательности должны быть соединены, становится все меньше, а вместе с ней постепенно снижается и сопутствующая познавательная активность. Это ассоциативная стадия, для которой характерно постоянное улучшение координации и интеграции различных элементов навыка (рис. 7.10).
Рис. 7.10. Овладение навыком игры на музыкальном инструменте, как и любым другим навыком, требует создания «когнитивных стратегий», необходимых для координации и интеграции отдельных элементов навыка.
Если обучающийся проявляет должное упорство, то он достигает следующей, автономной, стадии, соответствующей высокому уровню умения. Навык при этом становится автоматическим, ошибки — все более редкими, а сосредоточенность на технической стороне — все меньшей, и главное место теперь занимает союз ума и чувства. При этом рука (или рот) и музыкальный инструмент сливаются в единое целое и образуют ту основу, на которой только и возможны фантазия, вдохновение и творческий полет.
Все сказанное относится, конечно, и к таким навыкам, как катание на лыжах, плавание, езда на велосипеде или работа на пишущей машинке. Из главы 2 мы знаем, что в начале нашего века функционалисты уже описали такого рода научение, пытаясь вскрыть ту роль, которую в нем играет «сознание». Затем, однако, волна бихевиоризма, прокатившаяся по психологическим наукам, смела все менталистские концепции, и они были надолго забыты, пока снова не возродились в когнитивистской психологии.
Научение путем инсайта
Этот вид научения занимает промежуточное положение между латентным научением и творчеством (к последнему мы вернёмся в главе 9). С латентным научением оно сходно в том, что при инсайте определенная информация, разбросанная в памяти, как бы объединяется и используется в новой ситуации. С творчеством инсайт сходен в том отношении, что задача, возникшая в такой ситуации, решается оригинально и решение приходит спонтанно.
Научение путем инсайта было открыто Кёлером (K?hler, 1925) в результате наблюдений над обезьянами (см. гл. 1 и рис. 1.11), проведенных в 1917 году. В те времена школа Кёлера, или гештальтпсихология, вела непримиримую борьбу с бихевиористскими концепциями.
Согласно взглядам Кёлера, у высших животных научение в большинстве случаев обусловлено не созданием механических ассоциаций между какими-либо стимулами или стимулом и реакцией, а скорее объединением опыта, накопленного в памяти, с той информацией, которой располагает индивидуум при решении проблемы.
Одна из обезьян Кёлера (рис. 7.11) в эксперименте с недосягаемым для нее бананом сначала пыталась достать плод одной палкой, потом другой, но палки были слишком коротки. Тогда ока прекратила свои попытки, стала разглядывать находившиеся около нее предметы и вдруг быстро проделала логичную последовательность действий: схватила обе палки, вставила их одну в другую, просунула между прутьев клетки и достала банан.
Рис. 7.11. Султан — одна из обезьян Кёлера (1917) — интуитивно находит способ, позволяющий достать далеко расположенный банан с помощью вставленных друг в друга палок.
В англоязычной литературе такое внутреннее связывание элементов, из которых складывается решение, получило название инсайт (insight — проникновение внутрь, постижение). На французский язык этот термин переводят иногда как intuition (интуиция).
Уже сами по себе эти слова в какой-то мере отражают то, что решение проблемы приходит внезапно, без каких-либо проб и ошибок, формирования реакций или логических рассуждений. Инсайт — это озарение, это вспышка, осветившая сознание Архимеда, когда он, выскочив из ванны, внезапно закричал «Эврика!»…
В отличие от чистого творчества инсайт возможен только в том случае, если субъект уже решал какие-то задачи с помощью сходных элементов или встречался ранее с аналогичными ситуациями (см. гл. 9).
Научение путем рассуждений
Рассуждение — это мыслительный процесс, к которому мы будем возвращаться в последующих главах. Рассуждение используют в тех случаях, когда какая-либо задача не может быть решена привычным способом или для нее нет приемлемого типового решения, которое можно применить «с ходу».
К рассуждению мы прибегаем в большинстве наших жизненных ситуаций. Оно необходимо, когда мы решаем, например, будем ли мы обедать дома или в столовой в зависимости от имеющихся денег и времени; стоит ли нам занимать крупную сумму денег; что делать, если в три часа утра в ненаселенной местности у нас сломалась машина; как лучше ставить опыты в научной лаборатории (см. гл. 3); или, наконец, как найти решение задачи по математике, на которую учитель дал всего полчаса.
Когда использовать примитивный метод проб и ошибок рискованно или же он не дал желаемых результатов, а искра инсайта никак не вспыхивает, приходится решать задачу путем рассуждения. Как правило, такое решение осуществляется в два этапа:
1) сначала рассматриваются имеющиеся данные и между ними устанавливаются связи;
2) затем строятся гипотезы: «Что если я сделаю то-то?» или «Я мог бы начать с этого, а затем…». Эти гипотезы более или менее систематично проверяются «в уме». В следующей главе мы рассмотрим различные способы такого рода перебора вариантов. Гипотезы, которые строит индивидуум, чаще всего бывают связаны с его уже имеющимся опытом. Чем этот опыт богаче, тем разнообразнее гипотезы и тем больше шансов найти среди них верную.
Как и при любых других формах научения, результаты, полученные путем рассуждения, как правило, используются в дальнейшем во всех сходных жизненных ситуациях. Однако они могут пригодиться и в тех случаях, если ситуация или составные элементы проблемы несколько видоизменились. Кроме того, результаты рассуждений могут также послужить основой для построения новых гипотез.
Из всех форм научения путем рассуждений мы выделим две, служащие фундаментом для мышления: перцептивное научение и концептуальное научение.
Перцептивное научение
В главе 5 подробно говорилось о том, как и с помощью каких механизмов мы воспринимаем окружающий мир. При этом восприятие (перцепция) рассматривалось главным образом как средство для осознания реальности и особенно как фактор, способствующий активации организма.
Тем не менее совершенно ясно, что становление восприятия — это не что иное, как самое настоящее научение. Хебб (Hebb, 1974) определил перцептивное научение как «долговременное изменение восприятия какого-либо объекта или события в результате предшествующих восприятий этого же объекта или связанных с ним вещей». Восприятие у новорожденного ребенка или детеныша определяется такими примитивными формами научения, как сенсибилизация или классическое обусловливание; по-видимому, именно так грудной ребенок научается узнавать лицо матери. Однако по мере накопления опыта и новой информации ребенок, по мнению Грегори (см. гл. 5), постепенно начинает выдвигать гипотезы на основании того, что он уже знает; при этом он пытается определить, какая из этих гипотез позволяет с наибольшей достоверностью отнести воспринимаемое к той или иной категории. В этом смысле любая форма восприятия предполагает какого-то рода рассуждение, и поэтому мы можем рассматривать перцептивное научение как когнитивное.
Концептуальное научение
Формирование понятий — это процесс, при котором индивидуум, исходя из переработанных им восприятий, выделяет сходство между предметами, живыми существами, ситуациями или идеями и объединяет их в какие-то абстрактные категории.
Такие понятия, как «собака», «дерево», «несчастный случай» или «справедливость», — это категории, которые позволяют упорядочивать наш опыт и восприятие мира, объединяя множество явлений одной мыслью. Тем самым понятия дают нам возможность группировать получаемую нами информацию о качествах и родстве столь разных предметов или явлений, как, например, немецкая овчарка и чихуахуа, пальма и дуб, лобовое столкновение двух автомобилей и падение с лестницы, у которой сломалась ступенька, или честный раздел конфет между братьями и сестрами и приговор к пожизненному заключению за убийство. Как подчеркивает Мунн (Munn, 1966), здесь имеет место научение, в котором участвуют два процесса: абстрагирование и обобщение.
При абстрагировании мы находим черты общности или сходства между двумя явлениями или событиями и определяем эту общую черту одним словом — понятием.
При обобщении мы подводим под это понятие все новые предметы или события, имеющие черты сходства или какое-то общее свойство с предметами и явлениями, послужившее для выработки данного понятия.
Механизмы, лежащие в основе этих проявлений мысли, будут более подробно рассмотрены в следующей главе, где мы перейдем к изучению мышления.
Научение и созревание
Уже около полувека назад было установлено, что никакое научение не может быть эффективным, если организм не достиг определенного уровня развития — как в плане формирования опорно-двигательного аппарата, так и в отношении организации нервных структур и сенсомоторных связей.
Такое развитие происходит в процессе созревания, запрограммированного у каждого представителя данного вида в генах. Все особи каждого вида, пройдя ряд сходных последовательных этапов, достигают стадии зрелости, причем эта стадия различна для каждого отдельного органа или отдельной функции организма.
Читайте также
Корректирующее научение
Корректирующее научение
До недавнего времени, все усилия, направленные на подавление защитного поведения, основывались в основном на интервью как способе модификации поведения. Постепенно, по результатам подобных собеседований, стало очевидно, что разговор не является
Дефективное обусловленное научение
Дефективное обусловленное научение
Компетентное функционирование требует избирательной чувствительности, нередко зависящей от самых малейших вариаций в обстоятельствах. Некоторые расстройства поведения исходно отражают неадекватное обусловленное научение по
7. Научение и его виды
7. Научение и его виды
Научение наполняет всю нашу жизнь. Люди соприкасаются с научением в общении друг с другом, в процессе эмоционального развития и социального роста. Человек научается любить или ненавидеть, вести себя правильно или неправильно и т. п. Научение в самом
Память и научение
Память и научение
(1) Научение как процесс заключается в преобразовании через опыт поведения организма таким образом, чтобы оно прямо или косвенно служило поддержанию его фундаментальной кругообразности. Так как организация живой системы в общем и нервной системы в
Глава VII НАУЧЕНИЕ
Глава VII НАУЧЕНИЕ
Детские концепции смерти обычно отражают представления общества, в котором они воспитываются. Дети усваивают много больше того, чему их учат намеренно. Но в этой главе меня интересует главным образом целенаправленное преподавание, и особенно
Научение через моделирование
Научение через моделирование
Научение было бы довольно утомительным, если не сказать неэффективным и потенциально опасным, если бы зависело исключительно от результата наших собственных действий. Предположим, автомобилист должен был бы полагаться только на
Научение и удовлетворение
Научение и удовлетворение
Первый результат исследования последствий удовлетворения потребностей — растущая неудовлетворенность чрезмерно значимой ролью, приписываемой ассоциативному научению его сторонниками.В общем, феномены удовлетворения (например, потеря
Научение
Научение
Как люди научаются быть мудрыми, зрелыми, добрыми, как они приобретают хороший вкус, характер, изобретательность, умение приспособиться к новой ситуации, находить истину, распознавать добро, отличать прекрасное, гениальное, иначе говоря, как происходит
Научение
Научение
Привычка представляет собой попытку разрешить возникшую проблему, используя предшествующий опыт успешного разрешения проблем. Это подразумевает 1) отнесение возникшей проблемы к определенной категории проблем, 2) выбор наиболее эффективного решения для
Глава 13 ПСИХИЧЕСКАЯ ТРАВМА И ПОВТОРНОЕ ЭМОЦИОНАЛЬНОЕ НАУЧЕНИЕ
Глава 13 ПСИХИЧЕСКАЯ ТРАВМА И ПОВТОРНОЕ ЭМОЦИОНАЛЬНОЕ НАУЧЕНИЕ
Сом Чит, камбоджийская беженка, отказала троим своим сыновьям в просьбе купить им игрушечные пулеметы АК-47. Ее сыновьям шести, десяти и одиннадцати лет от роду нужно было игрушечное оружие, чтобы играть в игру,
ГЛАВА 3. НАУЧЕНИЕ И ОБУСЛОВЛИВАНИЕ
ГЛАВА 3. НАУЧЕНИЕ И ОБУСЛОВЛИВАНИЕ
В той области психологии, которая занимается научением и обусловливанием, проведено множество исследований с целью выяснить, как обучаются животные и люди. Ряд выдающихся психологов, имена которых широко известны за пределами наук о
НАУЧЕНИЕ ДЕПРЕССИИ
НАУЧЕНИЕ ДЕПРЕССИИ
Базовые материалы:Seligman М. Е. P., Maier S. Е (1967). Failure to escape traumatic shock. Journal of Experimental Psychology, 74,1–9.Если вы похожи на большинство людей, то предполагаете, что ваши действия влекут за собой определенные последствия. И поскольку вы ждете, что так оно и будет, вы
Детство — научение эмоциям
Детство — научение эмоциям
Мы учимся обижаться так же, как жестам, ходьбе и пользованию вилкой. Обида — орудие управления человеческими отношениями, которая действует автоматически.Обида и психосоматика: болезни гнева, опухоли, гипертоническая болезнь и женские
Социальное научение
Социальное научение
Научение у людей в большинстве случаев имеет место тогда, когда они находятся с другими людьми. И в большинстве случаев научение следует принципам инструментального и классического обусловливания. Согласно традиционным взглядам на обусловливание,
Оперантное научение в психологии
Сущность понятия «оперантное научение»
Определение 1
Оперантное научение – это вид научения, которое происходит на основе подкрепления реакций, относящихся к типу оперантов.
Данный вид научения описали американские ученые-психологи Б. Скиннер и Э. Торндайк. Они считали, что подкрепления результатов упражнений необходимо внести в схему научения.
Основу оперантного научения составляет схема «ситуация-реакция-подкрепление». В качестве первого звена Э. Торндайк в схему научения вводит проблемную ситуацию. Выход из этой ситуации сопровождался пробами и ошибками, которые могли привести к случайному успеху.
Закономерности решения проблемных ситуаций Торндайк первоначально изучал на животных, а позднее на маленьких детях. Анализируя сложное спонтанное поведение животных в поисках выхода, определить стимул на определенную реакцию было сложно. Постепенно у животных стали наблюдаться реакции, ведущие к цели. Торндайк вывел формулу для всех типов поведения, как животных, так и человека – «пробы, ошибки и случайный успех» и высказал предположение, что данный процесс определяют три закона поведения:
- готовность, определяемая навыком в организме нужного состояния, которое будет толкать к активности, например, чувство голода;
- упражнения (повторение) – часто совершаемое действие чаще выбирается в последствии;
- эффект (подкрепление) дает чаще повторяемое действие.
Что касается проблем школьного обучения, то Торндайк определяет их как искусство создавать и задерживать стимулы. Это необходимо для того, чтобы предотвратить или, наоборот, вызвать какие-либо реакции.
Замечание 1
Стимулами для ребенка могут быть слово, фраза, взгляд, обращенные к нему, а ответной реакцией будет состояние ученика, его действия, мысли и чувства.
Активность организма при оперантном научении очень большая и контролируется результатами. В общем, получается, что если действия привели к положительному и позитивному результату и успех достигнут, то эти действия будут закрепляться и повторяться.
На основании собственного опыта, ребенок имеет разнообразные интересы, и задача учителя заключается в том, чтобы среди них увидеть «хорошие» для дальнейшего их развития. Для того чтобы направить интересы ребенка в нужное русло учителю необходимо связать выполняемую работу с чем-то важным для ребенка, например, с его статусом в классе.
Также можно использовать механизм подражания, когда учитель, влюбленный в свой предмет передает эту любовь своим ученикам, заинтересовывает их своим предметом.
Ещё один путь учителя к ученику – это сообщать ему такую информацию, которая вызовет интерес к предмету.
Если говорить в целом, то опыты Торндайка с лабиринтом являются упрощенной моделью окружающей среды. В какой-то мере лабиринтная методика действительно моделирует отношения организма и среды, но односторонне и очень ограниченно, поэтому переносить открытые закономерности на социальное поведение человека довольно трудно.
Оперантное научение Б.Ф. Скиннера
В психологии существует много интересных теорий и методик. Такие методики, как оперантное научение оказывают помощь семье, оказывают влияние на успеваемость детей, повышают самооценку и др.
Замечание 2
Суть оперантного научения заключается в установке ассоциативной связи между поведением и следствием этого поведения.
Научение – это своеобразный метод обучения, требующий конкретного действия. Часто оперантное научение называют методом Скиннера, который был убежден, что любое поведение мыслями или мотивацией объяснить невозможно.
Скиннер использовал термин оперантный для описания любого поведения, говоря другими словами, Скиннер объяснил на примере научения, как люди приобретают привычки и модель поведения в повседневной жизни.
Рисунок 1. Оперантное научение. Автор24 — интернет-биржа студенческих работ
Теория оперантного научения Скиннера включает следующие положения:
- На основе реакций вырабатываются классические условные рефлексы, а на основе оперантов вырабатываются инструментальные рефлексы. Условный рефлекс вырабатывается в результате образования ассоциации между безусловным и нейтральным раздражителями. Инструментальный рефлекс образуется между определенным поведением и его последствиями;
- Только при наличии подкрепления возможно любое научение. Скиннер, исходя из закона эффекта Торндайка, определил подкрепление, убрав из него субъективное понятие, связанное с состоянием удовлетворения. Любое событие, сочетающееся с каким-либо видом поведения, Скиннер понимает как подкрепление.
Например, для голодного животного в его ящике подача пищи будет подкреплением;
- Любое поведение можно создать подкреплением – на основании этого положения ученый разработал способ формирования поведения через последовательные приближения. Суть его заключается в том, что путь от исходного поведения до конечной реакции, разбивается на несколько этапов. Каждый из этапов необходимо систематически подкреплять, приближаясь к нужной форме поведения;
- Поведение человека и животного зависит от внешней среды и системы внешних подкрепляющих факторов. Человек только думает, что свободен в выборе поведения и что сам решает свою судьбу, но, на самом деле он похож на животное, помещенное в ящик Скиннера. В повседневной жизни можно увидеть множество примеров оперантного научения с перспективой награды и использование этого научения с целью отучить человека от нежелательной привычки наказанием или лишением желаемого.
Выделяется два вида подпитки:
- позитивное подкрепление используется для поощрения нужной модели поведения;
- негативное подкрепление – это действия, не несущие в себе удовольствие.
Наказание используется при необходимости прекратить нежелательную модель поведения. Выделяется два вида наказаний – позитивное и негативное.
Примеры и формы оперантного научения
Примерами оперантного научения являются катание на доске, игра на музыкальном инструменте, метание дротиков – это образцы оперантной реакции. Эти реакции самостоятельно приобретены, поэтому для них стимул, который можно было бы распознать, существовать не может.
Рассуждать о возникновении оперантного метода поведения бессмысленно, и Скиннер этого не отрицал.
Стимулы или внутренне причины, ответственные за их появление не могут быть известны, а это значит, что возникают они спонтанно.
В случае благоприятного отражения последствий на организме, вероятность их повторения будет сильнее, это значит, что последствия подпитываются, благодаря которому происходит оперантное обусловливание.
Величина стимула позитивного подкрепления воздействует на последующую частоту реакции соответственно.
Теория, таким образом, действует и в обратном направлении – если реакция неблагоприятная и отсутствует подкрепление, то значительно уменьшается вероятность получения операнта.
Являясь следствием, оперантное обусловливание, считал Скиннер, может контролироваться неприятными последствиями. Агрессивное или негативное последствие может ослабить поведение, и оно же усиливает поведение, которое их устраняет.
Научение можно рассматривать как форму обучения.
Встречается оперантный метод поведения в каждой семье и с самого раннего детства – это плач. Когда маленький ребенок плачет, возникает моментальная реакция родителей, что является выражением внимания и других подкреплений.
Подкрепляющим фактором для плачущего ребенка будет внимание родителей. Однако учитывать надо и то, что плач может быть не всегда следствием боли, а просто желанием внимания.
Интересным примером являются дрессировки животных в цирке, когда их побуждают совершать какие-либо действия и затем угощают небольшим кусочком пищи, чаще всего кусочком сахара.
Когда животное освоило действие, его побуждают совершить новое и, если это новое действие животное не осваивает, то остается без лакомства.
Поэтому каждая новая попытка будет продолжаться до достижения цели. Поведение, при необходимом порядке подпитки, поддается контролю и управлению.
Замечание 3
Проведя многочисленные эксперименты, Скиннер утверждал, что научения одинаково закономерны и для людей, и для животных.
§ 3. Оперантное научение
Экспериментальное исследование
условий приобретения действительно
нового поведения, а также динамики
научения находилось в центре внимания
американского психолога Э. Торндайка.
В работах Торндайка изучались
преимущественно закономерности решения
проблемных ситуаций животными. Животное
(кошка, собака, обезьяна) должно было
самостоятельно найти выход из специально
сконструированного «проблемного ящика»
или из лабиринта. Позже в качестве
испытуемых в аналогичных опытах
участвовали и маленькие дети.
При анализе
такого сложного спонтанного поведения,
каким представляется поиск способа
решения лабиринтной задачи или отпирания
дверцы (в отличие от ответного,
респондентного), трудно выделить стимул,
вызывающий определенную реакцию. По
данным Торндайка, первоначально животные
совершали множество хаотичных движений
— проб и лишь случайно производили
нужные, которые приводили к успеху. При
последующих попытках выйти из этого же
ящика наблюдалось уменьшение числа
ошибок, и сокращение количества
затраченного времени. Тип научения,
когда испытуемый, как правило, неосознанно
пробует разные варианты поведения,
операнты (от англ. operate — действовать),
из которых «отбирается» наиболее
подходящий, наиболее адаптивный, получил
название оперантного обусловливания.
Метод «проб и ошибок» в решении
интеллектуальных задач стал рассматриваться
как общая закономерность, характеризующая
поведение и животных, и человека. Торндайк
сформулировал четыре основных закона
научения.
1. Закон повторения (упражнения). Чем
чаще повторяется связь между стимулом
и реакцией, тем быстрее она закрепляется
и тем она прочнее.
2. Закон эффекта (подкрепления). При
выучивании реакций закрепляются те из
них, которые сопровождаются подкреплением
(положительным или отрицательным).
3. Закон готовности. Состояние субъекта
(испытываемые им чувства голода, жажды)
небезразлично для выработки новых
реакций.
4. Закон ассоциативного сдвига (смежности
во времени). Нейтральный стимул, связанный
по ассоциации со значимым, тоже начинает
вызывать нужное поведение. Торндайком
были выделены также дополнительные
условия успешности научения ребенка —
легкость различения стимула и реакции
и осознание связи между ними. Оперантное
научение происходит при большей
активности организма, оно контролируется
(определяется) его результатами,
последствиями. Общая тенденция такова,
что если действия привели к позитивному
результату, к успеху, то они будут
закреплены и повторены.
Лабиринт в
опытах Торндайка служил упрощенной
моделью окружающей среды. Лабиринтная
методика действительно в какой-то мере
моделирует отношения организма и среды,
но очень узко, односторонне, ограниченно;
и переносить закономерности, открытые
в рамках этой модели, на социальное
поведение человека в сложно организованном
обществе чрезвычайно трудно.
Виднейший теоретик строгого бихевиоризма
Б.Ф. Скиннер (1904—1990) настаивал на том,
что научными методами можно познать
все поведение человека, поскольку оно
детерминировано объективно (окружающей
средой). Скиннер отвергал понятия скрытых
психических процессов, таких, как мотивы,
цели, чувства, бессознательные тенденции
и пр. Он утверждал, что поведение человека
почти всецело формируется его внешним
окружением. Такую позицию называют
иногда инвайронментализмом (от англ.
environment — среда, окружение). «Черный ящик
человеческой психики» должен быть, по
мнению Скиннера, исключен из эмпирического
исследования, усилия должны быть
направлены на изучение открытого,
доступного непосредственному наблюдению,
поведения человека, на установление
тех факторов среды, которые, в конечном
счете, определяют и контролируют действия
человека.
Скиннер считал, что
экспериментальный анализ поведения
животных (крыс, голубей) позволит открыть
принципы поведения, общие для животных
и человека. С опорой на всеобщие
закономерности поведения важнейшая
практическая психолого-педагогическая
задача обучения и воспитания становится
решаемой. Манипулируя переменными
окружающей среды (т.е. независимыми
переменными), можно прогнозировать и
контролировать поведенческие реакции
индивида (зависимые переменные). Скиннер
признавал существование двух основных
типов поведения: респондентного и
оперантного. Однако он полагал, что
главное — оперантное поведение, т.е.
спонтанные действия, для которых не
существует первоначального стимула,
поддающегося распознаванию. Для животных
и человека важны последствия — события,
наступающие в результате поведения. В
зависимости от последствий складывается
определенная тенденция в отношении
такого поведения в будущем. Оперантные
реакции постепенно приобретают характер
произвольных. По оперантному типу
научения происходит формирование
множества форм человеческого поведения
(умение одеваться, привычка читать
книги, сдерживать проявления агрессии,
преодолевать застенчивость и т.
п.).
Реакция, за которой следует позитивный
результат, стремится повториться. Так,
в большинстве семей можно наблюдать
оперантное научение плачу. Крик и плач
как безусловные реакции ребенка на
физический дискомфорт вызывают у
родителей стремление подойти к ребенку,
успокоить его, оказать помощь и внимание.
Такая забота оказывается мощным
позитивным подкреплением для плача
ребенка; и плач становится оперантно
обусловленным средством контроля за
поведением родителей. В то же время
вероятность повторения реакции, за
которой следует негативный результат
или наказание, уменьшается. Если знакомый
в ответ на приветствие поджимает губы
и делает вид, что нас не замечает, мы
скоро перестанем здороваться с ним.
Подкрепление — ключевое понятие
концепции Скиннера. Подкрепление
усиливает реакцию, увеличивает вероятность
ее появления. В бихевиоральном научении
признавали два типа подкрепления:
первичное (или безусловное — вода, еда,
секс) и вторичное (или условное — деньги,
внимание со стороны значимого другого,
одобрение родителей, сверстников,
учителей). По Скиннеру, вторичные
подкрепляющие стимулы становятся
подкреплением в результате прошлого
опыта, они общие для большинства людей
и оказывают сильное влияние на их
поведение. Скиннер выделял также
подкрепление позитивное и негативное.
Позитивное подкрепление усиливает
реакцию, сопровождая ее приятными
последствиями (пища, внимание). Негативное
подкрепление тоже усиливает поведенческую
реакцию, но за счет устранения раздражающих
стимулов (подросток начинает употреблять
ругательные слова и выражения, стремясь
избежать насмешек приятелей типа
«маменькин сынок, малыш»).
Поведение может контролироваться
также с помощью наказания (мать подростка
может ударить его по губам за ругательства
или лишить карманных денег). Такое
последствие призвано прекратить, изжить
поведенческую реакцию. Техника наказания
в современном обществе применяется
чаще всего, но Скиннер стремился доказать,
что подобный контроль поведения
неэффективен (лишь временно откладывает
нежелательное поведение) и, что еще
хуже, вызывает негативные побочные
эффекты (страх, тревогу, падение
самооценки, грубые формы асоциального
поведения). Он настаивал на том, что
позитивное подкрепление (поощрение
желательных образцов) гораздо более
надежный метод формирования поведения
и у детей, и у взрослых. В случае научения
сложному поведению (такому, как навыки
письма или межличностного общения или
выработка аккуратности) используется
метод последовательного приближения,
или формирования. Шаг за шагом, ступенька
за ступенькой, подкрепление многократно
включается при изменении поведения в
направлении желаемого. Другой принцип
научения — незамедлительность
подкрепления. При обучении самостоятельной
аккуратной еде ребенка последовательно
подкрепляют: хвалят за попытку взять
ложку в руку, направить ее в рот,
восхищаются его усилиями, подбадривают
малыша, хотя на первых порах он и теряет
по дороге почти все содержимое. И только
в результате постепенного приближения
к нужному результату добиваются от
ребенка аккуратности и чистоты одежды
и стола.
Скиннер утверждал, что даже вербальное
поведение, или устная речь, приобретается
через процесс успешного последовательного
приближения. Однако многие психологи
совершенно не согласны с тем, что язык
может быть усвоен таким способом,
подчеркивая тем самым столь высокую
скорость речевого развития в раннем
детстве, которую невозможно объяснить,
исходя из принципов оперантного
обусловливания. Проблема социализации
человека рассмотрена Скиннером в книгах
«По ту сторону свободы и достоинства»
(1971), «Размышления о бихевиоризме и
обществе» (1978). В концепции Скиннера
развитие ребенка — это обучение его
нормативному поведению в соответствии
с направлениями подкрепления. На ранних
этапах агентами социализации и источниками
подкрепления выступают родители, позже
число источников подкрепления расширяется
— это и соседи, и школа, и мнение
сверстников. Скиннер придерживался
мнения, что поведение человека в течение
жизни изменяется, и периодически
возникают кризисы. Кризисные явления
вызываются такими изменениями среды,
к которым индивид не имеет адекватного
набора поведенческих реакций. В
бихевиоризме не стоит проблема возрастной
периодизации развития, так как считается,
что среда формирует поведение ребенка
постоянно, непрерывно и постепенно.
Периодизация развития зависит от среды.
Не существует единых для всех детей
закономерностей развития в данный
возрастной период: какова среда, таковы
и закономерности развития данного
ребенка. Речь может идти только о создании
функциональной периодизации, которая
позволила бы наметить этапы научения,
формирования определенного навык (этапы
развития игры, обучения письму или игре
в теннис).
Постоянный опыт научения создает то,
что в других психологических школах
называют личностью. Личность — это тот
опыт, который человек приобрел в течение
жизни. Уникальность человека задается
своеобразным сочетанием генетических
характеристик и
индивидуальным репертуаром научения.
Психическое развитие, таким образом,
отождествляется с научением, т.е. с любым
приобретением знаний, умений, навыков
— и в условиях специального обучения,
и возникающих стихийно. Человек таков,
каким он научился быть.
Таблица 10
Теория оперантного научения — Теория оперантного научения и образование
Оглавление:
Важной отправной точкой для понимания теории Б. Ф. Скиннера является его классификация типов поведения. Классификация типов поведения Ф. Скиннера. Он провел различие между «ответным поведением» и «оперантным поведением». Поведение испытуемого вызывается известным стимулом. Примером реагирующего поведения являются все безусловные реакции, они возникают в результате безусловного стимула. Оперантное поведение не вызывается стимулом, оно просто вырабатывается организмом. Поскольку оперантное поведение не связано с известными стимулами, оно возникает спонтанно. Проявления оперантного поведения разнообразны; большинство наших повседневных действий могут быть квалифицированы как оперантное поведение.
Б. Скиннер не утверждал, что оперантное поведение возникает независимо от стимулов, наоборот. Проще говоря, стимул, вызывающий оперантное поведение, неизвестен, и его причина не обязательно известна. Ответное поведение полностью зависит от стимула, который ему предшествовал. В отличие от этого, оперантное поведение определяется его последствиями.
Помимо двух типов поведения, согласно Скиннеру, существует также два типа обусловливания: «отвечающее обусловливание» и «оперантное обусловливание». Реактивное обусловливание идентично павловскому классическому обусловливанию и было названо Скиннером обусловливанием пятого типа. Это подчеркивает важность стимула в вызывании желаемой реакции. Скиннер называет оперантное обусловливание и подчеркивает, что акцент в данном случае делается на ответной реакции.
В кондиционировании типа R сила кондиционирования оценивается по скорости реакции, в то время как в кондиционировании типа 5 сила кондиционирования часто определяется величиной обусловленной реакции. Легко заметить, что R-тип кондиционирования Скиннера очень похож на «инструментальное кондиционирование» Э. Торндайка, а его S-тип — на «классическое кондиционирование» Павлова. В центре внимания собственных исследований Скиннера было оперантное обусловливание, или «R»-тип обусловливания, как он его называл.
Б. Скиннер выделил два основных принципа оперантного обусловливания
- Любая реакция, которая следует за подкрепляющим стимулом, предрасположена к повторению.
- подкрепляющим стимулом может быть все, что увеличивает скорость возникновения оперантного ответа.
Все, что увеличивает вероятность повторения реакции, может быть подкрепляющим стимулом. Как вы можете легко видеть, принципы оперантного обусловливания можно применять в самых разных ситуациях. Чтобы изменить поведение, необходимо найти что-то, что служит подкреплением для организма. Затем нужно подождать, пока желаемое поведение проявится, и только после этого делать подкрепление.
В увлекательной книге «Не рычите на собаку» американского зоопсихолога и дрессировщика Карен Прайор, последовательницы Б.Ф. Скиннера, описано множество примеров использования оперантного обучения в дрессировке морских животных. Дельфины, участвовавшие в ее исследовании, не только научились выполнять команды человека, но даже успешно решали творческие задачи.
После этого частота желаемого отклика будет увеличиваться. Когда желаемое поведение проявляется снова, оно снова подкрепляется, и скорость реакции продолжает расти. Аналогичное влияние можно оказать на любое поведение организма.
Б. Ф. Скиннер рассматривал социокультурную среду как набор возможностей подкрепления. Из-за различий в социокультурной среде укрепляются разные модели поведения. Согласно Б.Ф. Скиннеру, то, что называется «личностью», — это не более чем последовательные модели поведения, которые являются результатом нашей истории подкрепления.
Теория оперантного научения и образование
Американский психолог Беррес Фредерик Скиннер продолжил развитие поведенческих концепций. Основываясь на теории И.П. Павлова о безусловных и условных рефлексах, исследователь предложил теорию оперантного обучения. Согласно этой концепции, организм приобретает новые реакции через подкрепление. В зависимости от того, является ли подкрепление положительным или отрицательным, поведенческое действие либо повторяется, либо формируется тенденция, либо его избегают, либо не придают ему значения. Скиннер предложил четыре типа подкрепления с различными формами ответа:
- с постоянным соотношением;
- постоянный интервал;
- с переменным коэффициентом;
- переменный интервал.
На основе концепции оперантного обучения Б. Ф. Скиннер предложил программу модификации поведения для психиатрических больниц, школ, социальных служб и исправительных учреждений. Программа модификации поведения была основана на использовании положительного подкрепления для контроля или изменения человека или группы.
По словам Б. Ф. Скиннера, на поведение всегда влияет подкрепление, даже если человек этого не осознает. Решающий вопрос заключается не в том, контролируется ли поведение, а в том, кто или что его контролирует. Благодаря подкреплению наше поведение контролируется многочисленными факторами окружающей среды. Например, родители или педагоги могут направлять развитие личности ребенка, намеренно подкрепляя определенные модели поведения, но они также могут вольно или невольно отдавать предпочтение подкреплению со стороны сверстников, телевидения или Интернета. Как бы просто это ни казалось на первый взгляд, очень трудно действительно использовать подкрепление, чтобы задать направление развития. Чтобы успешно решить эту задачу, Б.Ф. Скиннер и его последователи разработали ряд рекомендаций для родителей и педагогов.
Во-первых, они предлагают воспитателям (родителям или учителям) решить, какими личностными характеристиками они хотят наделить своего ребенка. Например, они предполагают, что ребенок должен вырасти творческой личностью.
Во-вторых, педагогов просят выразить свои цели в терминах поведенческих намерений. В нашем случае это предполагает поиск ответа на вопрос: «Что будет делать ребенок, когда создаст себя?»
В-третьих, необходимо вознаграждать поведение, соответствующее этим целям. Если воспитатели имеют представление о наиболее желательных формах поведения, они могут поощрять творческие действия, когда они происходят.
В-четвертых, воспитателей поощряют быть последовательными и формировать важные аспекты окружения ребенка, включая поощрение тех форм поведения, которые считаются наиболее ценными.
Применение этих простых правил, по мнению Б. Ф. Скиннера и его последователей, обязательно приведет к успеху. Напротив, если этим пренебречь, педагоги могут злоупотреблять механизмом оперантного обусловливания. В результате они могут достичь эффектов, прямо противоположных желаемым.
Как научить ребенка вас раздражать
Б. Ф. Скиннер в одной из своих работ приводит пример того, как поведение матери приводит к результатам, прямо противоположным желаемым. Поскольку мать озабочена, она часто не реагирует на просьбы или призывы ребенка, высказанные спокойно и тихо. Она начинает реагировать на ребенка только тогда, когда он повышает голос. Это переводит среднюю интенсивность вокального поведения ребенка на другой уровень. Со временем мать привыкает к этому уровню и снова усиливает еще более громкие звуки. Создается порочный круг, который только еще больше увеличивает громкость голоса. Б.Ф. Скиннер отметил, что мать вела себя так, как будто это ее работа — научить ребенка злиться.
Окружающая среда, по словам Б. Ф. Скиннера, постоянно подкрепляет каким-то образом поведение живых существ. Педагог либо позволяет принципам обучения непроизвольно влиять на поведение своих учеников, либо сам задает направление их развитию путем систематического применения этих принципов
Поведение, по мнению Б. Ф. Скиннера, сохраняет поведение, потому что оно подкрепляется. Это касается как нежелательного, так и желательного поведения. Чтобы избавиться от нежелательного поведения, мы должны определить источник его подкрепления и нейтрализовать его. Поведение, которое не сопровождается подкреплением, исчезает.
В увлекательной книге преемницы Б.Ф. Скиннера, американского зоопсихолога и дрессировщика Карен Прайор «Не рычите на собаку» описано множество примеров использования оперантного обучения в дрессировке морских животных. Дельфины, участвовавшие в ее исследовании, не только научились выполнять команды человека, но даже успешно решали творческие задачи.
После этого частота желаемого отклика будет увеличиваться. Когда желаемое поведение проявляется снова, оно снова подкрепляется, и скорость реакции продолжает расти. Аналогичное влияние можно оказать на любое поведение организма.
Б. Ф. Скиннер рассматривал социокультурную среду как набор возможностей подкрепления. Из-за различий в социокультурной среде укрепляются разные модели поведения. Согласно Б.Ф. Скиннеру, то, что называется «личностью», — это не более чем последовательные модели поведения, которые являются результатом нашей истории подкрепления.
Смешанное программирование. Ветвящееся программирование, как и линейное, подвергается критике. Возражение вызывает, прежде всего, способ представления ответов. Распознавание одного правильного ответа среди нескольких (нескольких десятков) неполных или неправильных ответов не только не приводит к положительным результатам обучения, но и фактически ослабляет их. Аргументы были следующими: заставляя студентов выбирать ответы, мы заставляем их запоминать и неправильные ответы.
Ленивые или даже амбициозные студенты могут пойти по пути наименьшего сопротивления и просто попытаться угадать ответы.
Практика неустойчивого обучения, принятая в разветвленной учебной программе, также вызвала критику. Это приводит к неспособности обучающегося работать систематически без сбоев. Постоянное обращение к подфрагментам не позволяет ему сосредоточиться на главной теме и не дает возможности отделить главную тему от подтем.
Сторонники смешанного программирования критиковали своих предшественников за попытку втиснуть такой сложный вид деятельности, как обучение, в узкие рамки «обучения через письмо», а сторонники разветвленного программирования — в рамки «обучения через угадывание». По их мнению, гораздо продуктивнее сочетать обе формы представления ответов, что позволит создать более рациональную программу, напоминающую реальный механизм человеческого обучения.
Программированное обучение
Линейное программирование. Как упоминалось ранее, Б.Ф. Скиннер был очень заинтересован в практическом применении теории оперантного обучения в образовании. Он знал, что принципы оперантного обучения обычно игнорируются и не применяются в традиционной педагогике. Чтобы изменить эту ситуацию, он предложил свою альтернативу традиционному обучению, которую назвал «программированное обучение».
Согласно теории Б. Ф. Скиннера, обучение эффективно при трех основных условиях:
- когда информация, необходимая для обучения, представляется постепенно;
- когда учащийся получает немедленную обратную связь об адекватности своего обучения;
- когда обучение происходит в темпе, приемлемом для учащегося.
На этой основе он разрабатывает собственные принципы программированного обучения. Среди наиболее значимых из них — Б. Ф. Скиннер:
- принцип маленьких шагов. Учебный материал должен быть разделен на минимально возможные части (шаги). С ними студентам легче справиться, чем с большими.
- принцип немедленного подтверждения ответа. После того, как ответ дан, студент должен немедленно проверить его. Только если у них все получилось, они могут переходить к следующему шагу.
- принцип индивидуализации темпа обучения.
Студент может добиться успеха в учебе только в том случае, если он работает в оптимальном для него темпе.
- принцип постепенного увеличения сложности. Уровень сложности программы должен повышаться постепенно, эго путем постепенного уменьшения ведущих инструкций.
- принцип дифференцированного углубления знаний. Каждое обобщение, встречающееся в тексте программы, должно быть повторено несколько раз в различных смысловых контекстах и проиллюстрировано достаточным количеством тщательно подобранных примеров.
- принцип равномерной прогрессии инструментального обучения. Учащийся подвергается воздействию упорядоченного набора стимулов, на которые он реагирует определенным образом. Его ответы немедленно оцениваются положительно или отрицательно путем сравнения его собственных ответов с эталонами, содержащимися в программе. Делая мало ошибок и отвечая правильно, он приобретает знания «маленькими шажками».
Этот вариант программированного обучения широко известен как «линейное программирование». Изложенные выше принципы составляют его теоретическую основу; что касается специфики разработки «содержательных рамок», форм организации и методов обучения при его применении, то это исключительно педагогические вопросы. Они подробно описаны в работах по дидактике, и мы не будем на них останавливаться.
Ветвящееся программирование. Другой вариант программированного обучения был предложен коллегами Б.Ф. Скиннера — С.Л. Пресси из Огайо и Н.А. Краудером из Чикаго. Эти психологи критиковали линейное программирование Б.Ф. Скиннера, поскольку оно не допускало ошибок при разработке обучающих текстов. Они настаивали на том, что нельзя исключать возможность ошибок, допускаемых учащимися в процессе обучения. Их можно использовать для оптимизации процесса обучения, придав им статус контроля качества и сделав их средством определения того, что ученик не понял.
Более того, авторы нового подхода выступили против идеи Б. Ф. Скиннера о принципе «маленьких шагов» (микроинформация). С. П. Пресси и Н. А. Краудер считают, что ученик, который обречен двигаться к цели маленькими шажками, тем самым лишается возможности достичь цели большими скачками. Вскоре он устает и ему становится скучно. Еще одним недостатком принципа маленьких шагов является то, что он не позволяет индивидуализировать обучение. С его помощью можно лишь регулировать темп обучения и адаптировать его к способностям отдельных учеников.
H. А. Краудер подверг критике практику «конструирования ответа обучающегося», характерную для линейного программирования. В книге Б. Ф. Скиннера учащийся должен заполнить пробел в тексте. Вместо этого Н. А. Краудер предлагает студенту сделать выбор из ответов, приведенных в тексте. По мнению Н. А. Краудера, в этом случае студент затрачивает больше интеллектуальных усилий и более свободен в своей работе.
Оперантное научение в работах Э. Торндайка
Экспериментальное изучение условий приобретения действительно нового поведения, а также динамики научения, было в центре внимания американского психолога Э. Торндайка1. Его работы в основном исследовали закономерности решения проблемных ситуаций у животных. Животное (кошка, собака, обезьяна) должно было самостоятельно найти выход из специально построенного «проблемного ящика» или лабиринта. Позже в подобных экспериментах в качестве испытуемых участвовали и маленькие дети.
При анализе такого сложного спонтанного поведения, каким представляется поиск способа решения лабиринта или отпирания двери (в отличие от реагирующего, ответного поведения), трудно определить стимул, вызывающий определенный ответ. Согласно Торндайку, животные сначала совершали множество хаотичных движений-испытаний и только случайным образом производили правильные, которые приводили к успеху. В последующих попытках выбраться из того же ящика наблюдалось уменьшение количества ошибок и сокращение затраченного времени. Тип обучения, при котором субъект обычно бессознательно пробует различные вариации поведения, операнты, из которых «выбирается» наиболее подходящий, наиболее адаптивный, был назван оперантным обусловливанием.
Метод «проб и ошибок» при решении интеллектуальных задач считался общей закономерностью, характеризующей поведение животных и человека. Торндайк сформулировал четыре основных закона обучения.
- закон повторения (практики). Чем чаще повторяется связь между стимулом и реакцией, тем быстрее она закрепляется и тем сильнее.
2-й закон действия (усиления). Когда реакции усваиваются, те из них, которые сопровождаются подкреплением (положительным или отрицательным), становятся фиксированными. - закон готовности. Состояние субъекта (чувство голода, жажды) не безразлично для производства новых реакций.
- закон ассоциативного сдвига (временной смежности).
Нейтральный стимул, связанный со значимым стимулом, также начинает вызывать желаемое поведение.
Торндайк также определил дополнительные условия для успешного обучения ребенка — легкость в различении стимула и реакции и осознание взаимосвязи между ними.
Оперантное обучение происходит при большей активности организма, оно контролируется (определяется) его результатами, последствиями. Общая тенденция заключается в том, что действия, которые привели к положительному результату, успеху, должны быть зафиксированы и повторены.
Лабиринт в экспериментах Торндайка служил упрощенной моделью окружающей среды. Техника лабиринта в какой-то степени моделирует отношения между организмом и окружающей средой, но очень узким, односторонним, ограниченным образом; и чрезвычайно трудно применить паттерны, обнаруженные в рамках этой модели, к социальному поведению человека в сложно организованном обществе.
Постоянный опыт обучения порождает то, что другие школы психологии называют личностью. Личность — это опыт, который человек приобретает на протяжении всей жизни. Уникальность человека определяется определенным сочетанием генетических характеристик и его учебным репертуаром. Таким образом, психическое развитие отождествляется с обучением, то есть с любым приобретением знаний, навыков и умений — как в условиях специального обучения, так и возникающих спонтанно. Человек — это то, чем он научился быть.
На странице курсовые работы по педагогике вы найдете много готовых тем для курсовых по предмету «Педагогика».
- Здесь темы рефератов по педагогике
Читайте дополнительные лекции:
- Организация контроля качества образовательных результатов при обучении
- Задачи гражданского воспитания
- Музыкальное воспитание как педагогическая система
- Технология музыкального воспитания школьников Кабалевского
- Особенности обучения детей с задержкой психического развития в классах коррекции
- Аудит профессиональной компетенции педагогов доо
- Методика воспитания эстетической культуры личности
- Мастерство и творчество педагога
- Содержание когнитивного, поведенческого, институционального блоков в структуре педагогической культуры
- Управление аксиологическим потенциалом школьника в условиях общеобразовательной школы
Что такое оперантный метод обучения собак?
24 сентября 2019
Petstory
Оперантный метод обучения собак — это обучение, основанное на закономерностях формирования оперантного (условного) рефлекса. Иногда этот же рефлекс называют инструментальным, иногда — условным рефлексом II типа, а иногда даже и гетерогенным условным рефлексом.
Фото: PetstoryPetstory
От классического условного рефлекса имени И.П. Павлова этот рефлекс отличается тем, что основывается на активной целенаправленной деятельности животного, вызванной какой-либо потребностью. И подкреплением при этом является результат этой самой активной и целенаправленной деятельности. В то время как при классическом условном рефлексе подкреплением является безусловный или просто второй по действию раздражитель.
Видео дня
Оперантное научение было открыто американским ученым Э.Л. Торндайком благодаря сообразительности кошек и собак. Дело в том, что Торндайк, выясняя способность животных к обучению, сконструировал специальную клетку, снабженную дверцей с несложным запором. Закрывая в этой клетке кошек и собак, он со здоровым злорадством ученого наблюдал, как братья его меньшие обучались эту дверцу открывать. А обучались открывать дверцу братья и сестры меньшие посредством совершения разнообразных попыток, некоторые из которых были удачными, а некоторые нет. Поэтому Торндайк так и назвал открытую им форму научения «методом проб и ошибок».
Рефлексом же эту форму научения окрестил гораздо позже еще один известный американский ученый Б.Ф. Скиннер и посвятил ему всю свою научную жизнь. Именно поэтому среди нескольких отцов оперантного рефлекса Скиннер считается главным отцом. Однако, справедливости ради отметим, что впервые в мире дрессировку, основанную на оперантном научении, описал наш замечательный дрессировщик Владимир Дуров в своей книге «Дрессировка животных. Психологические наблюдения над животными, дрессированными по моему методу. 40-летний опыт». Таким образом, о русском варианте оперантной дрессировке вы можете прочитать в книге Владимира Дурова, а американский вариант оперантной дрессировки хорошо описан в книге психолога и дрессировщицы Карен Прайор «Не рычите на собаку!», которую, кстати, тоже советую прочитать.
Общую методику оперантной дрессировки по Скиннеру можно описать в виде следующих этапов:
Этап депривации. Так называл этот этап Скиннер в 30-х годах прошлого века. Однако сейчас этот этап следует называть как «этап выбора и создания базовой потребности».
При формировании оперантного условного рефлекса могут быть использованы практически все из известных собакам потребности, однако Скиннер чаще использовал пищевую потребность. И смысл этапа депривации заключался в том, что Скиннер либо недокармливал животных какое-то время или морил их голодом. Считалось что пищевое подкрепление только тогда становилось значимым для животного и эффективным для научения, когда это животное теряло около 20% живого веса. О времена, о нравы!
Этап формирования условного пищевого подкрепления. В своих исследованиях Скиннер использовал автоматические кормушки, звук которых должен был стать для животных сигналом к появлению гранулы корма. И для этого требовалось время. Этап считался завершенным, когда в ответ на звук механизма подачи корма, крыса тут же бежала к кормушке.
По сути этот этап является формированием классического условного звукового рефлекса с пищевым подкреплением. Он также служит основанием так называемой кликер-дрессировке — способа дрессировки с использованием условного звукового пищевого положительного подкрепления.
И приходится признать, что школу оперантной дрессировки от отечественной традиционной дрессировки выгодного отличает внимание, которое оперантная дрессировка уделяет вопросу подкрепления. Особенно положительному и вероятностному подкреплению.
Этап формирования реакции. В качестве модельного поведения Скиннер обучал своих крыс нажимать на педаль, а голубей клевать клавишу. Формирование реакции нажатия на педаль осуществлялось одним из трех способов: способом проб и ошибок (спонтанного формирования), путем направленного или последовательного формирования и способом мишени.
Спонтанное формирование заключалось в том, что животное, путешествуя по ящику Скиннера, случайно нажимало на педаль и постепенно связывало нажатие на нее с включением автокормушки.
При направленном формировании включал автокормушку исследователь, подкрепляя вначале любую ориентацию в сторону педали, затем приближение к ней и, наконец, нажатие на нее. Ну чем не кликер-дрессировка!
А способ мишени заключался в том, что на клавишу наклеивали гранулу корма, попытки оторвать которую и приводили к нажатию на рычаг.
Современная методика оперантной дрессировки для инициации нужного поведения допускает использование практических всех известных способов воздействия на животное. Однако считается неэффективным использование аверсивных (приводящих к боли или неприятным ощущениям) воздействий.
Подведение поведения под стимульный контроль или введение дифференцирующего стимула. Другими словами, введение условного раздражителя или команды.
Скиннер и его сторонники считали, что формирование действия и одновременная параллельная выработка его связи с условным раздражителем (командой) — два разных процесса. А одновременное усвоение двух разных вещей осложняет научение. Поэтому традиционные оперантники сначала формируют поведение, а затем вводят команду.
Следует особо подчеркнуть, что в оперантном научении, дифференцирующий стимул по большому счету не является командой в нашем понимании. Команда — это ведь как приказ? Мы обычно так трактуем ее. А дифференцирующий стимул — это информация о том, что именно сейчас исполнение поведения наиболее эффективно и вообще возможно. Таким образом «команда» в оперантной дрессировке несет функцию позволения и разрешения совершить поведения.
Чтобы стало понятней, разберем введение в эксперимент лампочки как дифференцировочного раздражителя. И так, крыса научилась нажимать на педаль и нажимает на нее, когда хочет есть. Исследователь включает лампочку на пару секунд и создает условия, при которых нажатие на педаль только при включенной лампочке приводит к подаче корма. А когда лампочка выключается, то сколько не нажимай будет тебе комбинация из трех пальцев! Т.е. включение лампочки создает, разделяет, различает, дифференцирует разные условия. И крыса это скоро начинает понимать. А поскольку она очень хочет есть (у нее же создана пищевая потребность!), то увидев включенную лампочку, тут же бежит к педали и ну на нее нажимать! Со стороны кажется, что включенная лампочка заставляет крысу, приказывает ей нажимать на педаль. Но теперь-то вы понимаете, что это не так. Включенная лампочка говорит: теперь можешь нажимать на педаль. И только!
Закрепление поведения. Закрепление сформированного поведения до навыка осуществляется путем повторения с использованием вероятностного подкрепления. Полезно также для этого же использовать различные потребности и, соответственно, применять разное подкрепление.
Отечественный вариант оперантной методики дрессировки, берущий начало от Владимира Дурова, отличается только тем, что позволяет сразу вводить исполнительный стимул (команду, дифференцирующий стимул, условный раздражитель). Практика показывает, что навык формируется ничуть не медленнее, чем при импортной методике. А поскольку позволяет исключить целый этап, то экономит время. Так что есть смысл поддержать отечественного производителя дрессировочных методик!
Petstory – знаем все о кошках и собаках
Petstory – знаем все о кошках и собаках
Другое,Владимир Дуров,
Что такое оперантное обусловливание и научение, как ими управлять и чего можно добиться
В психологии существует масса очень интересных теорий и методик. На первый взгляд, это всего лишь часть работы психоаналитиков. Но именно такие методики, как оперантное научение или оперантное обусловливание, помогают многим людям: спасают семьи, влияют на успеваемость детей, на повышение самооценки и т. д.
- Способ формирования
- Примеры основ научения
- Имеющиеся компоненты оперантного научения
- Примеры оперантного научения
- Формы научения
- Голодный голубь
Оперантное научение – это неестественный путь возникновения условных рефлексов, заключается он в подпитке спонтанно появившейся реакции у определённого субъекта, но не стимула, это происходит благодаря последствиям: подкрепления (увеличение) либо наказания (уменьшение).
Способ формирования
Оперантное обусловливание имеет способность формировать поведение, в случаи, когда подпитываемые действия постепенно меняются, плавно превращаясь к исполнению, что мы хотим видеть в итоге.
Научение имеет в себе целую систему наказаний и особых поощрений, целью которых является усилить либо ограничить выбранный тип поведения.
Суть оперантного научения – это установка ассоциативной связи между основным поведением и следствием того самого поведения. Научение можно отнести к своеобразному методу обучения, только этот способ требует конкретного действия. Нередко оперантное научение называют методом Скиннера — в честь Бихевиориста Фредерика Скиннера. Скиннер был убеждён в том, что объяснить любое поведение мыслями или мотивацией – невозможно. По этой причине он пробовал обращать внимание на причины внешнего характера которые влияют на поведение людей.
Такой термин, как «оперантный», Скиннер использовал как описание любого поведения, которое можно отнести к влиянию внешних факторов, выливших в определённые последствия. Проще говоря, Скиннер на примере научения объяснил нам, как люди приобретают привычки и модель поведения которые используются ежедневно.
Примеры основ научения
Если только задуматься, примеров оперантного научения (оперантное обусловливание) в повседневной жизни встречаются очень часто: школьники, что делают заданные домой упражнения, взамен на это получат награду от родителей; сотрудники, которые при достижении заданной нормы получат повышение зарплаты или служебное продвижение. Это лишь те примеры, что показывают на перспективу награды в случае выполнения задания, но научения можно использовать и для того, чтобы отучить человека от привычки наказанием либо лишением желаемого.
К примеру, школьников можно отучить разговору на уроках, нужно просто лишить их возможности развлекаться на ожидаемой перемене.
Имеющиеся компоненты оперантного научения
Подпитка либо же подкрепление – это неопределённое действие, что способно повлиять на развитие необходимой модели поведения.
Всего существует 2 вида подпитки:
- Позитивное оперантное обусловливание – вознаграждение, его используют для того, чтобы поощрить необходимую модель поведения: к примеру, это может быть похвала или желаемая награда;
- Негативное оперантное обусловливание – действия или результаты не приносящие удовольствия, что прекращаются для поощрения при достигнутом поведении.
И первый и второй вид подкрепления используют для поощрения той модели поведения, которой вы добиваетесь. Наказание используется для тех случаев, когда необходимо прекратить нежелательную модель поведения.
Всего можно выделить 2 вида наказаний:
- Позитивное наказание – в этом случаи используют нежелательное действие, для того чтобы снизить последующую реакцию;
- Негативное наказание – прекращение не желаемого действия, чтобы ослабить реакцию за ним. Оба вида используют для снижения нежелательной модели поведения.
Оперантное обусловливание, поведение (поведение которое было вызвано научением) можно определить особыми событиями, что обычно следуют за реакцией. Таким образом, за определённым поведением идёт следствие, и образование того самого следствия заменяет тенденцию организма отражаться данным поведением в дальнейшем.
Примеры оперантного научения
Как пример, можно рассмотреть катание на доске, метание дротиков, игру на фортепиано или написание своего же имени – это считается образцами оперантной реакции, результаты, которые возможно контролировать, следующем за поведением. Это самостоятельно приобретённые реакции, для них не может существовать стимул, который мы могли бы распознать.
Скиннер не отрицал, что рассуждать о возникновении оперантный метод поведения – бессмысленно. Ведь нам не могут быть известны стимулы или внутренние причины, что ответственны за появление его. То есть, оно возникло спонтанно.
В случаях, когда последствия благоприятно отражаются на организме, вероятность повторения в дальнейшем операнта будет усиливаться. Когда это происходит – любые последствия подпитываются, и оперантное обусловливание, получены благодаря подкреплению – обусловливаются. Величина стимула позитивного подкрепления определяется соответственно воздействию на последующую частоту реакции, что ранее ему предшествовали. Таким образом, теория действует и противоположно, в случаи, когда реакция неблагоприятно и не имеет подкрепления, вероятность получения операнта значительно уменьшается.
Формы научения
Скиннер уверял, что, как следствие, оперантное обусловливание может контролироваться неприятными последствиями. Как правило, негативное либо агрессивное последствие способно ослабить поведение, что порождало их, кроме этого, оно усиливает поведение, которое устраняет их. Мы уже говорили о том, что научение можно рассматривать как определённую форму обучения. Он основан связью раздражитель – реакция – подкрепление, благодаря которому поведение формируется и поддерживается в силу определённых последствий.
Оперантный метод поведение присутствует с самого детства и встречается она практически в каждой семье – это оперантное обусловливание, научение такому поведению, как плач.
Все мы знакомы с детским плачем, когда те испытывают боль, конечно же, моментальная реакция родителей – выражение внимания и других возможных подкреплений. Внимание и есть тот самый подкрепляющий фактор для ребёнка, с этого можно понять обусловленность реакции плача. Но, стоит учесть и то, что плач может возникнуть при отсутствии боли. Несмотря на то, что большинство родителей склонны утверждать, будто они могут различить, плач вызван расстройством или плач вызван желанием внимания, все же многие родители предпочитают упорно подкреплять последнее.
Не менее интересный пример можно рассмотреть на дрессировщиках в цирке, они побуждают совершить определённое действие самых разных зверей, после чего хвалят их и угощают небольшим кусочком пищи. Как только животное освоило новое задание, это животное побуждают совершить новое действие.
Если в итоге дрессировщик не получает необходимого действия от животного, то оно остаётся без лакомства. В результате животное снова и снова делает попытки до тех пор, пока цель не будет достигнута.
Если вы имеете собаку, можно также понаблюдать за её поведением, например, когда она играет мячом, скорее всего, она его будет кусать, прижимать к полу или подкидывать вверх. В обыденной среде проживания, организм способен не только на то, чтобы отвечали стимулы, но и на воздействие окружению. Но, когда организм сумел совершить новое действие, то дальнейшее проявления этого действия будет зависеть от того, каков был его результат. То есть, собака станет подкидывать мяч чаще, если его поощрить кусочком мяса либо же другого лакомства.
Любое поведение поддаётся контролю, кроме того им возможно управлять, создав необходимый порядок подпитки. Сканнер очень много экспериментировал на животных утверждая, что научения одинаково закономерны как для животных, так и для людей.
Голодный голубь
На примере Сканнера разберём и последний приём. Голодного голубя сажали в особый ящик. В середине ящика не было ничего, кроме небольшой кнопки и, кормушкой что располагалась под кнопкой. Голодный голубь, как только попадает в клетку начинает обследовать её, в результате чего находит и клюёт кнопку. Поиск повторяется: птица клюёт кормушку или пол, по итогу снова клюёт кнопку. В течение небольшого отрывка времени птица несколько раз клюёт кнопку. Затем, включают кормушку, теперь после каждого удара на кнопку, голубь будет получать по зёрнышку. Далее, чем чаще голубь клюёт по кнопке, тем больше еды он получает.
Если птица станет клевать кнопку на высокой частоте, то это можно назвать высоким оперантным уровнем, когда будет клевать её слишком редко, действия будут иметь непосредственно низкий оперантный уровень.
www.Psyarticles.ru — учебные статьи по психологии
Учебные материалы по психологии и психологические статьи — основное содержание сайта.
Проект в значительной степени рассчитан на самообразование читателей, ранее систематически не изучавших психологию, однако может оказаться полезным и для специалистов, расширяющих свой профессиональный кругозор.
Материалы сайта представляют собой наиболее важные и интересные фрагменты из учебных пособий и научных работ из самых разнообразных отраслей психологии.
Проект будет полезен психологам и врачам, студентам и преподавателям, специалистам в области управления, а также широкому кругу читателей, интересующихся вопросами современной психологии.
Предпосылки возникновения конфликта в процессе общения
Рассмотрим особенности поведения человека в конфликтной ситуации прежде всего в процессе общения. В процессе человеческих взаимоотношений, как вы уже знаете из предыдущих разделов, процесс общения предполагает наличие следующих трех факторов: восприятия, эмоций и обмена информацией. В конфликтных ситуациях легко забыть об этом. Поэтому кратко рассмотрим, что же может создавать почву для их возникновения.
Социально-психологические предпосылки. Первая трудность — это разногласия из-за несовпадения ваших рассуждении с рассуждениями другой стороны. Ведь то, какой вы видите проблему, зависит от того, с какой колокольни, образно говоря, смотрите на нее.
Специфика конфликтов в образовательных процессах
В культурно-историческом подходе Л.С. Выготского процессы образования рассматриваются, с одной стороны, как предназначенные для разрешения противоречий развития общества, с другой — как обладающие внутренне противоречивым характером.
Мы придерживаемся именно этого подхода, и вслед за Л.С. Выготским и его последователями исходим из того, что конфликт представляет собой механизм развития человеческой деятельности и соответственно личности.
Современная психология: ее задачи и место в системе наук
В последние годы наблюдается бурное развитие психологической науки, обусловленное многообразием теоретических и практических задач, встающих перед нею. В нашей стране интерес к психологии особенно показателен — ей наконец-то начинают уделять то внимание, которого она заслуживает, причем практически во всех отраслях современного образования и бизнеса.
Основной задачей психологии является изучение законов психической деятельности в ее развитии. В течение последних десятилетий значительно расширились диапазон и направления психологических исследований, появились новые научные дисциплины.
Методы психологии
Методы научных исследований — это те приемы и средства, с помощью которых ученые получают достоверные сведения, используемые далее для построения научных теорий и выработки практических рекомендаций.
Сила науки во многом зависит от совершенства методов исследования, от того насколько они валидны и надежны, как быстро и эффективно данная отрасль знаний способна воспринять и использовать у себя все самое новое, передовое, что появляется в методах других наук.
Алгоритм оценки достоверности информации в результате психофизиологического исследования с применением полиграфа
Двадцать лет назад использование прибора способного отличить ложь от правды – «детектора лжи» было исключительной прерогативой спецслужб ведущих мировых держав. За прошедшие годы ситуация кардинально изменилась.
Проверки на «детекторе», стали доступными для широкого круга потребителей – правоохранительных органов, руководителей коммерческих и банковских структур, представителей кадровых служб, частных охранных предприятий и просто граждан, желающих получить достоверную информацию.
Процесс формирования двигательного навыка. Принцип активности и его развитие Н.А. Бернштейном
Переходим к следующей важной теме, совершенно по-новому раскрытой Н. А. Бернштейном, — механизмам формирования навыка. Эта проблема очень важна для психологии, так как формирование навыков составляет, как вы уже знаете, основу всякого обучения.
Процесс формирования навыка описан у Бернштейна очень подробно. Он выделил много частных фаз — порядка семи, которые объединяются в более общие периоды. Для первого знакомства достаточно будет разобрать эти периоды.
Проблема психодинамического диагноза
Психодинамическая диагностика, в отличие от дискретно-описательного диагностического подхода, укоренившегося в отечественных медицинской и психологической традициях, представляет собой прежде всего диагностику структуры личности с точки зрения ее развития.
Подобный подход, обеспечивающий целостный и всесторонний анализ личности и ее психопатологии, определяет и специфику терапевтических методов.
Психологическая профилактика конфликтов в коллективе
Многие организационные конфликты легче предупредить, чем разрешить.
Поскольку центральными фигурами конфликтов в организации являются конкретные личности, то такая профилактика должна быть личностно-ориентированной.
Остановимся на некоторых особо значимых организационно-управленческих условиях, способствующих снижению конфликтности личности.
Четыре элемента процесса убеждения
Процесс убеждения складывается из следующих элементов: агент влияния (источник сообщения), само сообщение, условия, в которых передается сообщение (контекст), и реципиент, то есть тот индивид, которому предназначено сообщение.
Само сообщение, в зависимости от его содержания, от того, как оно сформулировано и в какой форме преподнесено, также может либо убеждать, либо внушать. Но может и не иметь вообще никакого эффекта.
Повышение уровня сознания. Насколько это важно?
Тема самосовершенствования и развития человеческих качеств, можно сказать, вечная, при этом мудрые люди часто повторяют, что самой важной задачей для каждого человека является развитие его собственного сознания.
Несмотря на очевидную важность темы, серьезных и качественных материалов, посвященных этому вопросу, не так уж и много, хотя периодически все же появляются интересные работы.
Что это такое и как он работает
от Сайруса Уэхоме
Медицинский анализ Poonam Sachdev 27 апреля 2022 г.
В этой статье
- Операционное поведение
- Операционная теория кондиционирования
- положительное достоприме
- Графики подкрепления
- Наказание
- Экономика жетонов
Оперантное обусловливание, иногда называемое инструментальным обусловливанием, представляет собой метод обучения, в котором для изменения поведения используются поощрения и наказания. Благодаря оперантному обусловливанию вознаграждаемое поведение, скорее всего, будет повторяться, а наказуемое поведение встречается редко.
Например, когда вы на работе получаете бонус за исключительную работу, вы будете склонны продолжать работать на более высоком уровне в надежде получить еще один бонус в будущем. Поскольку за этим поведением последовал положительный результат, оно, вероятно, будет повторяться.
Оперантное поведение
При оперантном поведении стимулы могут быть аппетитными или отталкивающими. Аппетитные стимулы — это те, к которым вы приближаетесь добровольно, в то время как аверсивные стимулы — это те, которые вы пытаетесь избежать или избежать. Ответы на такие стимулы могут быть как положительными, так и отрицательными. В данном случае положительное и отрицательное не означает хорошее или плохое. Вместо этого положительное подкрепление означает введение стимула для увеличения вероятности повторения поведения, в то время как отрицательное подкрепление включает устранение стимула для поощрения хорошего поведения.
Теория оперантного обусловливания
Оперантное обусловливание впервые было описано бихевиористом Б. Ф. Скиннером. Его теория основывалась на двух предположениях. Во-первых, причиной поведения человека является что-то в его окружении. Во-вторых, последствия поведения определяют возможность его повторения. Поведение, за которым следуют приятные последствия, с большей вероятностью будет повторяться, а поведение, за которым следуют неприятные последствия, повторится с меньшей вероятностью.
Хотя Скиннер был пионером теории оперантного обусловливания, его идеи основывались на законе эффекта Торндайка. Скиннер также считал, что у нас есть разум. Поэтому было более продуктивно изучать наблюдаемое поведение, а не внутренние психические события.
Скиннер также был образцовым изобретателем. Среди его гаджетов была коробка Скиннера, которая использует такие объекты, как крысы и голуби, для записи поведения животных в сжатые сроки.
В ходе своих экспериментов Скиннер определил три типа реакций, которые следуют за поведением:
Нейтральные реакции. Это реакции окружающей среды, которые не производят никаких стимулов, кроме концентрации внимания. Они не увеличивают и не уменьшают вероятность повторения поведения.
Усилители. Это реакции окружающей среды, которые увеличивают вероятность повторения поведения. Они могут быть как положительными, так и отрицательными.
Каратели. Это отрицательные операнты, которые снижают вероятность поведения. Наказание ослабляет поведение.
Положительное подкрепление
Положительное подкрепление включает в себя предъявление аппетитного стимула для увеличения вероятности того, что поведение произойдет в будущем. Например, если ваш ребенок занимается домашними делами без просьбы, вы можете вознаградить его, отведя в парк или вручив лакомство.
Скиннер использовал голодную крысу в ящике Скиннера, чтобы показать, как работает положительное подкрепление. В коробке сбоку был рычаг, и когда крыса двигалась по коробке, она случайно сталкивала рычаг. Сразу после этого в контейнер рядом с рычагом падала пищевая гранула. Последствие получения пищи каждый раз, когда крыса нажимала на рычаг, гарантировало, что животное повторяло действие снова и снова.
Положительное подкрепление не обязательно должно включать материальные предметы. Вместо этого вы можете положительно подкрепить своего ребенка с помощью:
- Похлопать в ладоши
- Аплодисменты
- Обнять или похлопать по спине
- Поднять большой палец вверх
- Предложить особое занятие, например поиграть в игру или вместе почитать книгу
- Рассказать другому взрослому, как вы гордитесь поведение вашего ребенка, пока ваш ребенок слушает
- Похвала
- Дай пять
Отрицательное подкрепление
При отрицательном подкреплении что-то неприятное прекращается в ответ на стимул. Со временем поведение усиливается с ожиданием того, что аверсивный стимулятор исчезнет. Если, например, ребенок отказывается есть овощи во время обеда, а родитель в ответ убирает овощи, удаление овощей является негативным подкреплением.
Графики подкрепления
График подкрепления — это компонент оперантного обусловливания, в котором указывается, какие примеры поведения будут подкрепляться. Он включает в себя набор правил, определяемых временем и количеством ответов, необходимых для предъявления или удаления поощрения.
Различные модели подкрепления по-разному влияют на скорость обучения. Графики армирования включают:
Армирование с фиксированным соотношением. Награды зависят от определенного количества повторений поведения. Например, ребенку аплодируют после правильного написания 10 слов.
Армирование с фиксированным интервалом. Награды выдаются в определенное время. Например, еженедельная зарплата. Другой пример: ребенок получает вознаграждение раз в неделю, если посуда вымыта.
Армирование с переменным соотношением сторон. Это подкрепление непредсказуемо и дает большое количество ответов. Например, азартные игры могут предлагать выигрыши после нескольких непредсказуемых попыток.
Армирование с переменным интервалом. Ответы вознаграждаются по прошествии непредсказуемого количества времени. Примером могут служить непредсказуемые проверки санитарным инспектором.
Непрерывное армирование. Это подкрепление поведения каждый раз, когда оно происходит. Примером может служить вознаграждение малыша каждый раз, когда он использует горшок.
Наказание
При оперантном обусловливании наказание определяется как любое изменение в окружающей среде, которое снижает вероятность повторения реакции или поведения. Наказание может работать либо путем непосредственного применения неприятного стимула, такого как ругань , либо путем устранения потенциально полезного стимула, такого как вычет чьего-то суточного содержания для наказания за нежелательное поведение.
Хотя наказание эффективно снижает нежелательное поведение, оно связано со многими проблемами, такими как:
- Повышенная агрессия
- Наказуемое поведение скорее подавляется, чем забывается.
- Страх
- Наказание не обязательно ведет к хорошему поведению
- Наказание может легко превратиться в жестокое обращение фальшивые деньги, еда, наклейки, покерные фишки или кнопки, которые впоследствии обмениваются на вознаграждения. Например, в условиях больницы вознаграждение в виде символических денег может предлагаться в обмен на еду, доступ к телевидению и другие бонусы.
Экономика жетонов доказала свою эффективность не только в лечении психически больных, но и в школе. Эта система может быть использована в классах для уменьшения деструктивного поведения и повышения академической вовлеченности.
Теория оперантного обусловливания (+ как применять ее в жизни)
Оперантное обусловливание – хорошо известная теория, но как вы применяете ее на практике в повседневной жизни?
Как вы используете свое знание его принципов для создания, изменения или отказа от привычки? Как вы используете его, чтобы заставить своих детей делать то, о чем вы их просите, — с первого раза?
Изучение поведения увлекательно, и тем более увлекательно, когда мы можем связать полученные данные о поведении с нашей жизнью за пределами лаборатории.
Наша цель — сделать именно это; но сначала необходимо сделать исторический обзор.
Прежде чем вы продолжите чтение, мы подумали, что вы можете бесплатно загрузить три наших упражнения по позитивной психологии. Эти научно обоснованные упражнения исследуют фундаментальные аспекты позитивной психологии, включая сильные стороны, ценности и сострадание к себе, и дадут вам инструменты для улучшения благополучия ваших клиентов, студентов или сотрудников.
Эта статья содержит:
- Наши главные герои: Павлов, Торндайк, Ватсон и Скиннер
- Оперантное обусловливание: определение
- Принципы оперантного обусловливания
- 10 примеров оперантного обусловливания
- Оперантное обусловливание против классического обусловливания
- Оперантное обусловливание в терапии
- Применение в повседневной жизни
- Взгляд на графики подкрепления
- Полезные техники для практиков
- Интересное видео
- 5 книг по теме
- Сообщение на вынос
- Каталожные номера
Наши главные герои: Павлов, Торндайк, Ватсон и Скиннер
Как и все великие истории, мы начнем с действия, которое дало толчок всему остальному.
Давным-давно Павлов пытался разгадать тайны слюноотделения у собак. Он предположил, что у собак выделяется слюна в ответ на поднесение пищи. То, что он открыл, подготовило почву для того, что сначала было названо павловским обусловливанием, а затем классическим обусловливанием.
Какое отношение это имеет к оперантному обусловливанию? Другие ученые-бихевиористы сочли работу Павлова интересной, но раскритиковали ее за упор на рефлексивное обучение. Он не ответил на вопросы о том, как окружающая среда может формировать поведение.
Э. Л. Торндайк был психологом, проявлявшим большой интерес к образованию и обучению. Его теория обучения, названная коннекционизмом , доминировала в системе образования Соединенных Штатов. Короче говоря, он считал, что обучение является результатом связи между сенсорным опытом и нейронными реакциями (Schunk, 2016, стр. 74). Когда эти ассоциации возникали, возникало поведение.
Торндайк также установил, что обучение является результатом процесса проб и ошибок.
Этот процесс требует времени, но не сознательной мысли. Он изучил и развил наши первоначальные концепции подкрепления оперантным обусловливанием и того, как различные типы влияют на обучение.
Принципы обучения Торндайка включают:
- Закон Упражнения, который включает в себя Закон Использования и Закон Неиспользования. Они объясняют, как связи укрепляются или ослабевают в зависимости от их использования/неиспользования.
- Закон Эффекта фокусируется на последствиях поведения. Поведение, которое приводит к вознаграждению, усваивается, но поведение, которое приводит к воспринимаемому наказанию, не усваивается.
- Закон готовности касается готовности. Если животное готово действовать и делает это, то это награда, а если животное готово и не может действовать, то это наказание.
- Ассоциативное смещение возникает, когда реакция на определенный стимул в конечном итоге вызывает другой.
- Идентичные элементы влияют на передачу знаний. Чем больше похожи элементы, тем больше вероятность перехода, потому что ответы тоже очень похожи.
Более поздние исследования не подтвердили Законы Упражнения и Эффекта Торндайка, поэтому он отказался от них. Дальнейшее исследование показало, что наказание не обязательно ослабляет связи (Schunk, 2016, стр. 77). Первоначальный ответ не забыт.
Все мы хоть раз сталкивались с этим. Вы превышаете скорость, вас останавливают и вы получаете штраф. Это на короткое время подавляет ваше поведение, связанное с превышением скорости, но не мешает вам когда-либо снова превышать скорость.
Позже Джон Б. Уотсон, другой бихевиорист, подчеркивал методический, научный подход к изучению поведения и отвергал любые идеи об интроспекции. Бихевиористов интересуют наблюдаемые явления, поэтому изучение внутренних мыслей и их предполагаемой связи с поведением не имеет значения.
Эксперимент «Маленький Альберт», увековеченный в большинстве учебников по психологии, заключался в том, чтобы заставить маленького мальчика бояться белой крысы. Уотсон использовал классическое обусловливание для достижения своей цели.
Страх мальчика перед белой крысой перешел на других животных с мехом. Исходя из этого, ученые пришли к выводу, что эмоции могут быть обусловлены (Stangor and Walinga, 2014).
В 1930-х годах Б. Ф. Скиннер, познакомившийся с работами этих и других исследователей, продолжил изучение того, как организмы учатся. Скиннер изучил и разработал популярную сегодня теорию оперантного обусловливания.
После проведения нескольких экспериментов на животных Скиннер (1938) опубликовал свою первую книгу «Поведение организмов» . В издании 1991 года он написал предисловие к седьмому изданию, вновь подтвердив свою позицию в отношении исследования стимула/реакции и самоанализа:
«… нет необходимости обращаться к внутреннему аппарату, будь то ментальный, физиологический или концептуальный».
С его точки зрения, наблюдаемое поведение, основанное на взаимодействии стимула, реакции, подкрепления и лишения, связанного с подкреплением, — это единственные элементы, которые необходимо изучить, чтобы понять человеческое поведение.
Он назвал эти случайности и сказал, что они «обусловливают внимание, запоминание, обучение, забывание, обобщение, абстрагирование и многие другие так называемые познавательные процессы».0185 ».
Скиннер считал, что определение причин поведения является наиболее важным фактором для понимания того, почему организм ведет себя определенным образом.
Шунк (2016, стр. 88) отмечает, что теории обучения Скиннера были дискредитированы более современными теориями, рассматривающими более высокий порядок и более сложные формы обучения. Теория оперантного обусловливания этого не делает, но она по-прежнему полезна во многих образовательных средах и при изучении геймификации.
Теперь, когда у нас есть четкое представление о том, почему и как ведущие бихевиористы открыли и развили свои идеи, мы можем сосредоточить свое внимание на том, как использовать оперантное обусловливание в нашей повседневной жизни. Однако сначала нам нужно определить, что мы подразумеваем под оперантным обусловливанием.
Оперантное обусловливание: определение
Основная концепция оперантного обусловливания заключается в том, что стимул (антецедент) приводит к поведению, которое затем приводит к последствию. Эта форма обусловливания включает подкрепление, как положительное, так и отрицательное, а также первичное, вторичное и обобщенное.
- Основными подкреплениями являются такие вещи, как еда, кров и вода.
- Вторичные подкрепления — это стимулы, которые становятся обусловленными из-за их ассоциации с первичным подкреплением.
- Обобщенные подкрепления возникают, когда вторичное подкрепление сочетается с более чем одним основным подкреплением. Например, работа за деньги может повысить способность человека покупать различные вещи (телевизоры, автомобили, дом и т. д.)
Поведение является оперантным. Отношения между дискриминационным стимулом, реакцией и подкреплением влияют на вероятность повторения поведения в будущем. Подкрепление — это своего рода вознаграждение или, в случае неблагоприятных исходов, наказание.
Принципы оперантного обусловливания
Подкрепление возникает при усилении реакции. Подкрепление зависит от ситуации. Это означает, что то, что может быть подкрепляющим в одном сценарии, может не быть в другом.
Вас может побудить (побудить) пойти на пробежку, если вы увидите свои кроссовки возле входной двери. Однажды ваши кроссовки окажутся в другом месте, и вы не пойдете на пробежку. Другая обувь у входной двери не производит такого же эффекта, как ваши кроссовки.
Существует четыре типа арматуры, разделенных на две группы. Первая группа действует, чтобы усилить желаемое поведение. Это известно как положительное или отрицательное подкрепление.
Вторая группа предназначена для уменьшения нежелательного поведения. Это называется положительным или отрицательным наказанием. Важно понимать, что наказание, хотя и может быть полезным в краткосрочной перспективе, не останавливает нежелательное поведение в долгосрочной или даже постоянной перспективе.
Вместо этого он подавляет нежелательное поведение на неопределенное время. Наказание не учит человека правильно себя вести.
Эдвин Гутери (цитируется по Schunk, 2016) считал, что для изменения привычки, которой становятся некоторые негативные формы поведения, необходима новая ассоциация. Он утверждал, что существует три метода изменения негативного поведения:
- Порог — ввести слабый раздражитель, а затем увеличивать его с течением времени.
- Усталость – Повторяйте нежелательную реакцию на раздражитель до тех пор, пока не устанете
- Несовместимый ответ – Соедините стимул с чем-то более желательным.
Другим ключевым аспектом оперантного обусловливания является концепция угасания. Когда подкрепление не происходит, поведение снижается. Если ваш партнер отправляет вам несколько текстовых сообщений в течение дня, а вы не отвечаете, со временем он может перестать отправлять вам текстовые сообщения.
Точно так же, если у вашего ребенка случилась истерика, а вы ее проигнорировали, у вашего ребенка могут прекратиться истерики.
Это отличается от забывания. Когда возможности реагировать на стимулы практически отсутствуют, об условном рефлексе можно забыть.
Обобщение реакции является важным элементом оперантного обусловливания. Это происходит, когда человек может обобщить поведение, которому научились в присутствии стимула, а затем обобщить эту реакцию на другой, похожий стимул. Например, если вы умеете водить один тип автомобиля, скорее всего, вы сможете управлять другим подобным автомобилем, минивэном, внедорожником или грузовиком.
Вот еще один пример, предложенный PsychCore.
10 Примеры оперантного обусловливания
Сейчас вы, вероятно, думаете о своих собственных примерах как классического, так и оперантного обусловливания.
Пожалуйста, не стесняйтесь поделиться ими в комментариях. Если вам нужно еще несколько, вот 10 для рассмотрения.
Представьте, что вы хотите, чтобы ребенок тихо сидел, пока вы переходите к новой задаче. Когда ребенок это делает, вы подкрепляете это тем, что каким-то образом узнаете ребенка. Многие школы в Соединенных Штатах используют билеты в качестве поощрения. Эти билеты используются студентом или классом для получения будущей награды. Другим подкреплением было бы сказать: « Мне нравится, как Сара спокойно сидит. Она готова учиться ». Если вы когда-либо были в классе с детьми дошкольного возраста и второклассниками, вы знаете, что это работает как волшебство. Это положительное подкрепление.
Примером отрицательного подкрепления может быть удаление чего-то, чего ученики не хотят. Вы видите, что студенты добровольно предлагают ответы во время урока. В конце урока вы можете сказать: « Ваше участие в этом уроке было великолепным! Нет домашнего задания! ” Обычно учащиеся предпочитают избегать домашних заданий (негативное подкрепление).
Они узнают, что если они участвуют во время урока, то учитель с меньшей вероятностью будет задавать домашнее задание.
Ваш ребенок плохо себя ведет, поэтому вы даете ему дополнительную работу по дому (негативное наказание – предоставление отрицательного подкрепления).
Вы используете лакомство (позитивное подкрепление), чтобы научить собаку выполнять трюк. Вы говорите своей собаке сесть. Когда он это сделает, вы дадите ему лакомство. Со временем собака начинает ассоциировать угощение с поведением.
Вы лидер оркестра. Когда вы встаете перед своей группой, они успокаиваются и кладут свои инструменты в положение готовности. Вы являетесь стимулом, вызывающим конкретную реакцию. Следствием для членов группы является ваше одобрение.
Ваш ребенок не убирает свою комнату, когда ему говорят. Вы решаете отобрать у него любимое устройство (отрицательное наказание — удаление положительного подкрепления). Он начинает уборку. Через несколько дней вы хотите, чтобы он убрал свою комнату, но он не делает этого, пока вы не пригрозите отобрать его устройство.
Ему не нравятся ваши угрозы, поэтому он убирает свою комнату. Это повторяется снова и снова. Вы устали от необходимости угрожать ему, чтобы заставить его делать свою работу по дому.
Что делать, если наказание неэффективно?
В предыдущем примере вы могли совместить менее привлекательное занятие (уборка комнаты) с чем-то более привлекательным (дополнительное время за компьютером/устройством). Вы можете сказать: « За каждые десять минут, которые вы тратите на уборку своей комнаты, у вас может быть пять дополнительных минут на вашем устройстве. ” Это известно как принцип Премака. Чтобы использовать этот подход, вам нужно знать, что человек ценит больше всего, а что меньше всего. Затем вы используете наиболее ценный элемент, чтобы подкрепить выполнение менее ценных задач. Ваш ребенок не ценит уборку своей комнаты, но он ценит время, проведенное за устройством.
Вот еще несколько примеров использования принципа Премака:
Ребенок, который не хочет выполнять математическое задание, но любит читать, может заработать дополнительное время для чтения, поход в библиотеку, чтобы выбрать новую книгу, или один- на одно время чтения с вами после того, как они выполнят свое математическое задание.
За каждые X математических задач, которые решит ребенок, у него может быть X минут использования iPad в конце дня.
За каждые 10 минут тренировки вы получаете 10 минут просмотра любимого шоу в конце дня.
Ваш ребенок может выбирать между тем, чтобы мыть грязную посуду в посудомоечной машине, или мыть посуду вручную.
Какие у вас есть примеры оперантного обусловливания? Когда вы использовали принцип Премака?
Оперантное обусловливание в сравнении с классическим обусловливанием
Классическое обусловливание проще всего рассматривать как рефлексивное. Это поведение, которое организм делает автоматически. Павлов соединил колокольчик с поведением собаки (слюноотделением), когда ему подают еду. После нескольких испытаний Павлов научил собак выделять слюну при звонке колокольчика.
До этого звонок был нейтральным раздражителем. У собак не было слюны, когда они это слышали. Если вы не знакомы с исследованиями Павлова, это видео объясняет его знаменитые эксперименты.
Оперантное обусловливание связано с последствиями поведения; поведение меняется по отношению к окружающей среде. Если среда диктует, что определенное поведение не будет эффективным, то организм меняет поведение. Организму не нужно сознательно осознавать этот процесс, чтобы произошло изменение поведения.
Как мы уже узнали, подкрепление имеет решающее значение для оперантного обусловливания. Поведение, приводящее к приятным результатам (последствиям), повторяется, а поведение, приводящее к неблагоприятным результатам, обычно не повторяется.
Если вы хотите научить свою кошку подходить к вам, чтобы вы могли дать ей лекарство или вылечить блох, вы можете использовать оперантное обусловливание.
Например, если ваша кошка любит жирные продукты, такие как масло, а вам нравится есть попкорн, вы можете научить свою кошку прыгать на прилавок рядом с раковиной, где вы ставите грязный мерный стакан.
- Шаг 1: Перелейте масло и зерна из мерного стакана в кастрюлю.
- Шаг 2: Позвольте кошке лизнуть мерный стаканчик.
- Шаг 3: Поставьте чашку в раковину.
- Шаг 4. Выполняйте эти действия каждый раз, когда готовите попкорн.
Кошке не потребуется много времени, чтобы связать звук «зерен в горшке» с «мерным стаканом в раковине», что приводит к их награде (маслу). Кошка может даже ассоциировать звук горшка скользят по плите, получая награду.
После того, как вы научились этому поведению, все, что вам нужно будет делать, это двигать кастрюлю по плите или встряхивать пакет с зернами попкорна. Ваша кошка запрыгнет на прилавок в поисках награды, и теперь вы без проблем сможете дать лекарство или средство от блох.
Оперативное обусловливание полезно в учебных и рабочих условиях, для людей, желающих сформировать или изменить привычку, а также для дрессировки животных.
Подходит любая среда, в которой есть желание изменить или сформировать поведение.
Оперантное обусловливание в терапии
Кумар, Синха, Датта и Лахири (2019) использовали виртуальную реальность (VR) и оперантное обусловливание, чтобы помочь пациентам, перенесшим инсульт, чаще использовать паретическую ногу.
Пациенты, перенесшие инсульт, склонны переносить больший вес на непаретическую ногу, что обычно является выученной реакцией. Однако иногда это происходит потому, что инсульт повреждает одну сторону их мозга.
Полученное повреждение заставляет человека игнорировать или становиться «слепым» к паретичной стороне тела.
Кумар и др. (2019) разработали систему V2BaT. Он состоит из следующего:
- Задача на основе виртуальной реальности
- Распределение веса и оценка порога
- Балансировочная доска Wii – рукопожатие VR
- Обнаружение подъема пятки
- Оценка производительности
- Модули переключения задач
Используя балансировочные доски Wii для измерения смещения веса, они приучили участников использовать паретическую ногу, предложив внутриигровое вознаграждение (звезды и поощрение).
Балансировочные доски давали показания, которые подсказывали исследователям, какая нога больше всего использовалась во время переноса веса.
Они провели несколько обычных испытаний с разными уровнями сложности. Промежуточные испытания улова позволили им проанализировать изменения. Когда первое испытание на улов сравнивали с окончательным испытанием на улов, наблюдалось значительное улучшение.
Оперантное и классическое обусловливание являются основой поведенческой терапии. Каждый из них может быть использован для помощи людям, борющимся с обсессивно-компульсивным расстройством (ОКР).
Люди с ОКР испытывают «повторяющиеся мысли, идеи или ощущения (навязчивые идеи), которые заставляют их постоянно что-то делать» (American Psychiatric Association, n.d.). Оба типа обусловливания также используются для лечения других типов тревоги или фобий.
Применение в повседневной жизни
Мы — смесь наших привычек. Некоторые из них автоматические и рефлекторные, другие более целенаправленные, но, в конце концов, все это привычки, которыми можно манипулировать.
Непрофессионалу, пытающемуся изменить привычку или приобрести новую, может помочь оперантное обусловливание.
Это основа петли привычки, ставшей популярной в книге Чарльза Дахигга (2014) Сила привычки .
Сигнал (триггер, антецедент) приводит к рутине (поведению), а затем к награде (последствию).
Все мы знаем, как сложно изменить привычку. Тем не менее, когда вы понимаете основные принципы оперантного обусловливания, вам нужно разбить привычку на составные части. Наша цель — изменить поведение, даже если вознаграждение от первоначального поведения невероятно привлекательно для нас.
Например, если вы хотите выработать привычку заниматься спортом, но в течение нескольких месяцев ведете сидячий образ жизни, ваша мотивация не поможет вам. Это одна из причин, почему эта конкретная привычка в качестве новогоднего решения часто терпит неудачу. Людям не терпится пойти в спортзал и сбросить несколько килограммов за праздничный сезон. Затем, примерно через две недели, их стремление сделать это постепенно уступает место дюжине других вещей, которые они могли бы сделать в свое время.
Используя метод оперантного обусловливания, вы можете разработать свою новую привычку к упражнениям. Б. Дж. Фогг, исследователь из Стэнфорда, выступает за то, чтобы начинать с чего-то настолько малого, что это может показаться нелепым.
В своей книге Крошечные привычки: небольшие изменения, которые меняют все, Фогг (2020) проводит читателей через шаги к долгосрочным изменениям. Одна из ключевых вещей, о которой следует помнить, — сделать привычку как можно проще и привлекательнее. Если это привычка, которую вы хотите сломать, то вы сделаете ее труднее и менее привлекательной.
В нашем примере вы можете начать с выбора одного типа упражнений, которые хотите выполнять. После этого выберите наименьшее действие к этому упражнению. Если вы хотите сделать 100 отжиманий, вы можете начать с одного отжимания от стены, одного отжимания на коленях или одного армейского отжимания. Все, что займет у вас менее 30 секунд, будет работать.
Когда закончите, мысленно дайте себе пять, поставьте галочку в настенном календаре или в приложении на телефоне.
Вознаграждение может быть любым, что вы выберете, но это важная часть изменения привычки.
Часто, когда вы начинаете с малого, вы будете делать больше, но важно то, что все, что вам нужно сделать, это ваш минимум. Если это одно отжимание, отлично! Ты сделал это! Если это надевание кроссовок, круто! Следование этому подходу помогает остановить умственную гимнастику и чувство вины, которые часто сопровождают привычку заниматься спортом.
Эта же методика полезна для самых разных привычек.
Предупреждение: если вы имеете дело с зависимостью, вам стоит подумать о помощи профессионала. Это не мешает вам использовать этот подход, но он может помочь вам справиться с любыми симптомами отмены, которые могут у вас возникнуть, в зависимости от вашей конкретной зависимости.
Взгляд на графики подкрепления
Время вознаграждения важно, так же как и понимание того, насколько быстрым или медленным является ответ и как быстро вознаграждение теряет свою эффективность.
Первое называется скоростью отклика, а второе — скоростью угасания.
Ферстер и Скиннер (цитируется по Schunk, 2016) определили, что существует пять типов подкрепления, и каждый из них по-разному влияет на время отклика и скорость угасания. Schunk (2016) дал объяснение нескольким, но основные схемы подкрепления таковы:
- Непрерывная: Награда за каждое правильное действие
- Фиксированное соотношение: Каждый n-й ответ вознаграждается, и n остается постоянным.
- Фиксированный интервал: Время получения награды фиксировано. Это может происходить после каждого пятого правильного ответа.
- Переменное соотношение: Каждая n-я реакция подкрепляется, но значение колеблется вокруг среднего числа n.
- Переменный интервал: Интервал времени варьируется от экземпляра к экземпляру вокруг некоторого среднего значения.
Если вы хотите, чтобы какое-то поведение сохранялось в обозримом будущем, наиболее эффективным является график с переменным соотношением.
Непредсказуемость поддерживает интерес, а скорость угасания вознаграждения самая низкая. Примерами этого являются игровые автоматы и рыбалка. Незнания того, когда произойдет вознаграждение, обычно достаточно, чтобы заставить человека работать за вознаграждение в течение неопределенного периода времени.
Непрерывное подкрепление (вознаграждение) имеет самую высокую скорость угасания. Интуитивно это имеет смысл, когда объектами являются люди. Мы любим новизну и склонны быстро привыкать к новым вещам. Одна и та же награда, выдаваемая в одно и то же время за одно и то же неоднократно, скучна. Мы также не будем работать усерднее, только достаточно усердно, чтобы получить награду.
Полезные техники для практикующих
Терапевты, консультанты и учителя могут использовать оперантное обусловливание, чтобы помочь клиентам и учащимся лучше управлять своим поведением. Вот несколько предложений:
- Создайте договор, в котором будут определены обязанности и ожидаемое поведение клиента/учащегося, а также действия практикующего врача.
- Сосредоточьтесь на подкреплении, а не на наказании.
- Геймифицируйте процесс.
Интересное видео
PsychCore собрал серию видеороликов об оперантном обусловливании, среди других бихевиористских тем. Вот один из них, объясняющий некоторые основы. Несмотря на то, что вы прочитали всю эту статью, это видео поможет закрепить то, что вы узнали. Различные модальности важны для обучения и удержания.
Если вам интересно узнать больше о классическом обусловливании, на PsychCore также есть видео под названием Обусловливание респондента . В нем кратко обсуждается понятие вымирания.
5 Книг по теме
Доступно несколько учебников, охватывающих как классическое, так и оперантное обусловливание, но если вы ищете практические советы и шаги, не ищите дальше этих пяти книг.
1.
Наука и поведение человека – Б. Ф. Скиннер
Если ваша цель – получить лучшее, чем обычно, понимание человеческого поведения, эта книга – для вас.
Его часто назначают для курсовой работы по прикладному анализу поведения, области, основанной на бихевиористских принципах.
Доступно на Amazon.
2.
Атомарные привычки: простой и проверенный способ выработать хорошие привычки и избавиться от плохих – Джеймс Клир
использовать.
Джеймс Клир начал свое путешествие по формированию привычек, экспериментируя со своими собственными привычками.
Одним из интересных дополнений является его пересмотренная версия петли привычки, которая явно включает «тягу». Его версия: сигнал > тяга > реакция > награда. Совет Клира начинать с малого аналогичен подходу Фогга и Маурера.
Доступно на Amazon.
3.
Сила привычки: почему мы делаем то, что делаем в жизни и бизнесе – Чарльз Дахигг
Возможно, книга, которая сделала петлю привычки реальной для каждого неученого, Сила привычки занимательная и практично.
Дахигг приводит несколько примеров предприятий, которые поняли, как использовать привычки для достижения успеха, а затем рассказывает, как это может сделать и обычный человек.
Доступно на Amazon.
4.
Крошечные привычки: небольшие изменения, которые меняют все – Би Джей Фогг
Фогг увлечен формированием привычек, и он точно понял, как это сделать.
Исследователь из Стэнфорда работает с крупными и малыми предприятиями, а также с частными лицами.
Вы узнаете о мотивации, способностях и подсказках (MAP) и о том, как использовать MAP для создания устойчивых привычек. Его пошаговое руководство ясно и лаконично, хотя и требует некоторого начального планирования.
Доступно на Amazon.
5.
Один маленький шаг может изменить вашу жизнь: путь кайдзен – Роберт Маурер
Если вы хотите преодолеть страх и прокрастинацию, то эта книга – отправная точка вашего пути. Маурер представляет и объясняет Кайдзен, японскую концепцию, направленную на постоянное совершенствование.
Он разбирает основные страхи людей и объясняет, почему мы откладываем дела на потом. Затем он делится семью маленькими шагами, которые направят нас на новый путь к формированию полезных привычек.
Доступно на Amazon.
Если вы знаете замечательную книгу, которую мы должны добавить в этот список, оставьте ее название в разделе комментариев.
Важная информация
Оперантное и классическое обусловливание — это два способа обучения животных и людей. Если вы хотите тренировать простой стимул/реакцию, то последний подход наиболее эффективен. Если вы собираетесь выработать, изменить или сломать привычку, тогда вам подойдет оперантное обусловливание.
Оперантное обусловливание особенно полезно в образовательной и рабочей среде, но если вы понимаете основные принципы, вы можете использовать их для достижения своих личных привычек.
Подкрепления и графики подкрепления имеют решающее значение для успешного использования оперантного обусловливания.
Положительное и отрицательное наказание уменьшает нежелательное поведение, но его последствия недолговечны и могут причинить вред. Положительные и отрицательные подкрепления усиливают желаемое поведение и обычно являются лучшим подходом.
Как вы используете оперантное обусловливание, чтобы добиться устойчивых изменений в своей жизни?
Надеемся, вам понравилась эта статья. Не забудьте бесплатно скачать три наших упражнения по позитивной психологии.
- Американская психиатрическая ассоциация (без даты). Что такое обсессивно-компульсивное расстройство? Получено 26 января 2020 г. с https://www.psychiatry.org/patients-families/ocd/what-is-obsessive-compulsive-disorder
- Клир, Дж. (2018). Атомарные привычки: простой и проверенный способ выработать хорошие привычки и избавиться от плохих s. Эйвери.
- Дахигг, К. (2014). Сила привычки: почему мы делаем то, что делаем в жизни и бизнесе. Рэндом Хаус Торговля в мягкой обложке.
- Фогг, Би Джей (2020).
Крошечные привычки: небольшие изменения, которые меняют все . Хоутон Миффлин Харкорт.
- Кумар, Д., Синха, Н., Датта, А., и Лахири, У. (2019). Система тренировки баланса на основе виртуальной реальности, дополненная парадигмой оперантного обусловливания. BioMedical Engineering OnLine, 18 , 90.
- Маурер, Р. (2014). Один маленький шаг может изменить вашу жизнь: путь кайдзен. Рабочий.
- PsychCore (2018, 9 сентября). Нас спросили об эффектах обобщения ответов [видео]. YouTube. https://youtu.be/9U5xylxV0AE
- PsychCore (2016, 28 октября). Продолжение оперантного обусловливания [Видео]. YouTube. https://youtu.be/_JDalbCTpVc
- Шунк, Д. (2016). Теории обучения: образовательная перспектива . Пирсон.
- Скиннер, Б. Ф. (1991). Поведение организмов: экспериментальный анализ. Копли.
- Скиннер, Б. Ф. (1953). Наука и поведение человека . Макмиллан.
- Стангор, К.
, и Валинга, Дж. (2014). Введение в психологию (1-е канадское изд.). Открытое издание кампуса Британской Колумбии. Получено 27 января 2020 г. с https://opentextbc.ca/introductiontopsychology/
.
.
Что такое оперантное обусловливание? (и как это объясняет вождение собаки?)
Хотя вождение автомобиля является второй натурой для многих из нас, на самом деле это довольно сложный процесс. В самой упрощённой версии сначала садишься за руль, потом заводишь двигатель, потом включаешь передачу, а потом надо одновременно рулить, удерживая ногу на педали газа. Это не включает в себя такие вещи, как регулировка зеркал, проверка того, что вы не будете врезаться в другого человека или машину и так далее.
В каком-то смысле невероятно впечатляет тот факт, что три собаки в Новой Зеландии научились — довольно элементарным образом — водить машину. Они садятся на место водителя, включают передачу, управляют рулем и нажимают на педаль газа. Однако настоящей похвалы заслуживают не собаки, а люди-дрессировщики за их впечатляющее терпение и целеустремленность.
Обучение, которое привело лучшего друга человека к управлению автомобилем, ничем не отличается от обучения на выставках птиц, которые проходят в зоопарках по всему миру, или на выставках дельфинов, косаток, тюленей или морских львов, которые вы можете см. в Морском мире. Это тот же вид обучения, который ученые используют для исследования эмоциональной и когнитивной жизни крыс, мышей и других существ, населяющих их лаборатории. В конце концов, все сводится к форме обучения, впервые описанной Эдвардом Л. Торндайком в начале XIX века.00s, который позже был расширен и популяризирован Б. Ф. Скиннером и преподавался каждому студенту вводной психологии: оперантное обусловливание .
Что такое оперантное обусловливание?
В то время как классическое обусловливание является формой обучения, которая связывает внешние стимулы с рефлекторными, непроизвольными реакциями, оперантное обусловливание включает произвольное поведение и поддерживается с течением времени последствиями, которые следуют за этим поведением.
В одном эксперименте Скиннер поместил голубей по отдельности в экспериментальные камеры (иногда называемые «ящиками Скиннера»), которые были предназначены для доставки пищевых вознаграждений через систематические промежутки времени. Он обнаружил, что, поощряя птицу после того, как она продемонстрировала желаемое поведение, он мог мотивировать птицу увеличить частоту этого конкретного поведения.
Инструменты, используемые в оперантном обусловливании, известны как положительное и отрицательное подкрепление, а также положительное и отрицательное наказание.
Итак, в чем разница между положительным подкреплением и отрицательным наказанием? Отрицательное подкрепление? Положительное наказание? ПОМОЩЬ!
Не один студент, изучающий психологию, был сбит с толку различиями между положительным и отрицательным, между подкреплением и наказанием. Вот три (с половиной) вещи, которые вам нужно знать:
1. Поощрение используется для поддержания или усиления желаемого поведения, а наказание используется для ослабления или устранения поведения.
(Скиннер утверждал, что подкрепление более эффективно, чем наказание в изменении поведения.)
2. Положительный предполагает введение или добавление стимула к ситуации. Отрицательный означает, что стимул снят или удален.
3. Если стимул доставляет удовольствие или вознаграждает, в учебниках по психологии он может называться «аппетитным». Если стимул невознаграждающий или нежелательный, его можно назвать «аверсивным».
3а. Положительное подкрепление и отрицательное наказание включают стимулы аппетита. Положительное наказание и отрицательное подкрепление включали аверсивные стимулы.
Многие студенты думают о самих стимулах как о положительных или отрицательных, и здесь все запутывается. Скажи это вместе со мной: положительное и отрицательное относятся к добавлению или удалению раздражителя, а не к самому раздражителю.
Положительное поощрение может включать в себя вознаграждение ребенка конфетами, чтобы поощрить его за хорошую игру со своим братом.
Конфеты — это стимул для аппетита, который используется для усиления или поддержания желаемого поведения.
Если ребенок плохо себя ведет, его права на просмотр телевидения могут быть аннулированы. Это негативное наказание , потому что вы убрали стимулирующий аппетит (ТВ), чтобы устранить нежелательное поведение.
Если ребенок продолжает плохо себя вести, родитель может накричать на него или на нее; это составило бы положительное наказание . Он включает в себя применение аверсивного стимула (крик) для устранения нежелательного поведения.
Наконец, расстроенный родитель может договориться со своим непослушным ребенком, предложив сократить объем работы по дому, которую он или она должны выполнять на этой неделе, в обмен на желаемое поведение. это форма отрицательное подкрепление , поскольку неприятный стимул (хлопоты) удаляется в целях повышения хорошего поведения.
Но подождите, есть еще
Когда дело доходит до дрессировки животных (а иногда и людей), подкрепление доставляется в соответствии с заранее определенным графиком.
Если стимул доставляется после определенного количества ответов, он считается графиком с фиксированным соотношением . Например, голубь может получать награду в виде еды после каждого десятого нажатия на кнопку. Голубь узнает, что для получения награды требуется десять нажатий кнопок.
Если количество ответов, необходимых для получения стимула, варьируется, то вы используете график с переменным соотношением . Лучшим примером для этого является игровой автомат, который имеет фиксированную вероятность получения вознаграждения с течением времени, но переменное количество рывков между вознаграждениями. Неудивительно, что схемы подкрепления с переменным соотношением являются наиболее эффективными для быстрого установления и поддержания желаемого поведения.
Если стимул дается через определенное время, независимо от количества ответов, то вы получаете фиксированный интервал расписание. Независимо от того, сколько раз голубь клюет кнопку, он получает только одну награду каждые десять минут.
Это наименее эффективный график подкрепления.
Наконец, если стимул дается через переменное количество времени, у вас есть график с переменным интервалом . Стимул может применяться каждую неделю в среднем , что означает, что иногда это происходит чаще, чем один раз в неделю, а иногда и реже. Популярные викторины — самый известный пример графиков подкрепления с переменным интервалом, поскольку точное время, в которое они происходят, непредсказуемо. Искомая реакция в данном случае — учеба.
В целом, пропорциональные графики более эффективны для изменения поведения, чем интервальные графики, а переменные графики более эффективны, чем фиксированные графики.
Собираем все воедино
Скиннер извлек уроки, извлеченные из своих ранних экспериментов с голубями, и продолжил разработку методов получения более сложных форм поведения путем разделения их на сегменты, каждый из которых затем можно было индивидуально обусловливать. Это называется цепью и служит основой для обучения собак вождению автомобилей.
Бихевиористы, которые работали с ездовыми собаками, сначала научили их управлять рычагом, затем использовать рулевое колесо для регулировки направления движущейся тележки, а затем нажимать или выжимать педаль, чтобы ускорить или замедлить тележку. По мере того как каждая собака осваивала каждый шаг, добавлялся дополнительный сегмент до тех пор, пока они не усвоили все целевое поведение. В отличие от голубей, для которых еда — лучшая награда, процесс одомашнивания означает, что собак можно вознаграждать только словесной похвалой (хотя еда определенно помогает).
Как вообще возникает такое неестественное поведение? Используя комбинацию поощрения и наказания, тренер может формировать желаемое поведение, вознаграждая последовательно более близкие значения. Скиннер правильно назвал этот процесс формированием . В 1953 году Скиннер описал это так (выделено мной):
Мы впервые даем птице корм, когда она слегка поворачивается в сторону пятна из любой части клетки.
Это увеличивает частоту такого поведения. Затем мы удерживаем подкрепление до тех пор, пока не будет сделано легкое движение в сторону точки. Это снова изменяет общее распределение поведения, не создавая новой единицы. Мы продолжаем подкреплять позиции последовательно ближе к точке, затем подкрепляя только тогда, когда голова немного выдвинута вперед, и, наконец, только тогда, когда клюв действительно касается точки. … Первоначальная вероятность ответа в его окончательном виде очень мала; в некоторых случаях он может быть даже равен нулю. Таким образом, мы можем строить сложные операнты, которые иначе никогда бы не появились в репертуаре организма. Подкрепляя серию последовательных приближений, мы доводим редкий ответ до очень высокой вероятности за короткое время. … Совокупный акт поворота к точке из любой точки ящика, движения к ней, поднятия головы и удара по точке может показаться функционально последовательной единицей поведения; но он строится в результате непрерывного процесса дифференцированного подкрепления недифференцированного поведения, подобно тому, как скульптор лепит свою фигуру из куска глины.
Таким же образом можно научить собак танцевать сальсу:
Или способ, которым эта мышь была обучена преодолевать полосу препятствий:
Или эта курица:
Или эта коза:
используется многими для дрессировки собак, сочетает в себе классическое и оперантное обусловливание. Классическое обусловливание используется для превращения щелкающего звука в условный стимул, который затем используется для положительного подкрепления в оперантном обусловливании.
Оперантное обусловливание в дикой природе
Уже упоминалось несколько реальных примеров оперантного обусловливания: поощрение ребенка за хорошее поведение или наказание ребенка за плохое поведение, игровые автоматы и популярные викторины.
В зоопарках и других учреждениях для животных смотрители используют оперантное обусловливание, чтобы научить животных перемещаться между различными частями их вольеров, предъявлять части тела для осмотра или обеспечивать безопасное проведение ветеринарных осмотров.
Оперантное обусловливание также может объяснить, почему некоторые животные зоопарка демонстрируют стереотипии или повторяющееся поведение. Чтобы понять, как это работает, вернемся к голубям Скиннера. В одном из экспериментов Скиннер поместил птиц в их коробки и установил, что вознаграждение в виде еды будет доставляться с систематическим интервалом 90 184 независимо от поведения птиц 90 185 . У голубей развилось то, что Скиннер назвал «суеверным поведением», в результате случайного сопоставления их явного поведения и представления пищевого вознаграждения. Один голубь повернулся в клетке против часовой стрелки незадолго до вручения награды, в результате чего голубь узнал связь между поворотом против часовой стрелки и едой.
Голубь крутился вокруг да около в ожидании награды. Другой сунул голову в угол клетки, чтобы добыть пищу. Две птицы покачали головами слева направо, а еще одна птица была приучена клевать — почти, но не совсем касаясь — пола.
Стереотипное поведение животных, содержащихся в неволе, может быть вызвано рядом причин, но большую их часть можно объяснить случайным оперантным обусловливанием. Действительно, наиболее распространенной формой стереотипного поведения у животных в зоопарке является хождение взад-вперед в сочетании со стереотипными моделями плавания, за которыми следуют различные формы покачивания или кивания головой. К счастью, принципы оперантного обусловливания также можно использовать для решения подобных проблем.
Можете ли вы привести другие реальные примеры оперантного обусловливания? Оставляйте их в комментариях!
Скиннер Б. Ф. (1948). «Суеверие» у голубя., Журнал экспериментальной психологии, 38 (2) 168–172. DOI: 10.1037/h0055873
Шайн А.
(2006). Метааналитический обзор влияния обогащения на стереотипное поведение млекопитающих в зоопарках, Zoo Biology, 25 (4) 317-337. DOI: 10.1002/zoo.20091
Связанный:
Что такое классическая обусловленность? (И почему это имеет значение?)
Выраженные взгляды принадлежат автору (авторам) и не обязательно совпадают с мнением Scientific American.
ОБ АВТОРАХ
- Положительное подкрепление
- Отрицательное подкрепление
- Наказание
- Угасание
- График непрерывного подкрепления (обычно сокращенно CRF) обеспечивает подкрепление для всех отмеченных моделей поведения. То есть каждый раз, когда поведение происходит, обеспечивается подкрепление.
- График прерывистого подкрепления (обычно сокращенно INT) подкрепляет некоторые целевые модели поведения, но не все из них.
Думайте об этом как об игровом автомате. Вы не будете выигрывать при каждом нажатии на рычаг, но иногда вы выигрываете, и это усиливает поведение при нажатии на рычаг.
- Многие люди дрессируют своих питомцев с помощью положительного подкрепления. Похвала питомца или предоставление лакомства, когда он подчиняется инструкциям, например, когда ему говорят сесть или присесть, помогают животному понять, чего от него хотят, и побуждают его выполнять будущие команды.
- Когда ребенка хвалят за выполнение работы без жалоб, например за уборку в комнате, он, скорее всего, продолжит выполнять эту работу в будущем.
- Когда работник получает бонус за выдающиеся показатели продаж, он склонен продолжать работать на высоком уровне в надежде получить еще один бонус в будущем.
- Работодатель предлагает работнику выходной — пример отрицательного подкрепления. Вместо того, чтобы давать ощутимое вознаграждение, они уменьшают присутствие чего-то нежелательного; то есть количество времени, проведенного на работе.
- В каком-то смысле маленькие дети обусловливают своих родителей отрицательным подкреплением. Крики, истерики и другие проявления «отыгрывания» обычно предназначены для того, чтобы привлечь внимание родителей. Когда родитель ведет себя так, как хочет ребенок, неприятное состояние — крик и плач — прекращается. Это отрицательное подкрепление.
- Негативное подкрепление распространено в системе правосудия. Тюрьмы иногда смягчают правила для хорошо ведущего себя заключенного, а приговоры иногда сокращают за хорошее поведение.
Последнее, в частности, представляет собой классическое негативное подкрепление: удаление чего-то нежелательного (дней в тюрьме) в ответ на данное поведение.
- Сотруднику, пропустившему работу, может быть сокращена заработная плата. Потеря дохода (нежелательное последствие) является наказанием за пропуск работы (нежелательное поведение).
- Резкое «Нет!» адресованное питомцу, проявляющему недопустимое поведение, является классическим примером наказания. Крик наказывает питомца, заставляя его избегать неправильного поведения в будущем.
- Наказания обычно используются в лабораторных экспериментах. Чаще всего за определенное поведение лабораторное животное наказывают легким электрошоком.
- Сотрудник, которого однажды наказали за пропуск работы, а затем никогда больше, может впоследствии с большей вероятностью пропустить работу, потому что он больше не ожидает наказания за отсутствие.
- Животные часто проверяют пределы своей физической подготовки. Например, кошка, которую наказывают пульверизатором каждый раз, когда она взбирается на прилавок, может приблизиться к прилавку или прыгнуть на прилавок, когда считает, что вокруг никого нет. Если наказания не происходит, кошка, скорее всего, будет продолжать прыгать на прилавок, потому что обусловливание, направленное против нее, исчезнет.
- В школе, если учащийся получает золотую звезду за отличный результат теста, но не получает больше золотых звезд в последующих тестах, он может потерять мотивацию к хорошей успеваемости в будущих тестах. Оперантное обусловливание положительного поведения (хорошее выполнение теста) угасает.
- Классическое обусловливание
- Закон эффекта и оперантное обусловливание
- Оперативное обусловливание
- 24 Примеры оперантного кондиционирования
- Графики подкрепления
- Родитель дает ребенку дополнительное пособие (поощрение) за мытье посуды (желаемое поведение)
- Менеджер предлагает бонусы (поощрение) своим работникам за своевременное завершение проекта (желаемое поведение).
- Учитель дает учащимся золотые звезды (поощрение) за то, что они поднимают руки перед тем, как говорить (хорошее поведение).
- Вы получаете аплодисменты публики (подкрепление) после игры на фортепиано (желаемое поведение) на сольном концерте.
- Маленькие дети гладят собаку по голове (поощрение), когда она спокойно сидит перед ними (желаемое поведение).0011
- Ребенку не нужно убирать со стола (неприятное событие) после еды, если он съел свой овощ (желаемое поведение.)
- Вынос мусора (желаемое поведение) убирает гнилой запах (неприятный раздражитель) на кухне.
- Чистка зубов (желаемое поведение) предотвращает кариес (неприятное событие).0011
- Подросток убирает в своей комнате (желаемое поведение), чтобы у него не отобрали телефон (неприятное событие). )
- Родитель поручает ребенку дополнительную работу (неприятные последствия) за то, что он слишком много играет в видеоигры (плохое поведение).
(нежелательное поведение.)
- Родители шлепают детей (неприятный раздражитель) за пропуск занятий (нежелательное поведение).
- Ребенка ругают (неприятное событие) за игнорирование домашнего задания (нежелательное поведение).
- Родитель дает ребенку тайм-аут (неприятное последствие) за истерики (нежелательное поведение.)
- Полиция выписывает водителю штраф (неприятный раздражитель) за превышение скорости (нежелательное поведение.)
- Родитель отбирает у ребенка телефон (приятный раздражитель) за смотреть слишком много видео (плохое поведение)
- Полиция лишает водительских прав (приятный стимул) за безрассудное вождение (нежелательное поведение). приятный стимул) за пропуск комендантского часа (плохое поведение.)
- Мальчик теряет время на планшете (приятный стимул) за издевательства над другими в школе (нежелательное поведение.)
- Воры лишаются свободы (приятный стимул) за воровство (плохое поведение.
)
Джейсон Г. Голдман — научный журналист из Лос-Анджелеса. Он писал о поведении животных, биологии дикой природы, охране природы и экологии для журналов Scientific American , Los Angeles , Washington Post , Guardian , BBC, журнала Conservation и других источников. Он участвует в подкасте Scientific American «60-Second Science» и является соредактором Ведение научных блогов: основное руководство (издательство Йельского университета). Ему нравится делиться своими знаниями о дикой природе по телевидению и по радио, и он часто говорит с общественностью о дикой природе и научном общении.
Подписывайтесь на Джейсона Г. Голдмана в Твиттере
Наука об оперантном обучении
Тренировка с положительным подкреплением включает в себя вознаграждение вашей собаки за то, что она делает правильно. Наградой может быть игрушка, игра или угощение — все, ради чего ваша собака хочет работать. Для некоторых людей это звучит как взятка, а не дрессировка, и они хотят, чтобы их собака слушалась только потому, что они должны. Но тренинг с положительным подкреплением — это не взятка и не уловка. Он основан на науке об обучении животных и невероятно эффективен.
Что такое оперантное обусловливание?
Возможно, вы слышали о Павлове и его собаках. Когда прозвенел звонок к обеду, у собак потекла слюна. Они научились ассоциировать колокольчик с приближающейся едой, поэтому еще до того, как их еда была доставлена, они пускали слюни от предвкушения. Это явление известно как классическое обусловливание или ассоциативное обучение. Это случается с вашей собакой все время.
Например, когда звонит ваш дверной звонок, ваша собака волнуется, потому что она ожидает посетителя на крыльце. Они научились ассоциировать звон колокольчика с людьми за дверью.
Но классическое обусловливание происходит непроизвольно. А как насчет всех активных тренировок, которые вы проводите со своей собакой? Вот где вступает в действие оперантное обусловливание. Также известное как обучение методом проб и ошибок, это когда собаки учатся связывать свое поведение с его последствиями. А собаки увеличивают частоту поведения с приятными последствиями и снижают частоту поведения с неприятными последствиями. Итак, если ваша собака лает на вас, пока вы разговариваете по телефону, и вы даете ей кость, чтобы заставить ее замолчать, ваша собака, скорее всего, будет лаять снова в следующий раз, когда вы ответите на звонок. Кость была приятным следствием. Или, если ваша собака беспокоит кошку, а кошка чешет нос, они дважды подумают, прежде чем беспокоить кошку в будущем. Царапина была неприятным последствием.
Четыре квадранта оперантного обусловливания
Поскольку поведение определяется последствиями, дрессировка заключается в том, чтобы контролировать последствия действий вашей собаки, чтобы влиять на поведение, которое она выбирает для выражения. Но как именно это работает? Итак, оперантное обусловливание работает в двух разных измерениях. Во-первых, добавляете ли вы что-то или удаляете что-то. Например, если вы даете своей собаке лакомство, вы что-то добавляете. Это известно как позитив. Если вы убираете игрушку, вы что-то убираете. Это известно как негатив. Не думайте об этом с точки зрения хорошего или плохого, просто сложения или вычитания.
Второе измерение заключается в том, увеличивает ли последствие частоту поведения или уменьшает ее. Это известно как подкрепление (все, что делает поведение более вероятным) и наказание (все, что делает поведение менее вероятным). Опять же, не думайте о хорошем или плохом, а просто о том, становится ли данное поведение более или менее распространенным.
Эти два измерения в совокупности образуют четыре квадранта оперантного обусловливания. И вы можете использовать эти квадранты, чтобы повлиять на поведение вашей собаки.
Положительное подкрепление
Первый квадрант — это то, на чем вы должны сосредоточиться в своем обучении: положительное подкрепление. Помните, что позитив означает добавить что-то, а подкрепление означает усиление поведения. Давая вашей собаке что-то, что она любит (положительное), когда она сидит, она будет сидеть чаще в будущем (подкрепление). Это также называется вознаграждением вашей собаки.
Положительное наказание
Второй квадрант известен как положительное наказание. Хотя это наказание в известном смысле, помните, что эти термины означают на научном жаргоне. Вы добавляете что-то, что собаке не нравится (положительное), например шлепок по заднице, чтобы снизить вероятность повторения такого поведения в будущем (наказание).
Отрицательное подкрепление
Третий квадрант называется отрицательным подкреплением.
В этом случае вы убираете что-то неприятное, чтобы сделать поведение более частым. Это кажется нелогичным. Но вы, вероятно, все время предпринимаете действия, чтобы избежать плохих вещей, например, убираетесь на кухне, чтобы ваш супруг перестал придираться. С собаками подумайте о том, чтобы натянуть удушающую цепочку, когда собака не делает то, что вы хотите. Если вы ослабите давление (отрицательное), как только ваша собака подчинится, она с большей вероятностью сделает то, что вы хотите, в следующий раз (подкрепление).
Отрицательное наказание
Последний квадрант называется отрицательным наказанием и должен быть вторым вариантом в вашем поясе с тренировочными инструментами. В этом случае вы удаляете что-то, что нравится вашей собаке (негатив), чтобы уменьшить частоту поведения (наказание). Подумайте об игнорировании вашей собаки, когда она прыгает на вас. Вы убираете свое внимание, то, чего хочет ваша собака, чтобы отбить у нее охоту прыгать в будущем.
Сосредоточьтесь на положительном подкреплении
Хотя собаки одинаково учатся во всех четырех секторах, вы не хотите использовать их все одинаково.
На самом деле тренеры по положительному подкреплению сосредотачиваются только на двух квадрантах: положительном подкреплении и отрицательном наказании. Это означает, что они имеют дело с вещами, которые нужны собакам, такими как угощения, игры или внимание, и они в основном доставляют их или иногда забирают. Они не используют неприятные вещи, которые собаки находят отталкивающими, как вы бы использовали с положительным наказанием или отрицательным подкреплением.
Исчезло использование аверсивов. Благодаря непроизвольному усвоению классического обусловливания собаки, обученные неприятным действиям, часто связывают эти аверсивные действия с дрессировщиком и тренировочным процессом. Эти собаки не хотят учиться, они не хотят пробовать что-то новое, и их связь с хозяином разрушается.
Однако сосредоточенность на поощрении не только влияет на поведение собаки, но и учит собак любить дрессировку. Положительное подкрепление — это получение хороших вещей. Не боясь сделать что-то не так, ваша собака может стать активным участником процесса дрессировки.
Они начнут пробовать что-то новое, много умственных упражнений и будут активно искать способы заработать вознаграждение. Кроме того, вместо того, чтобы просто узнать, чего не следует делать, они узнают, что вы ожидаете в каждой ситуации. Наконец, из-за классического обусловливания ваша собака будет ассоциировать вас с замечательными наградами, которые вы даете, что укрепляет вашу связь. И это ли не прекрасный способ воспользоваться преимуществами науки.
Примеры оперантного обусловливания
Оперантное обусловливание — это процесс обучения, при котором преднамеренное поведение подкрепляется последствиями. Он отличается от классического обусловливания, также называемого респондентным или павловским обусловливанием, при котором непроизвольное поведение вызывается внешними раздражителями.
Собака получает лакомство за то, что сидит, как примеры оперантного обусловливания
При классическом обусловливании собака, которая выучила звук колокольчика до поступления еды, может начать выделять слюну при звуке колокольчика, даже если еда не поступает.
Напротив, собака может понять, что, сидя и оставаясь, она получает лакомство. Если собака затем лучше сидит и остается, чтобы получить лакомство, то это пример оперантного обусловливания.
Реклама
Оперантное обусловливание и синхронизация
Основная концепция оперантного обусловливания проста: когда определенное преднамеренное поведение подкрепляется, это поведение становится более распространенным. Психология делит подкрепление на четыре основные категории:
Время и частота очень важны для подкрепления.
Примеры положительного подкрепления
Положительное подкрепление описывает наиболее известные примеры оперантного обусловливания: получение вознаграждения за определенные действия.
Примеры отрицательного подкрепления
Отрицательное подкрепление — это другая, но столь же простая форма оперантного обусловливания. Отрицательное подкрепление вознаграждает поведение, удаляя неприятный стимул, а не добавляя приятный.
Реклама
Примеры наказания
В психологии наказание не обязательно означает то, что оно означает при обычном использовании. Психология определяет наказание как нечто, совершаемое после определенного преднамеренного действия, которое снижает вероятность того, что это действие произойдет в будущем. В то время как подкрепление предназначено для поощрения определенного поведения, наказание предназначено для предотвращения определенного поведения.
Наряду с примерами положительного и отрицательного подкрепления существуют также примеры положительного наказания (подобного приведенным выше) и отрицательного наказания. При последнем устраняется положительная ситуация при выполнении нежелательного поведения. Например, родитель может отобрать любимую игрушку у непослушного ребенка.
Примеры угашения
Психология определяет угасание как потерю условного рефлекса с течением времени, когда кондиционирующие стимулы больше не присутствуют. Со временем животное (или человек) станет менее обусловленным, если стимулы, которые его обусловили, не будут повторно применены.
Реклама
Б. Ф. Скиннер и обусловливание
Берхус Фредерик Скиннер был психологом и исследователем, которому приписывают установление принципов оперантного обусловливания. Б. Ф. Скиннер начал с закона эффекта Торндайка, который гласит, что поведение, приводящее к удовлетворительным результатам, будет повторяться.
Скиннер считал удовлетворение недостаточно конкретным для измерения и намеревался разработать средства измерения усвоенного поведения.
Камера для оперантного кондиционирования, широко известная как ящик Скиннера, была его решением. Он держал своих подопытных, прежде всего голубей и крыс, в условиях, которые позволяли ему внимательно наблюдать за их поведением. Он изолировал животное, и каждый раз, когда животное выполняло определенное поведение, например, нажимало на рычаг, оно вознаграждалось едой. Когда животное начнет надежно нажимать на рычаг, он поймет, что оно обработано.
Работа Скиннера взяла этот первый принцип и применила его к человеческому поведению, представив школу психологии, называемую бихевиоризмом. Бихевиоризм определил большую часть психологии во второй половине 20-го века, но в настоящее время он сочетается с другими психологическими точками зрения.
Оперантное обусловливание и вы
Говорить о человеческом поведении на языке клинической психологии может быть неудобно.
Тем не менее, оперантное обусловливание описывает простое явление, которое происходит во всех сферах жизни. Это всего лишь один из механизмов, с помощью которых люди учатся. Очень важно понять, как работает этот механизм, чтобы убедиться, что он работает лучше всего для вас.
Чтобы узнать больше о науке обусловливания, ознакомьтесь с нашей статьей «Примеры бихевиоризма». Это школа психологии, которая фокусируется на наблюдаемом поведении, а не на эмоциях или мотивах, чтобы объяснить, как и почему люди делают то, что они делают.
24 Примеры оперантного обусловливания в повседневной жизни
Содержание
Оперантное обусловливание , также известное как инструментальное обусловливание, представляет собой процесс обучения, в котором поведение изменяется с помощью поощрений или наказаний.
При многократном сочетании желаемого поведения с последствиями формируется ассоциация для создания нового обучения.
Напр. дрессировщик дает своей собаке лакомство каждый раз, когда собака поднимает левую лапу. Собака узнает, что поднятие левой лапы может принести ей пищевое вознаграждение. Он будет снова и снова поднимать лапу, чтобы получить больше лакомства.
Классическое обусловливание как основа бихевиоризма
Мы можем проследить происхождение оперантного обусловливания до его предшественника, классического обусловливания.
Классическое обусловливание, также известное как обусловливание по Павлову, также включает обучение новому поведению в процессе ассоциации. 2
Русский физиолог Иван Павлов впервые экспериментировал с классическим обусловливанием в конце 1800-х годов. Он заметил, что у его собак выделялась слюна всякий раз, когда он входил в комнату, чтобы их покормить.
В своих экспериментах Павлов звонил в колокольчик каждый раз, когда кормил своих собак.
Со временем собаки научились выделять слюну, когда слышали звук колокольчика, даже когда еды не было.
Пища, способная естественным образом вызвать слюноотделение, является безусловным раздражителем. Звук колокольчика, который начинал вызывать слюноотделение после приема пищи, был условным раздражителем.
Когда безусловный раздражитель (еда) и условный раздражитель (звук) ассоциировались, условный раздражитель мог вызвать одинаковую реакцию. Эта недавно выученная реакция стала условной реакцией. Это форма обучения через ассоциации.
Павловское обусловливание стало основой бихевиоризма, ведущей области психологии того времени. Бихевиористы считают, что поведение — это реакция на внешние стимулы, и люди учатся только через ассоциации, а не через мысли, чувства или внутренние психические события.
Закон эффекта и оперантное обусловливание
Позже психолог Эдвард Торндайк выдвинул концепцию инструментального обусловливания , когда он наблюдал влияние подкрепления в экспериментах с коробкой-головоломкой с кошками, пытающимися сбежать.
Он назвал этот процесс обучением методом проб и ошибок.
Торндайк предложил Закон Эффекта 3 , который гласил, что если при наличии стимула за реакцией следует удовлетворяющее событие (подкрепление), то связь между стимулом и реакцией усиливается. И наоборот, если за ответным стимулирующим событием следовало неудовлетворяющее событие (каратель), связь ослаблялась.
В начале 1900-х годов психолог-бихевиорист Б. Ф. Скиннер, также известный как отец оперантного обусловливания, опираясь на концепции подкрепления и наказания, создал теорию оперантного обусловливания (теория подкрепления).
Скиннер считал, что павловское обусловливание слишком просто, чтобы полностью объяснить сложное человеческое поведение. Он считал, что лучший способ понять оперантное поведение — это наблюдать его причины и последствия 1 .
В парадигме оперантного обусловливания Скиннера наблюдаемым поведением можно манипулировать, если за ним следует подкрепление или наказание.
В отличие от классического обусловливания, которое включает бессознательное рефлекторное поведение, оперантное поведение — это поведение, находящееся под сознательным контролем. Применение подкрепления и наказания создает преднамеренный и сознательный процесс обучения.
Оперантное обусловливание
Для изучения оперантного обусловливания Б. Ф. Скиннер сделал камеру, названную Ящиком Скиннера , и поместил внутрь небольшое животное. В опытах каждый раз, когда животное нажимало на рычаг или планку, оно получало пищу или воду в качестве подкрепления 4 .
Поощрение увеличивает целевое поведение, а наказание снижает его.
С помощью своих экспериментов Скиннер выделил два типа последствий, которые могут повлиять на новое обучение: подкрепление и наказание.
Подкрепление
Существует два типа подкрепления – положительное подкрепление и отрицательное подкрепление.
В психологии под положительным понимается добавление стимула, а под отрицательным — удаление.
Положительное подкрепление добавляет вознаграждающее последствие в качестве положительного подкрепления к поведению, тем самым усиливая или увеличивая вероятность того, что желаемое поведение появится снова.
Отрицательное подкрепление устраняет неприятный стимул для усиления желаемого поведения в будущем.
Наказание
Наказание противоположно подкреплению. Он направлен на снижение плохого поведения.
Как и поощрение, наказание бывает двух видов: положительное наказание и отрицательное наказание.
Положительное наказание добавляет неприятный стимул, чтобы ослабить или устранить поведение. Позитивное наказание — это обычно то, что мы называем «наказанием» в повседневной жизни.
Негативное наказание удаляет приятный стимул, чтобы остановить нежелательное поведение.
24 Примеры оперантного обусловливания
Вот примеры различных типов оперантного обусловливания.
Пример положительного подкрепления
Пример отрицательного подкрепления
Пример положительного наказания
Пример отрицательного наказания
Использование оперантного обусловливания широко распространено. Вы можете видеть это повсюду. Его используют родители, учителя, компании и правительство.
См. также: Психология формирования
Графики подкрепления — ключевой компонент
Модификация поведения с использованием подкреплений и наказаний требует постоянного применения, чтобы оставаться эффективной. Как только подкрепление или наказание прекращаются, усвоенное поведение постепенно ослабевает и, наконец, исчезает в процессе, называемом угасанием.
Что удивительно даже для Скиннера, так это то, что частота и характер применения подкрепления могут влиять на то, насколько быстро работает подкрепление и насколько устойчивым остается обучение 5 .
Существует два типа графиков подкрепления: графики на основе интервалов и графики соотношений.
Графики на основе интервалов: подкреплений доставляются через определенный период.
Период может быть фиксированным (график с фиксированным интервалом) или переменным (график с переменным интервалом).
Расписания, основанные на соотношении : поощрения доставляются после определенного количества ответов. Количество ответов может быть фиксированным (график с фиксированным соотношением) или переменным (график с переменным соотношением).
Исследования показали, что поведение, усвоенное с помощью графиков с переменным соотношением, является наиболее устойчивым и наименее подверженным исчезновению.
Это важное открытие, потому что теперь мы можем эффективно использовать подкрепление и наказание в различных ситуациях.
при использовании вознаграждений для подкрепления желаемого поведения мы теперь знаем, что должны давать их только изредка (расписание с переменным соотношением).
Когда малыш закатывает истерику на рынке, мы теперь знаем, что ни в коем случае не должны покупать конфеты. Иногда уступая, вы сделаете так, что избавиться от привычки будет гораздо труднее.
Инструментальное научение
31 декабря 2005 г., 21:00
Инструментальное научение, operant conditioning, метод проб и ошибок — простейшая форма оперантного обусловливания. В оперантном поведении подкрепляется спонтанное поведение, а спонтанность бывает как творческая, так и случайная. В инструментальном научении подкрепляется именно случайное поведение, не ища в нем какого-либо творческого разума и поиска. Достаточно, что это поведение нужное нам или находящееся на пути к нужному нам.
Кошка сидит в ящике, что делать не знает, дергается туда или сюда. Когда (чаще всего случайно) она тянула за шнур, ее награждали. Рано или поздно она научалась тянуть за шнур…
Подкрепление производится в простейшей форме, методом наград и наказаний, и научение происходит за счет примитивных форм нервной деятельности, без включения разума.
Другой вариант оперантного обусловливания, его высшая форма — творческое научение, где подкрепляется в первую очередь включение разума, поисковой творческой активности в нужном направлении, для чего используются сложные и творческие методы подкрепления, существенно отличающиеся от простого метода наград и наказаний. См.→
Торндайк
Впервые инструментальное научение как метод проб и ошибок был систематически изучен американским ученым Э.Торндайком (1874-1949), одним из основателей психологии образования. Торндайк помещал кошку в ящик, из которого она могла выйти, только потянув за шнур, свешивавшийся с крышки. После ряда случайных движений кошка рано или поздно тянула за шнур, обычно совершенно случайно. Однако, когда ее снова помещали в ящик, она уже тратила меньше времени на то, чтобы снова потянуть за шнур, и при повторении ситуации освобождалась из ящика мгновенно. Научение измерялось в секундах, которые требовались кошке для того, чтобы совершить правильное действие.
Скиннер
Другой пример инструментального обучения — метод, предложенный американским психологом Б.Скиннером (1904-1990). «Ящик Скиннера» представляет собой тесную клетку с рычагом в одной из стенок; цель эксперимента — научить животное, обычно крысу или голубя, нажимать на этот рычаг. Животное до начала обучения лишают пищи, а рычаг соединяют с механизмом подачи еды в клетку. Хотя сначала животное не обращает внимания на рычаг, рано или поздно оно нажимает на него и получает пищу. Со временем интервал между нажатиями на рычаг уменьшается: животное научается использовать зависимость между желательной реакцией и кормлением.
Метод подследовательных приближений
Иногда научение определенному поведению оказывается таким долгим или сложным, что животное никогда не смогло бы прийти к нему случайно. Тогда применяется метод «последовательных приближений». Не ожидая выполнения всей требуемой последовательности действий, дрессировщик выдает поощрение за что-то похожее на желательный поведенческий акт. Например, если собаку нужно научить перекатываться, ей сначала дают лакомство просто за то, что она ложится по команде. После того, как первая часть освоена, собака получает поощрение лишь при случайном выполнении нужного движения: например, после того, как ляжет, она перекатится на бок. Шаг за шагом дрессировщик добивается все более близкого соответствия желаемому поведению, по принципу детской игры «холодно — теплее — горячо». В целом, инструментальное научение очень похоже на эту игру, но роль спрятанного предмета выполняет определенный вид поведения, а роль слова «горячо» — поощрение.
Последовательные приближения к желаемому поведению применяются и при лечении тяжелых форм шизофрении, когда единственная цель — побудить пациента двигаться и разговаривать вместо того, чтобы уйти в себя и хранить молчание. Как всегда при инструментальном научении, для успешности метода необходимо найти что-то, чего пациент хочет (например, сладости, жевательную резинку или интересные фотографии). После того как обнаружена хоть какая-то реакция, следует определить, какие аспекты поведения наиболее желательны, и сделать их условием получения вознаграждения.
Инструментальное научение и наказание
Наказание в инструментальном научении используется реже. Наказание, в принципе, тоже формирует зависимость между нежелательным поведением и неприятным воздействием, тоже учит, но:
- наказание учит менее понятно: показывает «что не надо», но оставляет без подкрепления, не показывает «что и как надо»,
- наказание уменьшает контакт между тем кто учит и обучаемым. И животные, и люди из такой ситуации стараются побыстрее убежать.
- Обучение
- Научение
- Автор Н.И. Козлов
Комментарии (2):
Александр, 12 ноября 2015 г., 10:12
Гость, 25 декабря 2020 г., 14:05
Хочется узнать побольше о видах поощрения при научении человека к необходимому поведению. В том числе больного человека. Возможно ли дрессировать самого себя?
Спасибо за статью. Нашла для себя много полезной информации.
Материалы по теме:
01 янв. 2010 г.
Когда два события повторяются с небольшим интервалом, они ассоциируются друг с другом.
31 дек. 2005 г.
Метод проб и ошибок в научении по другому называется инструментальное научение, operant conditioning. Это простейшая форма оперантного обусловливания. В оперантном поведении подкрепляется спонтанное поведение, а спонтанность бывает как творческая, так и случайная. В инструментальном научении подкрепляется именно случайное поведение, не ища в нем какого-либо творческого разума и поиска. Достаточно, что это поведение нужное нам или находящееся на пути к нужному нам.
31 дек. 2005 г.
Последовательное научение — научение, в котором осваивается последовательность поведенческих актов, вербальных или двигательных реакций. Некоторые виды научения требуют выполнения отдельных поведенческих актов, каждый из которых по отдельности осваивается легко, но затем они объединяются в определенную последовательность.