Итак, откуда берутся у животных новые программы реакций, а у человека – новые планы действий и как они усваиваются?
Чтоб ответить на этот вопрос, начнем опять с наиболее простых фактов, относящихся к научению животных. Здесь, где все пружины и механизмы более прозрачны, попробуем разобраться в положении дел. А потом, уже испытанным нами путем, поднимемся к человеку, учитывая, что в нем общее с другими видами, а что существенно отличается.
Впервые интересующий нас процесс начал изучать объективными экспериментальными методами американский психологЭ. Торндайк. Типичный эксперимент Торндайка выглядел следующим образом. Голодную кошку помещают в запертую клетку, перед которой снаружи на виду у кошки стоит пища. В клетке находится рычаг. Если нажать на этот рычаг (пружину), то дверца клетки распахивается. Кошка мечется в клетке. Пытается вырваться на свободу. Наконец, она случайно натыкается на этот рычаг, случайно толкает его, дверца открывается – кошка выскакивает и поедает пищу. Ее снова помещают в клетку – опять повторяется та же история. Но с каждым новым успехом у кошки все чаще наблюдаются реакции, ведущие к цели, и все реже – бесполезные. В конце концов, после некоторого числа попыток стоит кошку сунуть в клетку, она моментально подбегает к рычагу, толкает его головой или ударяет его спиной или лапой, открывает дверцу и выскакивает к пище.
Торндайк высказал предположение, что этот процесс определяется тремя законами поведения животного. Первый закон он назвалзаконом готовности: для образования навыка в организме должно иметься состояние, толкающее к активности (например, голод). Второй закон Торндайк назвалзаконом упражнения. Этот закон формулируется следующим образом: чем чаще какое-нибудь действие совершается животным, тем вероятнее, что животное повторит это действие, или, иначе говоря, тем чаще он будет выбирать это действие впоследствии. И третий закон– закон эффекта. Он гласит: чаще повторяется то действие, которое дает положительный эффект («награждается»).
Механизм научения с этой точки зрения выглядит следующим образом: помещенное в проблемную ситуацию, т. е. в такую обстановку, где оно должно найти «правильные» действия, животное сначала, толкаемое потребностью (например, голодом), действует случайно, хаотично. В процессе этих хаотических попыток оно наталкивается на такие акты, которые дают решение задачи, т. е. награждаются приятным переживанием, В соответствии с третьим законом, эти действия повторяются чаще. А это, в соответствии со вторым законом, ведет к их закреплению. Действия, которые дают отрицательный эффект или не дают никакого эффекта в результате
постепенно тормозятся и отсеиваются. Так животное постепенно накопляет и закрепляет правильные действия. Вот эту систему правильных действий мы и называем навыком. Животное пробует. Ошибается. Наталкивается на целесообразные реакции. Ошибки отбрасываются, а верные ответы закрепляются. Поэтому указанный путь Торндайк назвал научениемпутем проб и ошибок.
Это уже другое представление о сущности научения. В его основе лежит понятиенаграды. Награда – нечто иное, чем подкрепление в концепции И. П. Павлова. Подкрепление имеет место до появления реакции, награда – после. Подкрепление имеет своим следствием определенную реакцию, а награда сама является следствием определенной реакции. Короче, подкрепление вызывает сами ответные действия. А награда не вызывает этих действий. Она только их санкционирует, одобряет, закрепляет.
В основе такого представления о научении лежит иное понимание поведения. Павловская теория предполагает, что поведение управляется прежде всего сигналами о свойствах внешнего мира, имеющих значение для организма. Торндайковская теория предполагает, что поведение управляется прежде всего собственными егорезультатами для организма.
Биологическую необходимость такого механизма контроля результатов для осуществления целесообразного поведения доказали уже в 30-х годах выдающиеся советские физиологи П. К. Анохин и А. Н. Бернштейн. Они же установили соответствующие физиологические механизмы в центральной нервной системе и показали их роль в формировании физиологических процессов, движений и поведения животных организмов.
Тридцатью годами позже кибернетика доказала, что механизм контроля результатов представляет необходимое условие любого целенаправленного саморегулирующегося процесса, будь то поведение животных, работа автомата, деятельность человека или функционирование общества.