보상·처벌의 올바른 개념과 효과

2019-03-27 09:55:00 손승빈 기자
▲보상 및 처벌은 훈육 시 주로 사용된다(사진=ⓒ게티 이미지)

보상과 처벌의 올바른 개념과 효과가 공개돼 이목이 쏠리고 있다. 

보상과 벌은 동전의 양면과도 같다. 자녀를 훈육하거나 누군가에게 원하는 것을 하게 만들 때 동기 부여를 할 수 있는 외부적인 요인이기도 하다. 그리고 벌은 행동을 중단하게 하지만 보상은 행동을 권장하는 작용을 한다. 

사람들은 누군가에게 행동을 강요할 목적으로 처벌 방법을 사용하고 있다. 그러나 처벌은 통제할 수 없게 될 수 있고 제대로 기능하지 않을 수 있으며 사기를 저하할 수도 있다. 반면, 내재성 동기 부여는 열망을 통해 내면 깊숙한 곳에서 동기를 부여하게 만들 수 있다.

내재성 동기 부여가 중요하다는 것을 알고 있는 수많은 지도자의 문제점은 내재성 동기 부여가 어렵고 더 많은 시간과 기술을 필요로 한다는 것이다. 

보상과 처벌은 중요하며 고전적인 훈련에서 연상 학습의 강력한 조절자로 사용할 수 있다. 그러나 단계적 학습에서의 보상 및 처벌의 영향은 알려진 바가 없다.

한편, ‘조작적 조건형성’이란 보상과 처벌의 형태를 통해 발생하는 학습방법이다. 이 조작적 조건형성은 교실이나 치료 과정, 심지어 집 안에서 벌어지는 일상처럼 매일 자연스러운 환경 속에서 발생하기 때문에 개인의 삶에서 중요한 역할을 한다.

행동주의 심리학자 B.F. 스키너는 조작적 조건형성을 정의한 인물이다. 스키너는 사람의 행동을 설명하기 위해 내면의 생각과 동기 부여에 중점을 두는 것은 중요하지 않다고 생각했다. 

그리고 대부분의 심리학자는 사람의 행동 이유는 외부 원인을 조사해야 한다고 주장했다. 한편, 존 B. 왓슨은 사람은 특별한 성장 배경과 성격에 관계없이 훈련받을 수 있다며 고전적 조건형성을 주장했다.

조작적 조건형성

B.F. 스키너는 “생물에 영향을 미치는 특별한 종류의 자극이 있으며 살아있는 생물의 행동은 영향과 결과로 나타난다”며 “그리고 사람은 벌을 받게 만든 행동을 다시 반복하려 하지 않기 때문에 벌에 대한 반응은 부정적이게 된다”고 설명했다. 

스키너의 이런 연구는 고전적 조건형성이 지나치게 단순해서 복잡한 인간의 행동을 설명할 수 없다는 관점에서 출발한 것이다. 스키너는 사람의 행동을 이해할 수 있는 최선의 방법은 행동의 원인과 결과를 조사하는 것이라고 믿었다.

스키너의 조작적 조건형성은 ‘손다이크의 효과 법칙’을 토대로 한다. 효과 법칙에 따르면, 기분 좋은 결과 이후 이어지는 행동은 반복적이 될 가능성이 있으며 불쾌한 결과 이후의 행동은 반복의 가능성이 적다. 

그러나 스키너는 강화를 통해 행동이 완전히 없어지거나 약화되는 ‘효과-강화 행동 법칙이라는 새로운 개념을 도입했다.

스키너는 행동으로 이어질 수 있는 세 가지 유형의 반응 또는 작용을 확인했다. 이 세 가지 유형의 반응에는 중립적 작용, 강화 및 처벌이 포함된다. 

중립적 작용이란 반복적인 행동의 가능성을 높이지도 낮추지도 않는 환경에서 발생하는 반응을 말한다. 그리고 강화란 빈번한 행동을 유발하는 반응 결과다. 이때, 강화자는 긍정적일 수도 부정적일 수도 있다. 

한편, 처벌이란 행동을 유발하지 않는 반응 또는 결과다. 강화처럼 처벌도 긍정적 처벌과 부정적 처벌, 두 가지 유형이 있다.

▲처벌은 부정적이거나 긍정적일 수 있다(사진=ⓒ게티 이미지)

강화 계획

조작적 조건형성에서 쥐가 레버를 누른 후 즉각적으로 먹이를 주지 않는다면 쥐는 몇 번의 시도 후 레버를 누르지 않게 된다. 이에 행동주의 심리학자들은 여러 가지 계획 패턴은 학습 및 멸종 속도에 대해 각기 다른 결과를 낼 수 있다는 사실을 발견했다. 

페스터와 스키너는 강화를 전달할 수 있는 여러 가지 방법을 고안했으며 이것이 반응 속도 및 멸종 속도에 영향을 미친다는 사실을 확인했다. 여기에서 반응 속도란 쥐가 레버를 누르는 속도를 말하며, 멸종 속도는 레버를 더 이상 누르지 않는 속도를 의미한다.

스키너는 최저속도의 멸종을 유발하는 강화 유형이 ‘변동 비율 강화’라는 사실을 발견했다. 반면, 최고속도의 멸종을 유발하는 강화 유형은 ‘지속 강화’였다. 이 같은 강화 계획에는 지속 강화, 고정 비율 강화, 고정 간격 강화, 변동 비율 강화, 변동 간격 강화 등이 포함된다.

지속 강화란 학습이 빠르게 발생하지만 반응 속도는 상당히 느린 강화 유형이다. 고정 비율 강화는 행동이 특정한 횟수만큼 발생한 후에야 반응이 나타나는 강화 유형을 말한다. 

반면, 고정 간격 강화란 고정된 시간 간격 후 최소 1회 이상 올바른 행동을 한 후에 나타나는 강화를 의미한다. 변동 비율 강화는 예측하지 못한 시간이 흐른 후 나타나는 강화지만 반응 속도는 빠르지만, 멸종 속도는 느리다. 

변동 간격 강화는 예측 불가능한 시간이 5분마다 지난 후에야 나타나는 강화를 말한다.

[리서치페이퍼=손승빈 기자]

Best News