본문 바로가기

인지심리기사/의사결정/추론

인간의 도덕 판단 모델


Image : Tomkow.com



글 : 인지심리 매니아



도덕적 딜레마(Moral dilemmas)란 두 가지 도덕적 당위가 충돌해서  그 중 하나만 택해야 하는 상황을 말한다(위키피디아의 Ethical dilemma 참조). 예를 들어, 다섯 사람을 위험에서 구하기 위해 한 사람이 다치거나 죽어야 하는 상황을 가정해보자. 사례의 경우 다섯 사람의 목숨이 한 사람의 목숨보다 소중하다는 공리주의(또는 결과주의)와 인간의 생명은 그 무엇과도 바꿀 수 없다는 의무주의가 충돌하고 있다. 만약 한 가지 도덕적 명령을 지킨다면, 다른 명령은 지킬 수 없다. 


결과주의(Consequentialism)의 경우 최적의 결과를 낳는 행위를 지지한다.  따라서 다섯 사람을 위해 한 사람을 희생하는 것이 가능해진다.  반면 의무주의(Deontology)는 결과와 상관 없이 도의적으로 적합한 행위를 지지한다. 이 관점에 의하면 사람을 해치는 행위는 무조건 잘못된 것이므로 설사 다섯 사람이 사망하더라도 한 사람을 희생할 수 없다는 결론이 가능하다. 심리학 연구 결과에 의하면, 사람들은 도덕적 딜레마를 접했을 때 결과주의 혹은 의무주의에 입각한 판단을 내리며, 그 양상은 각 시나리오에 따라 달라진다. 


심리학은 이러한 인간의 도덕 판단 과정을 설명하기 위해 다양한 이론을 제시했다. 가장 유력한 이론인 dual-process 이론은 의무주의적 판단이 자동적인 감정 프로세스에 의해 지배되는 반면, 결과주의적 판단은 통제된 인지 과정에 의해 지배된다고 설명한다. 하지만 이 이론은 도덕적 딜레마 상황이 심적 표상으로 변환되는 과정을 설명할 수 없다는 문제가 있다. 한편 도덕 문법(moral grammar)을 대안적으로 제시하는 이론은 도덕적 딜레마 상황이 심적 표상으로 변환되고 각각의 행동과 결과에 가치가 부여되는 과정을 계산적(computational)으로 설명할 수 있다는 장점이 있다.



2013년 8월 Trends in Cognitive Science에 게재된 논문[각주:1]에서 Crockett은 인간의 도덕 판단 과정을 설명하는 새 모델을 제시했다. 저자는 인간이 행위와 결과를 평가하는 과정에서 세 가지 의사 결정 시스템이 작동한다고 주장했다. 우선 model-based system은 각 행위와 그에 따른 결과를 결정 트리(decision tree) 형태로 표상한 다음, 트리를 탐색하면서 최적의 결과를 낳는 행위에 가치를 부여한다. 반면 model-free system은 과거의 기억을 토대로 행위의 가치를 평가한다. 예를 들어 과거에 사람을 밀어서 좋지 않은 결과가 발생한 적이 있다면, ‘사람을 미는 행위'는 나쁘다고 판단한다. 마지막으로 Pavlovian system은 특정 자극에 대한 접근-회피 반응을 유발하며, model-based system과 model-free system 모두에 영향을 미친다.



저자는 두 가지 예를 통해 이 모델이 인간의 판단 과정을 얼마나 잘 설명하는지 보여주고 있다. 아래의 예는 마이클 센델의 저서 ‘정의란 무엇인가'에서 소개된 바 있는 ‘기관차 문제'다.



출처 : 논문에서 인용



시나리오 A와 B의 차이점은 ‘접촉'의 존재 여부에 있다. A의 경우 다리 위에 남자를 스위치로 떨어뜨려서 열차를 막는 반면, B의 경우 사람을 밀어서(접촉) 열차를 멈추게 한다. 그간의 연구 결과에 의하면, 일반인들은 스위치를 돌리는 행위보다 사람을 미는 행위를 부적절하다고 판단했다.


저자는 모델을 통해 인간이 위와 같은 반응을 보이는 이유를 설명한다. 인간이 시나리오 A를 접할 때 model-based system은 시나리오 상황을 결정 트리로 표상한다(C). 표상에는 각 행위와 그에 따른 결과가 포함되어 있다. 이 시스템은 최적의 결과(1명이 사망하고 5명이 생존하는 결과)를 낳는 행위(스위치를 돌리는 행위)에 한 표를 던진다. 이와 동시에 model-free system도 행위를 평가한다. 이 시스템은 과거 경험에 비춰볼 때 스위치를 돌려서 목적을 달성하는 행위가 대체로 좋은 결과(예, 스위치를 켜면 불이 들어온다)로 이어졌음을 기억하고 스위치를 돌리는 행위에 찬성한다.

반면, Pavlovian system은 조금 다른 의견을 제시한다. 이 시스템은 1명이건 5명이건 사람이 죽는 끔찍한 상황을 무조건 회피하고자 하기 때문에 스위치를 놔두는 행위 뿐만 아니라 스위치를 돌리는 행위도 반대한다. 결국 스위치를 돌리는 행위에 대한 각 시스템의 평가는 찬성 2표, 반대 1표가 되며, 인간은 이 결과에 근거해서 스위치 돌리는 행위를 지지한다. 따라서 결과주의적 응답이 우세해진다.


하지만 B 시나리오의 경우 model-free system이 사람을 미는 행위를 부정적으로 판단하기 때문에 반대 2표, 찬성 1표로 행위를 하지 않는 쪽을 택하게 된다. 결과적으로 의무주의적 응답(no)이 우세해진다. 


(모델의 판단이 실제 응답자의 결과와 매우 유사함을 알 수 있다.)



이번엔 다른 예를 들어보자. 아래 제시된 두 가지 시나리오는 앞에서 제시한 시나리오와 유사하다. 그러나, A는 한 사람의 죽음이 대의를 위한 부수적 결과인 반면, B의 경우 대의를 위한 수단적 희생이라는 차이점이 있다. 일반인들은 사람의 생명을 수단으로 사용하는 행위를 더 부정적으로 판단했다. 



출처 : 논문에서 인용



저자는 위와 같은 결과가 Pavlovian system이 일으키는 절단(Pruning) 때문이라고 설명한다. Pruning이란 피하고 싶은 끔찍한 상황에 직면할 때 그 사건에 대한 생각을 억제하는 경향을 말한다. 시나리오 A의 경우 스위치를 돌리는 순간 한 사람이 사망하게 되므로, 그 사람에 대한 생각은 절단된다. 하지만, 다섯 사람이 생존하는 결과는 여전히 생각할 수 있다. 결국 Pruning이 발생하는 경우에도 ‘스위치를 돌리는 행위의 가치=다섯 명의 생존’이 된다.

반면, 시나리오 B의 경우 pruning이 전혀 다른 판단을 야기한다. 일단 스위치를 돌리면 한 사람이 사망하므로 pruning이 발생한다. 이 경우, 한 사람이 죽은 다음 기차가 멈춰서고 5명이 살 수 있다는 일련의 생각이 모두 정지한다. 따라서 스위치를 돌리는 행위의 가치는 0이다. A보다 B 상황에서 의무주의적 응답이 많아지는 이유가 여기에 있다.



이 모델은 도덕적 상황이 인간의 머리 속에서 표상, 평가되는 과정을 잘 설명한다는 장점이 있다. 또, 신경과학 연구 결과와의 정합성이 발견되고 있다는 점에서도 주목해볼 만 하다. 

인간의 도덕 판단을 계산적 이론으로 모델링한다는 것은 참 매력적이다. 이것이 가능하다면 언젠가는 도덕적으로 생각하는 인공지능이 출현할지 모르는 일이다.


Reference

  1. Crockett, M. J. (2013). Models of morality. Trends in cognitive sciences. [본문으로]