글: 인지심리 매니아


인간의 사고과정은 신비하다. 인간이 언어를 배우고, 인과관계를 파악하고, 의사결정을 하는 과정은 매우 복잡하며 베일에 가려져 있다. 도대체 인간이 사고를 할 때 뇌에서는 어떤 일이 일어날까? 우리가 그 과정을 상세히 기술할 수는 없을까?

그런데 인간의 사고과정을 수학 공식으로 설명하는 관점이 있다. 바로 베이지안 접근법이다. 이 관점은 인간의 사고과정을 베이즈 정리로 설명한다.

P(h|d) = P(d|h) / P(d)
(h: 가설 d: 증거 )

이 간단한 공식으로 어떻게 복잡한 인간의 사고방식을 설명할 수 있을까? Perfors et al(2011)[각주:1]은 어린아이의 귀납적 일반화 과정을 베이지안 추론으로 설명하고 있다.

 

범주이름 학습
 

출처: http://www.clublabrador.com

어린아이는 어떻게 범주 이름을 학습할까? 당신이 이제 막 말을 배우는 아이의 부모라고 상상해보자. 아이를 데리고 공원에 산책 나왔는데, 귀여운 래브라도 한 마리가 다가온다. 우리는 아이에게 얘는 래브라도야.’라고 가르쳐준다. , 아이의 머리에서 어떤 일이 일어날까?

 

아이의 머리 속은 폭발 직전일 것이다. 아이는 어쨌든 자기 앞에 있는 이 동물이 래브라도라는 사실을 배웠다. 하지만 아이는 며칠 전 공원에서 비슷한 동물(진돗개)을 본 적이 있다. 그럼, ‘래브라도라는 단어는 며칠 전 본 동물을 부를 때도 사용하는가? 아니면 네 발로 걸어다니는 모든 동물을 일컫는 것일까?

 

다행히 아이의 머리 속에는 이 문제를 해결할 규칙이 있다. 그 규칙은 바로 가장 좁은범주를 선택하는 것이다. , 아이는 자기 눈앞에 있는 이 동물만 래브라도이며, 지난 번에 본 동물(진돗개)은 래브라도가 아니라고 생각한다. 만약 아빠가 이 신기한 동물과 똑같이 생긴 동물이 나타날때마다 래브라도라고 부른다면, 이 가정은 더욱 견고해진다. 반면, 아빠가 며칠 전 봤던 동물(진돗개)도 래브라도라고 부른다면 이 단어가 특정 동물()을 지칭한다고 가정할 것이다. 하지만, 그 때도 역시 최소 범위()를 가정한다. ‘래브라도가 동물 전체를 지칭한다고 생각하지는 않는 것이다.

 

베이지안 관점은 이 현상을 우도로 설명한다. 앞에서 살펴봤듯이 우도란 P(d|h), 즉 가설이 참일 때 증거가 출현할 확률이다. 만약 이 동물(A)의 이름이 래브라도라고 가정하면, 이 가정이 맞을 때 실제로 이를 뒷받침하는 증거가 출현할 확률은 P(래브라도라고 부름|A)가 될 것이다. 반면, 모든 개(B)를 지칭하는 단어가 래브라도라면 우도는 P(래브라도라고 부름|B)이 된다. 둘 중 어느 확률이 가장 높은가? 당연히 첫번째다. AB보다 발생빈도가 훨씬 적기 때문이다 (Fig.3 i에서 가장 작은 사각형이 A에 해당한다). 아이는 이렇게 증거가 참일 확률이 높은 가설을 선택한다(그림을 보면 검은 점은 가장 작은 사각형에서 나왔을 확률이 높아 보인다).

 

또 이 가정은 증거가 축적되면서 강화되는데, 이것 역시 우도와 관련있다.. 만약 아빠가 이 개랑 똑같이 생긴 개(A)가 출현할 때마다 래브라도라고 한다면, P(래브라도라고 부름|A)는 더욱 증가하기 때문이다(Fig 3. ii). 따라서 가장 진한 사각형(래브라도)이 지지를 받게 되는 것이다.

 

 


제약
 
 

그 외에도 어린아이는 복잡한 귀납화 과정에서 사용하는 몇 가지 규칙(제약, Constraint)을 가지고 있다. 예를 들어, 단어를 배울 때 그 단어가 사물의 일부분보다 전체를 지칭할 것이라는 가정, 주체는 객체와 달라서 스스로 움직일 수 있다는 가정 등이다.

 

어린아이의 머리 속에 있는 제약은 선천적으로 타고나는가? 베이지안 관점은 제약이 학습된다고 설명한다. 예를 들어 보자. 이제 라는 개념을 이해하기 시작한 아이가 돼지와 골든 리트리버을 봤다고 가정해보자. 아이의 머리는 또 다시 복잡해진다. 이 이상한 동물들도 일까? 아이에게는 이 복잡한 문제를 정리해줄 제약이 필요하다.

 

 

그림4는 제약이 학습되는 과정을 잘 설명해준다. A가 래브라도, b가 골드 리트리버, c가 돼지라고 가정해보자. 학습자는 먼저 기존 경험을 바탕으로 가설()의 범위를 설정한다. , 개는 몸통 길이가 다양하지만(w)  몸무게(l)가 크게 차이 나지 않는다. 따라서 가설공간은 l x w 의 긴 직사각형 모양이라는 제약이 형성된다. 그렇다면 b a와 같은 범주에 속할 확률이 높고, c a는 확률이 낮을 것이다. 학습자는 소수의 사례만으로도 재빠르게 제약을 만들어낸다.
 

베이지안 통계학을 배운 사람은, 이쯤에서 무언가가 번득 떠오를 것이다. 베이지안 관점은 가설에 대한 가설(l w, hyperparameters)베이지안 계층적 모형으로 설명한다. 계층적 모형을 사용하면 제약 뿐만 아니라 인간이 어떻게 개념을 추상화하고, 그 개념을 또 추상화하는지 추적할 수 있다. 정말 신기하다. 수학적 모형으로 인간의 개념 구조를 설명할 수 있다니 말이다.

 

결론

인간의 사고과정은 신비하게 보이지만, 설명 가능한 과정임이 점점 드러나고 있다. 특히 베이지안 관점에 의하면 인간의 사고방식은 합리적인 수학적 판단과 다를 바가 없다. 물론 베이지안 관점에 대해서 비판이 없는 것은 아니지만 비교적 다양한 사고과정을 수학적으로 무리없이 설명해 내고 있다. 카네만과 트버스키의 비판에도 불구하고, 인간은 어쩌면 정말 직관적인 수학자일지도 모른다.

  1. Amy Perfors, Joshua B. Tenenbaum, Thomas L. Griffiths, Fei Xu, A tutorial introduction to Bayesian models of cognitive development, Cognition, Volume 120, Issue 3, September 2011, Pages 302-321, ISSN 0010-0277, 10.1016/j.cognition.2010.11.015. [본문으로]

+ Recent posts