글: 인지심리 매니아

 다음 문제를 풀어보자.

어느 산악회 전체 회원의 60%가 남성이다. 이 산악회에서 남성의 50%가 기혼이고 여성의 40%가 기혼이다. 이 산악회의 회원 중에서 임의로 뽑은 한 명이 기혼일 때, 이 회원이 여성일 확률은?

정답이 몇 %라고 생각하는가? 이 문제를 풀기 어렵다면 아래 문제를 한번 더 풀어보자.

어느 산악회는 회원 수가 100명이며, 이 중 40명이 여성이다. 40명의 여성 중 16명은 기혼이다. 또 남성 60명 중 30명이 기혼이다. 이 산악회의 회원 중에서 임의로 뽑은 한 명이 기혼일 때, 이 회원이 여성일 확률은?

이제 정답을 맞추기 쉬울 것이다. 정답은 16/46이다.

 

위 문제는 원래 조건부 확률, 특히 베이즈 정리를 이용해서 풀어야 한다. 정답을 도출하는 과정은 다음과 같다.

  (마지막 줄에서 0.48이 아니라 0.46이 되어야 한다 - 역자 주)

문제 출처: 이투스


그런데
, 대부분의 사람들은 문제가 예시 1처럼 제시된 경우 잘 풀지 못한다. 예시 1은 각 사건의 발생확률(%)을 제시했다. 반면 예시 2처럼 빈도(natural frequency, 몇 명 중 몇 명)를 제시한 경우 문제를 쉽게 푼다. 심지어 베이즈 정리를 모를지라도 문제를 풀 수 있다. 어떻게 된 것일까? 두 문제 모두 동일한 구조이며, 단지 사건의 발생확률을 표현하는 방법만 다를 뿐인데 왜 이런 결과가 발생할까?

 

일부 심리학 연구들은 인간이 예시 1처럼 제시된 문제를 풀지 못하는 게 당연하다고 주장했다. 그 이유는 인간이 사건의 발생 횟수를 확률이 아니라 빈도로 표상하기 때문이라는 것이다. 인간은 이 세상에서 일어나는 모든 사건(비가 올 확률, 불의의 사고를 당할 확률 등)의 발생 확률을 경험을 통해 학습한다. 그리고 그 확률을 빈도(몇 번 중 몇 번)로 기억한다. 예를 들어보자. 당신은 등산을 얼마나 자주 가는가? 대부분의 사람들은 한달에 X’, ‘일년에 X이라고 대답할 것이다. 아무도 자신이 등산을 갈 확률이 X%라고 말하지 않는다. 따라서 예시 1이 사건의 발생확률을 제시했을 때 도무지 감이 잡히지 않았던 것이다. 반면, 예시 2는 사건의 발생 빈도를 제시했기 때문에 풀기가 쉬웠다.

앞서 제시한 문제의 경우 지문에 제시된 사건의 발생확률을 토대로 베이즈 판단을 했다. 그럼, 본인의 이전 경험을 토대로 베이즈 판단을 하는 경우는 어떤가? 이 경우에도 확률로 생각하는 것보다 빈도로 생각하는 게 정확한 베이즈 판단을 유도할까?

 

2011 Applied Cognitive Psychology에 실린 한 논문[각주:1]이 이 가능성을 검증했다. 연구자들은 산부인과 의사들을 실험 참가자로 선정한 후, 이들에게 혈청 검사가 양성으로 나왔을 때 태아가 다운증후군일 확률P(H|D) [H: 다운증후군, D: 양성반응]을 물어봤다(예상값). 이 때 의사들을 세 조건으로 나눈 다음, 각 조건마다 질문 방식을 조금씩 달리했다. Retrospective natural frequency 조건의 경우, 자신의 경험을 토대로 P(H|D)빈도로 적어보라고 지시했다. Prospective natural frequency 조건의 경우, 자신의 경험을 토대로 내년의 P(H|D)빈도로 적어보라고 지시했다. Single event probability 조건의 경우, 자신의 경험을 토대로 P(H|D)확률로 적어보라고 지시했다.

, 참가자에게 P(D|H), P(H), P(D)를 추정하게 했다. 연구자들은 이 확률을 토대로 베이즈 판단의 정답을 계산한 다음(계산값), 아까 전 적었던 예상값과 비교해 보았다.

그 결과, 예상값과 계산값의 차이는 Retrospective natural frequency 조건에서 가장 작았다. 결국, 자신의 지식이나 경험을 토대로 베이즈 판단을 하는 경우에도 빈도를 생각할 때 정답과 근사한 답이 도출되었다.

 

수학 시간에 조건부 확률, 특히 베이즈 정리가 나왔다고 해서 좌절할 필요가 없다. 확률로 계산된 문제가 어렵게 느껴진다면, 그 확률을 빈도로 바꾸어 보자. 문제가 쉽게 풀릴 것이다.

더불어, 자신의 이전 경험을 토대로 중요한 판단을 할 경우, 결과가 발생할 확률을 빈도로 생각해보자. 보다 정확한 판단이 가능해질 것이다.


* 이 연구 결과는 베이즈 추론 기반의 전문가 시스템을 개발하는 사람들도 눈여겨 봐야 할 것 같다. 주제 전문가에게 조건부 확률을 자문하려면, 확률이 아니라 빈도수로 묻는 것이 바람직하다. 만약 확률로 물어본다면 정확하지 않은 수치를 인공지능에 포함시킬 위험이 커진다.  

  1. Obrecht, N. A., Anderson, B., Schulkin, J. and Chapman, G. B. (2011), Retrospective Frequency Formats Promote Consistent Experience-Based Bayesian Judgments. Applied Cognitive Psychology. doi: 10.1002/acp.2816 [본문으로]

출처: Ideas for a deeper sense of life

번역: 인지심리학 매니아

 

며칠 전 카오스 복잡계 이론가인 Steven Strogatz가 뉴욕 타임즈에 확률을 어떻게 가르쳐야 하는지 기사를 실었다. 특히 그는 ‘조건부 확률’을 어떻게 다룰 것인지 조명했다. 그는 제시한 해법은 설득력이 있어 보이고, 인간의 직관으로 보다 쉽게 이해할 수 있다.


그는 기존 학생들처럼 베이즈 공식을 쓰거나 규범적인 수학 공식을 쓰지 말 것을 추천했다. 그는 이번 글에서 유방암을 찾아내는 mammogram 양성 반응 문제를 예시로 들면서 Gerd Gigerenzer(Max Planck Institute for Human Development in Berlin의 인지 심리학자)의 연구에서 찾아낸 방법들을 제시했다.


이 방법은 사람들에게 확률적인 방식보다 '빈도수’를 세는 방식을 권유하고 있다. 즉 퍼센트나 분수, 확률을 사용하지 말고 숫자를 사용하라는 뜻이다(e.g, 20% 대신 100명 중 20명이라고 표현하라). 물론 수학책을 비롯한 교과서에서는 보다 복잡하고 수학적인 공식들을 사용하지만, 단순히 빈도수를 사용하는 게 인간의 직관에 보다 잘 맞는다는 설명이다.


Ernő Téglás, Vittorio Girotto, Michel Gonzalez, and Luca L. Bonatti는 2007년에 유아들을 대상으로 한 실험에서 인간이 어린 시기에 어떻게 확률을 지각하는지 밝혀냈다. 유아들은 4개의 영화를 보게 되는데(두 편은 확률적으로 그럴듯하고 나머지 두 편은 확률적으로 있을법하지 않은 장면), 실험 결과 유아들은 그럴듯하지 않은 결과를 볼 때 화면을 오래 응시했다.


그 러나 유아들이 확률적 추론과 관련 없는 어림법(heuristic)을 사용했기 때문에 이런 결과가 나왔을 수도 있다. 따라서 그들은 추가 실험을 진행한 다음 그럴듯한 VS 그럴듯하지 않은 조건에서의 반응시간(reaction time, RT)을 비교했다. 그 결과 유아들은 처음에 (확률적으로)그럴듯한 동영상에서 나왔던 물체가 (확률적으로)그럴듯하지 않은 사건에 다시 나온 경우에도 화면을 오래 응시했다(즉, 첫 번째 실험이 특정 object로 인한 어림법 사용의 결과가 아니라는 뜻 – 역자 주)


이 두 실험은 인간이 미래에 일어날 특정 사건의 확률을 예측하는 ‘선천적 능력’이 있음을 보여준다. 위 두 사람의 연구를 살펴볼 때 확률을 이해하고 배우는 손쉬운 방법은 유아들이나 아이들이 사용하는 방식과 같은 방식을 따를 필요가 있다. 복잡한 수학 공식보다는 단순히 빈도수를 세는 것이 그것이다.


Teglas, E., Girotto, V., Gonzalez, M., & Bonatti, L. (2007). Intuitions of probabilities shape expectations about the future at 12 months and beyond Proceedings of the National Academy of Sciences, 104 (48), 19156-19159 DOI: 10.1073/pnas.0700271104

+ Recent posts