진화 과정. - 출처 : http://chelseavose.wordpress.com


글 : 인지심리 매니아


* 이 글은 필자의 개인적 견해를 바탕으로 작성되었습니다.


필자는 인공지능, 특히 유전 알고리즘을 코딩해서 실행해 볼 때마다 놀랍다는 생각을 한다. 얼마 전, 변수가 여러 개인 방정식의 해를 구할 일이 생겼다.  PHP로 인공지능을 만들어서 실행시켰더니, 순식간에 답을 도출해냈다. 인간이라면 하루종일 계산해야 할 일을 컴퓨터가 뚝딱 해결한 것이다.


유전 알고리즘(Genetic Algorithm)이란 다윈의 진화론을 바탕으로 한 통계적 탐색 알고리즘 집합이다. 예를 들어 15x-x^2이라는 함수의 최대값을 찾는 문제를 푼다고 생각해보자. 유전 알고리즘은 이 함수(적합도 함수)를 풀기 위해 가능한 모든 답(해집단)들을 임의로 생성한다. 그 다음 해집단 사이에서 교배가 일어난다(정수를 이진수로 바꾼 다음, 둘둘씩 짝지어서 이진 수를 교환한다. 마치 실제 교배에서 자식이 양 부모의 유전자를 타고 나는 것과 유사한 원리다). 이 때 적합도가 가장 높은 염색체는 교배에서 우위를 점하게 되고, 결국 많은 자손을 낳게 된다. 이런 과정이 반복되면, 적합도가 가장 높은 염색체의 자손들만이 살아남게 되고 결과적으로 적합도 함수의 정답에 가까워진다.



교배(교차) 과정. 양 부모의 유전자 중 화살표 오른쪽 부분이 교차되어 자식에게 유전되었다. 출처 : http://www.learnartificialneuralnetworks.com/geneticalg.html



그런데, 곰곰이 생각해보면 유전 알고리즘이 인간의 창의성과 무척 유사하다는 점을 깨달을 수 있다. 심리학자들은 창의성이 ‘발산적 사고'와 ‘수렴적 사고'로 구성되어 있다고 정의한다. 즉, 수 많은 아이디어를 생산하는 한편 문제 해결에 유용한 아이디어를 생각하고 고를 수 있는 능력이 함께 요구되는 것이다. 유전 알고리즘에서 해집단을 임의로 생성하거나 교배하는 과정은 발산적 사고와 유사하다. 하지만 해집단은 적합도 함수에 적합해야 하는 점에서 수렴적 사고의 측면도 지니고 있다. 어쩌면, 창의성을 진화적 관점에서 설명한 도널드 캠벨(Donald Campbell)은 이 사실을 50년 전에 이미 알고 있었던 것 같다.


수십 년 전, 앨런 튜링은 인간의 사고를 컴퓨터로 비유하면서 인지 과학 혁명을 일으켰다. 필자는 앨런 튜링처럼 위대한 학자가 아니지만, 유전 알고리즘의 비유가 인간의 창의성을 이해하는 데 큰 도움이 될지 모른다고 생각한다(사실 창의성을 컴퓨터로 시뮬레이션한 시도는 이전에도 있었지만). 창의성에 대한 적절한 모델을 인공지능에서 차용한다면, 창의성을 둘러싼 수 많은 논쟁을 해결할 수 있을 것이다.


예를 들어보자.  필자는 유전 알고리즘의 성능 그래프(performance graph)를 관찰하던 중, 적합도 곡선이 이따금 인간의 ‘통찰'과 유사한 패턴을 보인다는 사실에 주목했다. 





100세대에 걸친 염색체 6개의 성능 그래프



위 그래프는 최대 적합도를 가진 염색체와 해집단 전체의 평균 적합도를 나타낸다. 두 그림에서 최대 적합도의 곡선은 점진적이라기 보다는 특정 시점에서 급격히 상승하는 ‘계단식’ 곡선에 가깝다. 이 패턴은 통찰을 필요로 하는 문제에서 사람들이 처음에는 정답을 생각하지 못하다가(impasse), 갑자기 통찰을 얻는 패턴(‘a-ha’ 또는 ‘유레카’)과 매우 유사하다. 만약 유전 알고리즘이 창의성을 표상하는 적절한 모델이라면, 창의성에서 논란이 되었던 두 문제에 해답을 줄지도 모른다. 


우선, 유전 알고리즘이 작동하는 방식을 살펴보면 문제가 해결되지 않다가 통찰이 느닷없이 찾아오는 것이 당연하다는 생각이 든다. 위 그래프에서 한동안 적합도에 개선이 없는 이유는 ‘그 밥에 그 나물을' 조합하기 때문이다. 각 염색체의 적합도가 서로 비슷할 경우 교배를 해도 적합도에 큰 개선이 나타나지 않기 때문에 정체 현상이 찾아온다. 즉, impasse가 발생한 것이다. 문제를 극적으로 해결하는 요인은 바로 ‘변이(Mutation)’다. 별반 다를 바 없는 염색체들 사이에서 어느 날 갑자기 등장한 돌연변이는 적합도를 순식간에 향상시킨다. 변이율이 큰 두번째 그림에서 적합도가 더 커지는 사실을 봐도 이를 알 수 있다. 


이 원리를 창의성에 적용해 보자. 어떤 문제에 대해 우리가 6개의 아이디어를 가지고 있다고 생각해보자. 만약 이 6개의 아이디어가 문제 해결의 적합성 측면에서 비슷비슷하다면, 아이디어들을 서로 조합해도 문제가 해결되지 않을 것이다(물론, 처음부터 해결책이 머리 속에 있다면 문제는 단번에 해결되거나 몇 번의 교배만으로 해결될 것이다). 하지만, 다소 기발한 생각이나 외부로부터 얻은 새 아이디어는 문제를 극적으로 해결한다. 


결론적으로, 유전 알고리즘은 impasse가 발생하는 원인에 대해 통찰을 제공한다. 문제가 한동안 해결되지 않는 이유는 적합하지 않은 생각들 속에서, 또는 자신의 한정된 지식 사이에서 아이디어를 내려 하기 때문일 것이다. 생각의 재조합(교배)으로도 해결되지 않는 문제는 극적인 생각의 변화(즉 변이)가 동반되지 않는 한 해결되지 않을 것이다. 그러나 극적인 생각의 변화가 뇌에서의 이상 현상 때문인지, 또는 외부로부터 유입된 새로운 정보 때문인지는 의문이다(자르페이트의 연구 결과는 이 주장을 뒷받침 하고 있다).


또, 유전 알고리즘의 성능 그래프 결과는 통찰이 점진적으로 획득된다는 견해(Durso et al, 1994, Novick and Sherman, 2003a)와 불일치하는 것처럼 보인다. 일반인의 상식처럼, 문제는 어느 날 갑자기 통찰을 얻으면서 해결되는 듯 하다.  최근, 통찰이 갑자기 찾아온다는 사실을 입증한 인지신경과학 연구(2011/08/03 - [인지심리기사/창의] - 통찰(insight)의 신경학적 근거)들은 이 추측에 무게를 실어준다.




글: 인지심리 매니아

 

며칠 전 Bing API를 통해 웹 검색 결과 수를 토대로 조건부 확률을 계산하는 application을 만들어봤다. 다들 알겠지만, 구글이나 Bing의 경우 검색결과와 결과 수를 함께 제시한다. 검색 결과 수를 이용하면 특정 단어가 출현했을 때 다른 단어가 동시에 출현할 확률을 구할 수 있다. 예를 들어, 오렌지라는 단어가 출현했을 때 과일이라는 단어가 함께 출현할 확률, P(과일|오렌지)과일 & 오렌지검색 결과 수를 오렌지검색 결과 수로 나누면 된다. 

Application을 완성하고 이 단어 저 단어를 검색하던 중, 문득 다음과 같은 생각을 해 봤다. ‘혹 웹 문서가 인간의 개념 구조를 그대로 반영하고 있지 않을까?’

웹 문서는 인간이 작성했다는 점에서 인간의 사고방식을 그대로 반영하고 있을 것이다. 누군가 웹마이닝 등을 통해 웹에 산재한 데이터들을 관찰할 수 있다면, 인간의 개념 지식, 휴리스틱, 판단 과정을 고스란히 살펴볼 수 있을 것이다.


필자는 그 중 전형성효과가 웹 문서에서도 동일하게 나타나는지 궁금했다. 인간의 개념 구조를 설명하는 이론 중 원형모형은 개념이 원형으로 표상된다고 주장한다. 원형은 그 범주에 속하는 사례들이 가장 평균적으로 가진 속성의 집합체를 말한다. 또, 그 범주에 속한 사례들은 원형과 유사한 정도에 있어서 다르다. 이를 전형성이라고 한다.

예를 들어보자. ‘라는 단어를 들으면 어떤 이미지가 떠오르는가? 아마 전형적인 라고 생각되는 이미지(날개가 달리고 몸이 가벼우며 하늘을 나는)가 떠오를 것이다. 이것이 새라는 범주의 원형이다. 하지만 새라는 범주에 속하지만 원형과 다소 동떨어진 사례도 있다. 가령, 펭귄은 새라고 할 수 있는가? 물론 펭귄은 새가 맞지만 원형과 동떨어졌다는 점에서 전형성이 낮다. 반면 까치는 전형성이 높다. 

웹 문서가 인간의 개념 지식을 그대로 반영한다면, 전형성 효과도 동일하게 나타날 것이라고 예상할 수 있다. , 펭귄보다 까치라는 단어가 출현했을 때 '새'라는 단어가 함께 출현할 확률이 높을 것이다. P(|펭귄) < P(|까치) 간단한 실험을 통해 이를 검증해 볼 수는 없을까? 한번 해 보기로 마음먹었다.[각주:1]

 

실험

 

우선, 웹 검색 결과를 인간의 범주화 과정과 비교하려면 인간 데이터가 필요하다. 그래서 Rosch Mervis 1975년에 진행한 연구 결과[각주:2]를 참고하기로 했다. 이 논문은 참가자들에게 각 사례의 전형성을 평가하게 해서 순위를 매겼다. 아래 그림에 실험 결과가 정리되어 있다. 예를 들어, Chair Furniture라는 범주에서 전형성이 가장 높았다.

 



그 다음, 필자가 만든 조건부 확률 검색 엔진을 통해 각 사례의 조건부 확률을 계산했다. , 웹페이지에서 Chair라는 단어가 출현했을 때 Furniture라는 단어가 함께 출현할 확률 P(Furniture|Chair)을 계산했다.

이런 식으로 모든 사례의 조건부 확률을 구한 다음(결합 단어나 다의어는 자료에서 제외했다), 확률을 토대로 전형성의 순위를 매겼다. 그 다음, 이 순위를 Rosch 등이 보고한 순위와 비교해봤다. 두 데이터 모두 서열 척도이므로 Spearman 상관 분석을 사용했다.
 

그 결과, Fruit Clothing을 제외한 모든 범주에서 유의미한 상관이 발견되었다. 결과에 영향을 주는 수많은 요인이 웹 상에 존재함에도 불구하고 유의미한 상관이 발견되었다는 사실은 좀 놀랍다.
 

   Furniture  Vehicle Fruit  Weapon  Vegetable  Clothing 
 상관계수  .444 .677  -.185  .561  .52  .382 
 유의도  p=.05 p=.001  p=.425   p=.01 p=.033  p=.097 

하지만 이 결과만 놓고 웹에서 전형성 효과가 나타나는지 확신하기는 힘들다. 대체로 인간 데이터와 웹 검색 결과가 비슷해 보이지만, 그렇지 않은 범주도 관찰되었기 때문이다. 이 가설을 제대로 검증하려면 보다 세련된 연구방법이 필요해 보인다.

 

만약, 웹에서 전형성 효과가 관찰된다면 그 응용적 가치는 무엇일까? 어쩌면 우리는 웹 문서를 통해 인간의 개념 지도를 완성할 수 있을지 모른다. 웹 마이닝 등에서 검색 결과의 조건부 확률을 이용한다면 (전형성 효과가 시사하듯)퍼지하게 구성된 인간의 개념 구조를 파악해 낼 수 있을 것이다. , 인공지능이 을 통해 인간과 유사한 추론을 하게끔 만들 수도 있다. 인공지능이 웹 검색결과를 통해 펭귄보다는 까치가 새에 가깝다라는 추론을 하는 모습이 상상되는가?’

 

  1. 인간의 개념 구조를 파악하기 위해 왜 조건부 확률을 관찰해야 하는지 의문이 들 수 있다. 이에 관해서는 인간의 추론 과정을 베이지안 관점에서 해석하는 입장을 살펴보길 권한다. Amy Perfors, Joshua B. Tenenbaum, Thomas L. Griffiths, Fei Xu, A tutorial introduction to Bayesian models of cognitive development, Cognition, Volume 120, Issue 3, September 2011, Pages 302-321, ISSN 0010-0277, 10.1016/j.cognition.2010.11.015. [본문으로]
  2. Rosch, E., & Mervis, C.B(1975). Family resemblance: Studies in the internal structure of categories. Cognitive Psychology, 7, 573-605 [본문으로]

+ Recent posts