2013.3.16 토요인지모임. 장소: 서강대 정하상관. 발표자: 박도영 책임님. 사진: 인지심리 매니아.





글 : 인지심리 매니아


2013년 3월 16일 서강대에서 열린 토인모 다녀왔다. 이번 모임은 ‘Auditory Interface Design for Product’라는 주제로 박도영 책임연구원(현대기아자동차 기술연구소)님이 발표를 맡아주셨다.


최근 UX 분야는 시각 뿐만 아니라 청각적 UI에도 많은 관심을 쏟고 있다. 하지만 이와 관련한 정보를 접할 기회는 많지 않기 때문에 많은 분들이 세미나에 참석하신 것 같다. 인지심리와 음악을 함께 공부한 필자도 누구보다 많은 관심을 갖고 있는 주제다.


세미나의 초점은 Sonification의 개념과 디자인 과정에 맞추어졌다. 위키피디아 정의에 의하면, Sonification은 ‘정보 전달 또는 데이터를 지각하기 위한 비언어적인 소리의 활용'를 의미한다. 즉, 말을 하지 않고도 소리를 통해 정보를 전달하거나 데이터를 느끼도록 만드는 것이다.


박도영 책임님은 Sonification이 세 가지 과정으로 구분된다고 설명했다. ‘Rendering sound’는 시급성(Urgency)과 중요성(Importance)을 소리의 특성(음높이, 음색, 음량)에 매핑하는 단계다. 예를 들어, 필자의 아버지가 소유한 승용차는 후진 시 물체와의 거리가 가까워질수록 경고음의 비트수가 점점 증가하도록 설계되어 있다. 정지해야 한다는 시급성이 높아지면 비트도 함께 증가하도록 매핑된 경우다.


두번째로, 발생한 소리가 청자에게 무언가를 ‘전달'하는 단계다. 소리는 정보(피드백, 알림, 회사 브랜드, 엔터테이닝)나 심미(아름다움, 즐거움, 감동이나 인상, 차별화)를 전달할 수 있다.


세번째로, 청자가 소리를 듣고 정보나 미적 가치를 ‘이해’하는 단계다. 만약 청자가 정보를 올바로 이해했다면 Sonification의 목적은 달성된 것이다.


세미나는 auditory interface를 활용한 다양한 사례들을 소개했다. 또, 도형을 음으로 표현하는 재미난 실험을 즉석에서 진행하기도 했다. 건반을 보면 눌러야 직성이 풀리는 필자가 제일 먼저 나섰는데, 다른 분들도 필자의 소리에 공감을 하셨는지 모르겠다.



세미나를 듣는 동안, 필자는 발표 주제와 관련된 인지심리학 이론이나 연구들을 떠올려봤다. 그리고 몇 가지 의문을 가지게 되었다. 


우선, 소리가 추상적인 정보를 전달할 수 있는지 궁금해졌다. 우리는 단순한 소리가 정보가를 가질 수 있다는 의견에 동의한다. 누군가 소리를 지른다면 ‘위급’한 상황이라는 사실임을 누구나 알 수 있다. 하지만 소리가 그보다 훨씬 복잡하거나 추상적인 개념을 전달할 수 있을까? 가령, 소리가 동물이나 물체를 표현할 수 있을까?


소리의 경우는 아니지만, ‘음악'이 사물을 전달할 수 있는지 연구한 사례가 있다. ‘Cognitive Daily’라는 블로그의 저자이자 인지심리학자인 Dave Munger는 블로그를 통해 재미있는 실험을 진행했었다. 블로그 독자들을 대상으로 클래식 곡(바람이나 바다처럼 특정 대상을 주제로 하고 있다)들의 일부를 들려준 다음, 곡들이 ‘무엇'을 전달하고자 하는지 물어본 것이다. 이 때 응답자는 ‘아름답다' 등의 형용사를 쓸 수 없으며 ‘강'처럼 구체적인 명사를 이용하여 응답을 해야 한다.


연구자는 응답자가 주제를 정확히 맞추었을 경우 2점, 주제와 유사한 사물을 언급한 경우 1점, 전혀 다른 사물을 언급한 경우 0점을 부여했다. 예를 들어 동물의 사육제 중 ‘코끼리를 들은 사람이 ‘코끼리’라고 대답하면 2점, ‘하마'라고 대답하면 1점, ‘새'라고 대답했으면 0점을 받는다.


그런데 실험 결과 응답자의 스코어는 전반적으로 낮았다. 아래 그래프는 네티즌들의 응답 결과다.



Image : Cogitive Daily



그래프에서 알 수 있듯이, 음악 전공자들의 평균마저 1점을 넘지 못했다. 참가자 대부분 주제와 관련 없는 사물을 지칭한 것이다. 이 온라인 실험 결과에 대해선 두 가지로 해석이 가능하다. 첫 번째 가능성은 생상스가 코끼리에 해당하는 음악을 제대로 매핑하지 못한 경우다. 이 경우 아직 희망이 남아있다. 하지만 애시당초 음악이 코끼리같은 복잡한 개념을 표현할 수 없을 가능성도 있다. 만약 이것이 사실이라면 음악이 전달하는 정보의 복잡성에는 한계가 있는 셈이다. 이 결과가 소리의 경우에도 마찬가지로 적용될까? 소리는 어느 수준의 복잡성까지 표현할 수 있을까? 소리가 도형을 표현할 수 있을까? 색깔은? 코끼리는? 


둘째로, 소리에 대한 선호도 조사가 매번 실패로 끝나는 이유가 궁금해졌다. 심리학 문헌에서도 이와 비슷한 연구를 하는 경우가 있다. 하지만 이런 실험은 독립 변인 외에도 수많은 변수들이 개입(혼입)할 여지가 있다. 한 연구의 경우 온라인을 통해 음악 투표를 실시했는데, 참가자들이 투표 초반 많은 표를 받은 음악에 몰표를 주면서 특정 음악이 압도적 1위를 차지했다. 음악의 특성보다 곡에 대한 타인의 반응이 자신의 선호에 영향을 미친 것이다. 그 외에도 음악의 제시 순서, 환경 등에 따라 실험 결과는 무수히 달라질 수 있다. auditory interface를 개발하기 위한 서베이가 전체 사용자의 의견을 예측하지 못하는 이유도 여기에 있을 것이다.



필자는 세미나 후에 이어진 식사 시간에서 발표자 및 현업에 종사하시는 분들과 이런 고민들을 함께 나누어봤다. 대화를 나누는 동안, 음악이라는 분야에 과학적 검증을 거친다는 것 자체가 어쩌면 무모한 시도일지 모른다는 생각이 들었다.


그러나 청각적 UI 설계의 과학적 검증을 회의적으로 볼 필요는 없을 것 같다. UX는 디자이너의 인사이트와 과학이 어우러지는 분야다. 때로 이 둘은 서로를 이해하지 못하기도 하고 갈등하기도 한다. 마치 우리 뇌의 System 1과 System 2가 갈등하는 모습과 비슷하다. 디자이너의 인사이트는 빠른 시간에 유저들의 마음을 읽어낼 수 있다. 반면 서베이나 실험 등 과학적 검증은 느리지만 인사이트가 저지르는 오류를 바로잡아줄 수 있다. 우리는 이 두 가지 방법 중 어느 것도 과소평가할 수 없다. 두 가지 방법을 잘 조화시킬 때 사용자의 경험도 최적화될 것이다.



끝으로, 필자의 블로그를 보고 토인모를 찾는 분들에게 항상 감사하다는 말을 남기고 싶다. 필자가 토인모의 부흥에 조금이나마 도움이 되는 것 같아서 다행이다. 


토인모는 매달 세번째 주 서강대에서 열린다. 누구나 무료로 들을 수 있기 때문에 부담 없이 방문해도 괜찮을 것 같다.


글 : 인지심리 매니아


당신은 어떤 메뉴 바를 선호하는가? 거의 대부분의 웹사이트나 블로그는 화면 왼쪽에 세로로 긴 메뉴 바를 배치하고 있다. 필자의 블로그 역시 블로그 목차가 왼쪽에 위치하고 있으며, 세로로 긴 형태를 띠고 있다. 


그런데 모든 메뉴 바가 꼭 이런 형태를 띠고 있어야만 할까? 예를 들어 18X2형태의 긴 메뉴 바가 있다고 생각해 보자. 그럼 똑같은 아이콘들을 6X6 형태의 메뉴 바에 표시할 수는 없을까? 하지만 6X6처럼 컴팩트한 형태의 메뉴바는 인터넷에서 쉽게 찾아보기 힘들다. 또, 미관상으로도 슬림하지 않고 다소 무거워 보인다. 아마 이런 이유 때문에 인터넷 초기부터 긴 형태의 메뉴 바가 선호되었던 것 같다.



둘 중 어떤 메뉴 바가 더 보기 좋은가?



아이콘들을 가늘고 긴 메뉴 바에 표시하는 것과, 두껍고 짧은 메뉴바에 표시하는 것 중 어느 것이 더 보기 좋다고 생각하는가? 그리고 실제로 어느 것이 더 효율적일까?


2011년 Computer in Human Behavior 저널에 게재된 한 연구[각주:1]가 이 문제를 연구했다. 연구자는 참가자들에게 다양한 형태의 메뉴 바 layout을 보여준 다음, 특정 아이콘을 얼마나 빠르게 찾는지 측정했다. 각 layout은 12X3처럼 세로로 긴 것부터 6X6처럼 컴팩트한 것까지 다양했다. 또, 연구자는 실험 전후로 layout에 대한 주관적 선호도를 측정했다. 


실험 결과, layout이 컴팩트할수록 아이콘을 찾는 속도가 빨랐다. 이와 더불어 연구자는 두 가지 재미있는 사실을 발견했다. 실험 진행 전 실시한 조사에서 참가자들은 세로로 긴 layout이 가장 마음에 든다고 응답했다. 가장 컴팩트한 layout(6X6)은 낮은 평가를 받았다. 하지만, 메뉴 바 속에서 아이콘을 찾는 과제를 마치고 난 다음에는 선호가 역전되었다. 즉, 가장 컴팩트한 layout에 대한 선호가 늘어난 반면 세로로 긴 layout에 대한 선호는 줄어들었다. 컴팩트한 layout에서 아이콘을 찾기 쉽다는 사실을 경험했기 때문에 컴팩트한 메뉴를 더 좋아하게 된 것이다.


또 한 가지 재미있는 사실은, 경험에도 불구하고 좀처럼 선호를 바꾸지 않는 ‘고집스러운’ 사람이 있다는 점이다. 연구자는 군집분석을 통해 참가자를 집단 별로 분류해봤다. 그 결과, 실험 전 vertical layout을 선호했던 사람 중 일부가 실험 후에도 여전히 이 layout을 선호한다는 사실을 발견했다. 이 참가자들은 콤팩트한 레이아웃이 효율적이라는 사실을 경험했음에도 불구하고 선호를 바꾸지 않았다. 


연구자는 실험 결과를 토대로 디자이너들이 인터페이스를 설계할 때 다음과 같은 점을 고려해야 한다고 설명한다.


1. 사람들이 인터페이스에 대해 가지는 초기 선호는 매우 가변적이라는 점이다. 이 선호는 제품을 사용하면서 겪는 경험에 의해 금방 바뀔 수 있다. 따라서, 사용자가 제품을 가급적 자주 사용하게끔 만드는 것이 관건이다.


2. 만약 두 가지 인터페이스가 객관적 효율성에서 큰 차이가 없다면, 사람들의 주관적 선호를 고려할 필요가 있다.


3. 이 세상에는 경험을 통해서도 자신의 선호를 바꾸지 않는 사람이 있다는 사실을 알아야 한다.


  1. Rafał Michalski, Examining users’ preferences towards vertical graphical toolbars in simple search and point tasks, Computers in Human Behavior, Volume 27, Issue 6, November 2011, Pages 2308-2321, ISSN 0747-5632, 10.1016/j.chb.2011.07.010. [본문으로]

Posted by 인지심리 매니아

 

애 플의 아이패드는 심플하면서도 아름다운 디자인이 특징이다. UI 역시 깔끔하면서 아름답다. 우리는 지금 아이패드의 아름다운 매력에 푹 빠져 있다. 하지만, 단순히 아름답기만 한 것은 아니다. 아이패드는 사용하기에도 편리하다. 책장을 넘길 때나 앱을 사용할 때, 문서를 작성하거나 그림을 그릴 때, 사용하기 편하다는 느낌을 계속 받게 된다. 애플은 아름다움과 사용성이라는 두 마리 토끼를 다 잡은 것 같다.


그 런데 한 가지 궁금한 게 있다. '아름다움'이라는 속성은 '사용성'이라는 속성에 영향을 미칠까? 어떤 제품이 아름답게 보이기 때문에 사용하기에도 편리하다는 인상을 받게 되는 걸까? 어쩌면 우리는 아이패드의 아름다움에 홀려서 그 제품이 사용하기 편리하다고 착각하는지도 모른다.


보기 좋은 떡은 먹기에도 좋은 것일까?



실험


Hassenzahl 은 그의 2004년 논문에서 'Beauty', 'Goodness', 'Usability'의 관계를 알아보고자 했다. 기존 연구는 아름다움과 사용성이 서로 관련있다는 입장이었다. 하지만 연구자는 조금 다른 생각을 해봤다. 아름다움은 사용성과 다른 개념이라는 것이다. 


연 구자는 기존 연구에서 제품이 가지는 속성을 hedonic/pragmatic quality로 구분지었다. hedonic attribution의 경우 다시 Identification(다른 사람들에게 자신을 표현하는 수단), Stimulation(지적인 자극이나 창의성)으로 나눌 수 있다. 반면 pragmatic quality는 목표를 성취하기 위해서 제품이 얼마나 유용하게 쓰일수 있는지를 의미한다.


연 구자는 첫번째 실험을 통해 아름다움이 Identification, Stimulation, Pragmatic quality(PQ)와 어떤 관계인지 알아보기로 했다. 우리는 세 가지 결과를 예상해 볼 수 있다. 먼저, Pragmatic quality와 상관있는 경우를 생각해 볼 수 있다. 또는, 단순히 hedonic attribution과 상관있을 수도 있다. 그것도 아니라면, hedonic/pragmatic quality와 모두 상관있을 수도 있다. 첫번째와 세번째의 경우가 발견된다면, 아름다움은 사용성과 관련이 있다고 결론내릴 수 있을 것이다

 



Study 1


절차

연 구자는 MP3 플레이어의 스킨을 실험자극으로 선정했다. 19명의 참가자가 여러개의 스킨을 본 다음 ugly~meauty를 7점 척도로 평정했다. 연구자는 그 중 가장 낮은 점수를 받은 스킨 2개, 가장 높은 점수를 받은 스킨 2개를 실험자극으로 선정했다.


연 구자는 본 실험에서 참가자 집단을 둘로 나눈 다음, 각 집단에게 위에서 고른 스킨 4개를 차례대로 보여줬다. 그리고 나눠준 설문지(AttracDiff 2라는 이름의 이 설문지는 hedonic quality stimulation(HQS), hedonic quality identification(HQI), pragmatic quality(PQ)를 묻는 문항으로 이루어져 있다)를 작성하게 한다. 첫번째 집단과 두번째 집단의 차이점은 스킨의 제시 순서가 달라진다는 점이다.

 

결과

조작점검

ANOVA 분석 결과 skin의 주효과가 나타났다. F(3, 96) = 36.80.  파일럿 테스트에서 참가자들이 아름답다고 했던 스킨은 실험1의 참가자 역시 아름답다고 평가했다.


Attribute group

그 다음 연구자는 각 스킨 별로 HQI, HQS, PQ가 어떻게 달라지는지 알아보고자 했다. 우선, 미적으로 낮은 평가를 받은 스킨끼리 분석을 해 보고, 높은 평가를 받은 스킨끼리 분석을 해 봤다.

 


(네모: PQ,

세모: HQS

검정 세모:HQI)


그 림을 보면 알 수 있지만, Ugly/Beautiful 조건의 스킨 간에도 HQS나 PQ의 차이가 심하게 난다. ugly 조건이라도 어떤 경우는 PQ나 HQS 점수가 높게 나오는가 하면. beauty 조건에서도 두 점수가 낮은 경우가 있다. Ugly와 Beauty를 명확하게 구분해주는 점수는 HQI밖에 없다. HQI의 경우 ugly 조건에서는 낮게, beauty 조건에서는 높게 나타났다. difference = 1.40, t(32) = 10.07,p < .01 (Bonferroni-corrected). 결국 아름다움을 가장 잘 대변하는 점수는 HQI라고 할 수 있겠다.


회귀분석 결과는 이 관계를 더욱 분명하게 보여준다. Beauty를 잘 예측하는 요인은 HQI가 유일했다. β=0.74, t=11.34, p<.001.


연구자는 beauty와 goodness가 같은 개념인지 알아보기로 했다. 둘 간의 상관분석 결과는 r=0.54였다. 또 beauty가 HQI와 관련있는 반면, goodness는 HQI, PQ와 모두 관련있는 것으로 나타났다. 


종 합해보면, 아름다움은 identification과 관련이 있고 goodness는 identification, pragmatic quality와 관련이 있다는 것이다. 즉, 사용성이라는 측면은 아름다움보다 '좋음'과 관련있는 것 같다. 이 결과는 사용성과 아름다움이 서로 연결되어 있다는 기존 연구결과와 상반되는 것이다.


Study2


그럼, 반대의 경우를 생각해 볼 수도 있을까? 즉, 제품을 사용해 보고 사용성을 높이 평가했다면, 그 제품이 아름답다고 생각할 수도 있을까? 사용자가 mp3를 직접 사용해 본 후라면, 스킨에 대한 미적 평가에도 변화가 있을까?

연 구자는 다음과 같은 가설을 세웠다. 만약 위에서 말한 내용이 사실이라면, 제품 사용 후 PQ 점수가 beauty를 잘 예측할 수 있을 것이다. 반면, 아름다움이 사용자 경험에 영향을 받지 않는다면 hedonic attribution(HQI, HQS)가 beauty 점수를 잘 예측할 것이다.


절차

실험2의 절차는 실험 1과 동일하다. 다만, 실험 1처럼 각 스킨에 대한 사전 평가를 내린 다음, 일련의 과제가 주어지는 점이 다르다. 참가자는 이 과제를 수행한 다음 다시 제품에 대한 사후 평가를 내리게 된다.


참 가자에게 주어지는 과제는 다음과 같다. 첫번째 과제의 경우 mp3로 음악을 듣는 중에 전화가 울리게 한다. 참가자는 전화를 받기 위해 mp3 볼륨을 줄여야 한다. 그 다음 다시 mp3 볼륨을 정상으로 돌려놓는다. 두번째 과제의 경우, 참가자들에게 사전에 저장되어 있는 플레이리스트를 로딩시키고, 그 리스트에서 지정된 곡들을 재생해야 한다. 이 과제를 수행한 다음에 mental effort를 측정하는 문항(SMEQ)을 작성한다. 우리는 SMEQ를 통해 어떤 제품이 조작 상 정신적 노력을 더 많이 필요로 하는지 알 수 있고, 정신적 노력이 많이 든다면 그 만큼 사용성도 떨어진다고 예상할 수 있다.


결과

beauty (ugly, beautiful), time (pre-use,post-use), and attribute group (PQ, HQI, HQS)을 독립변인, PQ, HQI, HQS의 평균 점수를 종속변인으로 ANOVA 분석한 결과 beauty와 attriute group의 주효과가 나타났다.

  • ugly, beauty 조건의 HQI, HQS, PQ 결과는 실험 1과 동일하다. 즉, beauty를 온전히 반영하는 점수는 HQI, HQS같은 hedonic attribution이었다.
  • PQ는 goodness와 관련있었으며, 이 둘은 사용자의 경험에 영향을 받았다. HQI와 HQS는 pre-post 점수 간 상관이 높았지만, PQ는 그렇지 않았기 때문이다(즉, 경험 이후 점수에 변동이 있었다).



연구자는 이 결과를 토대로 다음과 같은 모델을 제시했다.



제품이 '좋다'라는 평가은 '아름답다'라는 평가에 영향을 줄 수는 있지만 동일한 개념은 아니다.

'아름다움'은 제품의 사용성(PQ)와 관련이 없다. 사용성은 제품의 '좋음'과 관련있다.

제품의 사용 단계에서 경험하는 mental effort는 사용성에 영향을 받지만, 아름다움에 영향을 미치지 않는다.



결 론은, 사람들이 아이패드의 사용성을 높이 평가하는 것은 아이패드의 외관이 아름답기 때문은 아니라는 것이다. 또 아이패드를 직접 사용해 본 다음 사용성을 높이 평가한 것이 아름다움에 영향을 미치지도 않는다는 것이다. 둘은 관련 있을지 모르나 구분되는 개념같다.


 

 Reference


Marc Hassenzahl, The Interplay of Beauty, Goodness, and Usability in Interactive, HUMAN-COMPUTER INTERACTION, 2004, Volume 19, pp. 319–349
스티브 크룩의 사용성 평가 이렇게 하라
작가
스티브 크룩
출판
위키북스
발매
2010.10.15

 

난이도:

대상: 사용성 조사가 실제로 어떻게 이루어지는지 알고 싶은 사람

 

심리학을 처음 접했을 때 읽었던 책 중 '심리학 실험법'이라는 책이 있었다.

 

심리학 실험법

작가
David W. Martin
출판
시그마프레스
발매
2008.03.05
평점

리뷰보기

 

이 책은 처음 심리학을 입문하는 사람에게 실험 설계를 쉽게 가르치는 데 목적을 두고 있었다. 이 책에서 가장 마음에 들었던 부분은 '복잡한 실험'에 대한 공포증을 버리라는 대목이었다. 실험은 반드시 복잡한 절차와 대단한 장비를 동원해야 가능한 것이 아니다. 일반인이라도 통찰력과 의지만 있다면 얼마든지 좋은 실험을 있는 것이다. 그 후 복잡한 실험과 장비에 대해 배울 때마다 그 구절을 떠올리며 항상 초심을 유지하고자 애썼다.

 

사용성 조사에 막 입문하려는 지금, " 단순한" 진리를 가르쳐 줄 책을 다시 만났다. 사용성 조사로 유명한 스티븐 크룩이 얇은 책자를 낸 것이다. 책 내용은 "DIY 사용성 테스트"에 관한 것이다. DIY 사용성 테스트란 한 마디로 말하면 "쉬운 사용성 테스트"다. 이 방법을 통해 관련 분야 종사자는 물론, 일반인도 자신의 블로그나 홈페이지 등을 조사해 볼 수 있다. 누구나 할 수 있는, 어렵지 않은 조사 방법이다.

 

DIY 사용성 테스트는 3명 정도 밖에 되지 않는 참가자를 관찰한다. 참가자를 선정하는 기준도 까다롭지 않다. 참가자가 수행할 과제를 선정하고, 체크리스트를 만들고, 장비를 체크한 다음, 참가자를 관찰한다. 그게 전부다.

하 지만, 현업에 종사하는 사람에게도 많은 팁을 주고 있다. 저자는 한달에 한번, 반나절만 소요되는 간단한 테스트의 이점을 설명한다. 고객들, 관련 부서 사람들이 모두 모여 참가자를 관찰할 수 있는 기회를 마련하기 위함이다. 테스트실과 관찰실에서 준수해야 할 사항들은 전문가들에게 꼭 필요한 조언이다. 책 내용은 쉽지만, 전문가도 지나치기 쉬운 중요한 사항이나 노하우를 담고 있다.

 

아 무 생각 없이 '사용성 조사는 뭐야?'라고 궁금해 하는 독자에게 이 책을 권하고 싶다. UX의 이론은 모두 섭렵했지만, 실제 현장에서 어떻게 해야 할지 감이 오지 않는 사람도 도움을 받을 수 있다. 많은 독자층에 걸쳐 '사용성'이 뛰어난 책이라고 생각한다.

'인지심리 관련서적' 카테고리의 다른 글

인지심리 관련서적 목록  (4) 2011.09.03
[책리뷰]붓다 브레인  (0) 2011.08.03
[책리뷰]사용자 경험 측정  (2) 2011.08.03
[책리뷰]멘탈 모델  (0) 2011.08.03
[책리뷰]심리학으로 밥 먹고 살기  (0) 2011.08.03

Posted by 인지심리 매니아


사 용성 평가는 HCI 분야에서 빠질 수 없는 방법론으로 여겨진다. 이제는 모든 제품을 개발할 때 사용성 평가를 거쳐야 할 것 같은 생각마저 든다. 하지만 '필수적' 절차로 생각되는 사용성 평가가 오히려 해악이 되는 경우도 있다. 어떤 것이든 한가지 방법 만을 고수하면 문제에 봉착하기 마련이다. 오늘은 사용성 평가가 만병통치약이 될 수 없는 이유를 설명한 벅스턴의 논문을 소개하기로 한다.


Buxton 은 2008년 논문에서 사용성 평가를 적용할 때 조심해야 할 점을 언급하고 있다. 저자도 서두에서 사용성 평가가 학회, 기업에서 할 것 없이 널리 쓰이고 있다는 것을 인정한다. 하지만 사용성 평가가 오히려 독이 되는 경우가 있음을 주지시키고 있다. 그러면, 어떤 상황에서 사용성 평가가 독이 되는 것일까?



Weak Science


사회과학을 포함한 과학은 가설을 검증할 때 독특한 방법을 사용한다. 연구자가 주장하는 가설을 입증하기 보다 '기각' 하는 방법을 사용하는 것이다. 예를 들어, 내가 잘 생겼다는 가설을 입증하기 위해서 나의 외모를 칭찬하는 사람을 찾는 것이 아니라, 내 외모를 욕하는 사람을 찾는다는 것이다. 만약 내 외모를 욕하는 사람이 한명이라도 있다면 '나는 잘생겼다'라는 주장은 거짓으로 드러난다. 즉, 내 가설이 참임을 보는 것이 아니라 거짓인지 여부에 초점을 맞추는 것이다.


일반인들의 눈에는 이런 검증방법이 다소 이상해 보일 수도 있다. 하지만 이런 가설 검증 방법이야말로 과학을 진짜 'Strong Science'로 만든다(도대체 왜 이런 방법이 과학적인지 이해하지 못하겠다면 칼 포퍼에 관한 글을 참고하기 바란다). 어떤 가설이 끊임없는 반박(반증)연구에도 불구하고 살아남으면 강력한 이론으로 변신한다. 수천명을 뒤져봐도 내가 못 생겼다는 사람을 발견하지 못했다면, 아직까지는 내 주장이 사실인 것이다. 난 계속 잘 생긴 사람으로 남게 된다.


사용성 테스트의 문제는 과학에서 사용하는 검증방법을 온전히 채택하지 않는다는 데 있다. 사용성 테스트는 가설을 반박하기 보다 '입증' 하는 데 초점을 맞춘다(confirmative hypothesis testing). 신제품이 기존 제품보다 뛰어나다는 가정을 검증할 때, 사용성 테스트는 이 가정을 입증하는 '최소한 한 개 이상의 증거'를 찾는다. 가정과 맞아떨어지는 사례를 하나라도 발견하면 우리 주장은 맞다는 것이다. 하지만 이건 진정한 의미의 과학적 검증이 아니다. 생각해보자. 내 얼굴이 잘 생겼다고 친구에게 주장하자 친구가 사실임을 입증해보라고 한다. 나는 길을 가던 사람 하나를 붙들고 내가 잘 생겼는지 물어본다(실제로는 이런 황당한 일은 없겠지만). 다행스럽게도 그 사람은 내가 잘생겼다고 대답한다. 나는 의기양양하게 '내가 잘 생겼다'고 주장한다. 친구는 어이가 없는 표정이다. 고작 한 사람의 의견에 근거해서 '내가 잘 생겼다'라는 주장이 참임을 알 수 있을까? 


또 다른 문제점은 이 분야갸 '반복검증가능성'을 고려하지 않는 다는 것이다. 한 연구를 통해 발견된 현상은 다른 논문에 의해서 반복적으로 발견될 때 일관성 있다고 판단될 것이다. 친구가 거리를 돌아다니며 내 사진을 보여주고 잘생겼는지 물어봤지만 결과가 매번 똑같다면, 결국 내 주장이 진리인 것이다. 또 반복검증가능성은 이론이 적용될 수 있는 범위를 찾는 데도 중요하다. 친구가 유치원생들에게 내 사진을 보여줬는데 한결같이 못 생겼다고 대답했다면, '적어도 유치원생의 눈에는 내가 잘 생겼다는 사실이 적용되지 않는다'고 판단할 수 있다.


문제는 CHI의 경우 결과가 replicate된 논문을 '예전 것과 똑같네'라고 하며 간과해 버린다는 것이다. 결국 학회에 논문을 내기 위해선 예전 것과 다른 '새로운 것'을 연구해야만 한다. 결국, 같은 내용에 대해 반복된 결과를 검증한 논문이 자취를 감추게 되는 것이다. 이런 결과는 외적 타당도를 떨어뜨릴 것이다. 내 얼굴은 20대 초반 여성에게는 매력적일지 몰라도, 우리 집 뒤에 있는 유치원의 원생들에게는 전혀 그렇지 않다.


사용성 조사의 방법은 결국 다소 약한 형태의 과학적 방법이라고 할 수 있을 것이다. 연구 결과를 통해 과학적 지식을 축적하기에는 무언가 미덥지 않은 결과들인 것이다.



사용성 조사 관행


벅스턴은 사용성 조사의 초기에 만드는 스케치와 프로토타입을 구분한다. 둘은 아래 그림처럼 양 극단의 특징을 가진다.




스케치는 비교적 초기에 만들어지는 대안이다. 이 단계에서 UX 디자이너들은 직관적인 영감을 통해 아이디어를 산출한다. 따라서 스케치를 하는 과정은 탐색적, 실험적인 단계다. 반면 프로토타입은 스케치에 살을 입혔다고 볼 수 있다. 보다 구체적인 기능이 입혀져 있고, 정제되어 있는 대안이다.


벅스턴은 사용성 조사가 문제를 일으키는 이유는 조사가 스케치 단계에서 바로 이루어지는 것과 관계있다고 설명한다. 아이디어을 생성하는 단계에서는 최대한 많은 대안을 생각할 필요가 있다. 하지만 사용성 조사는 성격상 '대안을 가지 치는' 방법론이다. 이 방법은 사용성의 '문제'에 초점을 맞추고 적합하지 않은 대안들을 지워버린다. 따라서 혁신적인 대안들이 초반에 탈락하는 문제가 생긴다.


우리는 '올바른 디자인을 만드는 것'과 '디자인을 올바르게 만드는 것' 을 구분할 필요가 있다. 사용성 조사는 후자에 도움을 줄 수 있지만, 첫번째 문제에도 그런 것은 아니다. 아이디어 중에는 사용성이 다소 떨어지지만 창의적인 대안이 있을 수 있다. 올바른 디자인을 만드는 것은 가능성 있는 소재를 생성하고 택하는 과정에서 가능하다. 가능성이 있는 소재들을 되도록 많이 모은 다음, 추후에 사용성 조사를 거쳐서 정제하는 방법을 택한다면, '올바른 디자인을 만들고, 그 디자인을 올바르게 만들 수 있다'.



Useful


사용성 조사는 Usable의 문제다. 어떻게 보면 기술적인 측면에 초점을 맞춘 조사방법일 수도 있겠다. 문제는 useful하지만 usable하지 않은 제품이 히트를 치는 경우가 종종 있다는 것이다. 대표적인 예가 바로 WWW이다. 웹은 처음에는 사용하기 까다로운 제품이었다. 하지만, 시간이 지나면서 점차 유저 프렌들리한 인터페이스를 갖추었다. useful한 제품이 나중에 Usable한 속성까지 가지게 된 것이다. 만약 우리가 90년대로 거슬러 올라가서 웹에 대한 사용성 조사를 했다면, 조사자들은 웹이 수년도 못 가서 없어질 것이라고 전망했을 것이다.


그 럼, 사용성 조사에서 usable과 함께 useful을 평가할 수는 없는 걸까? 그렇게만 할 수 있다면 장래 인기를 끌 제품을 미리 알 수 있고, 여기에 사용성 조사까지 미리 진행할 수 있어서 좋을텐데 말이다. 현재 관행상 이를 함께 알 수 있기는 힘들다고 한다. Christensen1에 의하면, 참가자들은 제품의 기술적 혁신이 useful로 이어질 수 있을지 예측할 수 없다고 한다. 결국 제품의 값어치(useful)를 초기에 발견하는 일은 사용자 조사의 몫이라기 보다조사자의 몫으로 남게 되었다.



solution


저자는 이 외에도 많은 문제점을 지적했지만, 한편으로 이 문제를 해결할 방안들을 함께 적어놨다. 그 방안들은 다음과 같다.


먼저, 형식적인 사용자 조사 기법에 전적으로 의존하지 않는 것이다. 옛말에 '선무당이 사람 잡는다'는 말이 있다. 우리는 사용성 조사에 날이 무딘 'Weak Science' 기법을 사용하고 있다. 더군다나 이런 분석 기법들이 도입된 역사가 길지도 않기 때문에 방법론이 안정적으로 발전을 시간도 없었다. 이런 불충분한 방법론을 단지 '과학적 방법'이라고 해서 단순 신봉하는 것은 문제가 있다. 우리는 사용자의 의견을 직접 들어보는 예전 방식을 적절히 활용할 줄 알아야 한다. 숫자와 통계 사이에서 진짜 놓칠 수 있는 사용자의 '니즈'를 파악하기 위함이다.


두번째로, 사용자 조사를 어느 단계에서 적용할지 고심해야 한다. 앞서 말했지만, 아이디어를 산출하는 단계에서 사용자 조사를 시행하면, 가능성 있는 대안들을 버리게 될 수 있다. 아이디어 중에는 사용성이라는 날개를 달아주면 훨훨 날아다닐 혁신적인 대안들도 존재한다. 형식적인 조사에만 의존하지 말고 재목을 찾기 위해 보다 신경쓴다면, 버려질뻔한 가능성을 찾을 수 있다.


마지막으로, 보다 엄격한 과학적 방법을 사용해야 한다는 것이다. 만약 새로운 아이디어를 탐색하는 과정이라면, 종전에 사용하던 confirmative hypothesis testing이 적합할 수도 있다. 하지만 기존의 이론을 발전시키거나 검증하는 과정에서는 risky hypothesis testing이 적합하다. 날 좋아하는 여자가 존재할 가능성을 찾을 땐 내가 잘 생겼다고 말하는 여자 한 명으로도 족하다. 하지만 내가 잘 생긴게 전우주적인 진리인지를 판단할 때는 보다 엄격한 기준을 세워야 한다. 여자 친구의 말만 들을 수는 없기 때문이다.




Reference


Saul Greenberg, Bill Buxton, Usability Evaluation Considered Harmful (Some of the Time), CHI 2008 Proceedings

사용자 경험 측정
작가
빌 알버트, 토마스 툴리스
출판
지앤선
발매
2009.07.06

난이도:

대상: UX에 관심 있는 사람

        사용자 조사 방법론을 탐색, 연구하는 사람

       


이 책은 사용자 경험 측정, 특히 사용자 조사에서 사용하는 매트릭스를 소개한 책이다. 사용자의 반응을 측정하기 위해서 다양한 방법이 사용될 수 있다. 하지만 프로젝트의 특성에 알맞는 매트릭스를 고르는 것은 쉽지 않다. 특정 사이트의 UI를 조사해 본다고 가정하자. 우리는 어떤 매트릭스를 사용해야 할 것인가? 과제 완료에 소요된 시간? 성공률? 참가자의 주관적 느낌?


저자는 프로젝트의 특성에 적합한 매트릭스(심 리학도에게는 '종속변인'이라는 표현이 더 쉬울 지도 모르겠다)를 소개하고 있다. 유저빌리티 테스트에서 사용하는 매트릭스로는 과제 성공률, 소요 시간, 에러, 효율성, 학습성, 이슈(문제점), 자가 기록 매트릭스, 행태적/생리적 매트릭스, 결합/비교 매트릭스(심리학에서는 이를 복합 종속 변인이라고 한다) 등이 있고 그 외에 실시간 웹 사이트 매트릭스와 카드 소팅 데이터도 포함된다.


이 책에서 소개한 매트릭스는 정량적인 방법을 사용하고 있다. 현장에서 사용자 조사를 수행하는 사람들은 이 책의 방법들을 참고해서 수치적으로 명확한 결과를 얻을 수 있을 것이다. 데이터를 정량화하면 신뢰 구간이나 식스시그마, T-test, ANOVA 분석 방법을 활용할 수 있게 되어 전집의 특성을 추론할 수 있다는 장점이 있다.

이 책의 또 다른 장점은 자가 기록 매트릭스와 관련하여 기존 연구자들이 사용한 평가 도구를 소개하고 있다는 점이다. 조사를 수행할 때 조사자가 새로운 평가 척도를 만드는 것은 부담스러운 일이다. 새로 만든 평가 도구가 어느 정도의 신뢰성을 담보할지 알 수 없으며, 다른 사람들이 개발한 척도의 결과와 비슷한지, 또 표본 수의 영향을 받지는 않는지 알 수 없기 때문이다. 다행히도 이 책은 표본 수에 Robust하고 다른 측정치와의 비교를 통해 일관성 있다고 평가받은 측정 방법을 소개하고 있다. 시스템 유저빌리티 척도(SUS), 사후 시나리오 질문(After-Scenario Questionnaire, ASQ), 사용자 인터페이스 만족도에 대한 설문지(Questionnaire for User Interface Satisfaction, QUIS) 등 다양한 척도가 책에 실려 있다.

책의 마지막 부분에는 실제 사용성 조사 사례들이 실려 있다. 각 사례들은 연구 진행 절차와 참가자 수, 사용한 척도 등이 적혀 있다. 실무에서 일하는 사람이나 UX를 공부하는 학생 모두에게 도움이 될 내용이라고 생각한다.



멘탈모델
작가
인디 영
출판
인사이트
발매
2009.11.19

 

 

난이도: 중

대상: 사용자 리서치에 관심 있는 사람


사용자 리서치에는 많은 방법이 있다. 그 중, 사용자의 요구사항이 무엇인지 연구하는 정성적 연구방법으로 '멘탈 모델'이 있다. 사회조사방법론의 '탐색적 연구'에 해당하는 개념이라고 할 수 있다.


이 책은 사용자의 멘탈 모델을 만들어서 제품이나 웹 개발에 활용하는 방법을 설명하고 있다. 먼저 연구자들이 사용자를 일정한 집단으로 나눈다. 그 다음 타켓 사용자 집단을 모집하여 인터뷰를 진행하고, 인터뷰 내용을 데이터화 한다. 참가자들의 발언을 행동 단위로 나누어서 수많은 행동들로 나누고, 거기에서부터 행동기둥, 인지공간을 만들어낸다. 이 모델을 다 완성하고 난 다음, 현재 제품이나 웹사이트가 가지고 있는 기능을 모델과 비교해서 어떤 기능을 개선하거나 추가할지를 결정한다.


멘탈 모델의 연구방법은 전적으로 조사자의 노력을 필요로 한다. 사용자들의 행동들을 조사자의 판단으로 분류해야 하는 작업이다. 또한 방대한 양의 자료를 정리해야 하는 힘든 작업처럼 보인다.


몇가지 의문점이 든다. 우선, 저자는 멘탈 모델이 인지심리학에서 말하는 '내적 표상(mental representation)'과 다르다는 점을 설명한다. 멘탈 모델이 인간의 일반적 표상을 구현한 것이라면, 인지심리학의 내적 표상은 각 실험 패러다임에 국한된 표상이라는 것이다.

두 개념이 서로 다름에도 불구하고, 내적 표상과 멘탈 모델은 서로에게 기여할 수 있다. 물론, 각 실험을 통해 검증된 내적 표상은 어디까지나 '그 실험에 국한된' 표상일 수 있다. 그런데, 각 실험의 결과들은 궁극적으로 인간의 보편적인 표상을 만드는 데 있다. 표상의 일반화 정도로만 본다면, 인지심리이론의 범위가 멘탈 모델보다 오히려 더 클 수 있다.

두 개념이 다르다고 해서 인지심리의 수많은 결과와 방법론을 버려둔 체, 처음부터 다시 고생을 할 필요는 없을 것이다. 내적 표상에 관한 연구에서 취할 게 있다면 취함으로써, 멘탈 모델 조사자는 불필요한 시간과 비용을 줄일 수 있을 거라고 생각한다.


또, 멘탈 모델이 정성적 연구방법이라는 점은 이해가 가지만, 정량적 방법을 통해 쉽게 해결할 수 있는 문제를 매우 어렵게 해 나간다는 인상을 받았다. 멘탈 모델 방법론에서는 사용자들이 한 번이라도 언급했던 행동들을 모두 분류한다. 순간 어지럼증을 느꼈다. 사실, 사용자들이 말한 내용중 가장 중요한 핵심행동은 몇 개 되지 않는다. 모든 행동을 전부 분류화한다고 해서, 또 그에 상응하는 기능을 모두 만드는다고 해서 제품이나 웹이 필연적으로 성공하지는 않는다. 참가자 수 등 여건 때문에 어렵긴 하겠지만, 이럴 때는 요인 분석을 쓰는 게 좋지 않을까 생각한다. 이를 통해 중요한 핵심 요인만 추려낼 수 있을 뿐더러, 조사자가 하는 분류작업을 통계 패키지가 할 수 있다는 이점까지 더할 수 있다.


위 의 얘기는 어디까지나 심리학에서 바라본 입장임을 이해해 줬으면 한다. 멘탈 모델은 확실히 사회과학조사방법론과는 다를 것이다. 하지만, 방법론에 있어서는 서로 도움을 줄 수 있다고 생각한다. 사용자 조사는 역사가 길지 않은 분야인 만큼, 정교하게 발전한 심리학의 연구방법에서 도움을 받는 것도 좋을 것이라고 생각한다. 서로 교류하면서 더욱 정교한 방법론을 만들어 갈 수 있을지 나도 좀 더 공부해 볼 생각이다.

+ Recent posts