에니어그램 테스트의 방법론과 신뢰도 (2025)
이 연구를 읽으시면, 전반적으로 에니어그램 테스트들이 직면하는 과제와, enneagram-personality.com이 현시점에서 온라인상에 공개된 에니어그램 테스트 중 가장 신뢰도가 높은 테스트가 될 수 있도록 어떤 방법론과 노력이 이루어졌는지에 대해 더 잘 이해하게 되실 것입니다.
목차
소개
enneagram-personality.com(이전 명칭 enneagram.bz)에서 제공하는 에니어그램 테스트는 2018년부터 존재해 왔습니다. 이 테스트는 가능한 한 높은 신뢰도를 갖추도록 설계되었는데, 그 이유는 인터넷에 널리 퍼져 있는 주요 에니어그램 테스트들이 충분한 신뢰도를 갖추지 못한 경우가 많아, 많은 사람들이 잘못된 결과를 얻어 에니어그램의 잠재력을 제대로 활용하지 못한다는 점을 발견했기 때문입니다.
신뢰도 높은 에니어그램 테스트를 위해서는 각 에니어그램 유형에 특화된 정확하고 구체적인 질문들이 필요하며, 각 답변에 따라 특정 에니어그램 유형을 유리하게 혹은 불리하게 만드는 복잡한 알고리즘이 요구됩니다.
정교하게 다듬어진 알고리즘과 그 특징
enneagram-personality.com에서 제공하는 에니어그램 테스트는 출시 후 수년간 1,500,000명 이상이 응시하였고, 이를 통해 테스트 운영진은 테스트의 알고리즘을 최대한 정교하게 개선할 수 있었습니다.
실제로 이 테스트의 알고리즘은 꽤 복잡한데, 각 질문마다 특정 유형을 우세하게 만들거나 다른 유형을 불리하게 만들 수 있습니다. 이를 가장 효율적으로 다듬기 위해, 각 질문은 크게 두 가지 관점에서 면밀히 검토되었습니다. 첫째, 대규모 데이터에서 ‘신뢰도 높은 결과’를 보이는 응답자들이 유형별로 평균적으로 어떻게 응답했는지를 분석했고, 둘째, 에니어그램의 기본 이론을 철저히 준수했습니다. 또한 어떤 질문이 여러 유형에게 공통적으로 많이 해당되는 것으로 보일 경우, 해당 질문을 아예 교체하여, 특정 유형에 좀 더 정확히 초점을 맞추도록 조정하기도 했습니다.
예를 들어, 테스트의 "나는 적응력이 뛰어나고 사교적이어서, 내가 속하고 싶은 사회적 모임이나 무리에 자연스럽게 녹아드는 편이다"(유형 3)라는 문항은 매우 유의미한 예시입니다. 내부적으로 각 유형별 평균 응답을 간단히 살펴보면(예: 10,730명의 결과 기반) 다음과 같은 평균값이 도출됩니다:
이때 사용자의 응답은 다음과 같은 범주로 나뉩니다:
- 2/2 = 매우 그렇다
- 1/2 = 그렇다
- 0/2 = 중립
- -1/2 = 아니다
- -2/2 = 전혀 아니다
이 수치에서 보듯, 유형 3은 해당 문항에 대해 ‘매우 그렇다(1.7/2)’라고 답할 확률이 크게 높았습니다. 반면, 그 외 유형은 대체로 중립 혹은 매우 부정적인 응답을 보이는데(예: 유형 5는 -1.1/2로 매우 내향적), 유형 7(0.7/2)만이 약간 긍정적(사교적이고 적응력이 뛰어남)인 편에 가깝습니다.
그렇다면 유형 3과 유형 7처럼 종종 비슷하게 보이는 두 유형을 어떻게 구별할 수 있을까요? 바로 이 점이 정교한 에니어그램 테스트가 해야 할 핵심 작업입니다. 예를 들어, 유형 3을 겨냥한 다른 문항을 살펴보면,
"나는 다른 사람들에게 ‘성공한 사람’으로 보이는 경향이 있으며, 이런 모습이 나를 동기부여한다."
라는 진술이 있는데, 이 문항에 대해서는 유형 7(평균 0/2)을 비롯해 대부분의 유형이 중립/부정적인 반응을 보이는 반면, 유형 3은 1.1/2로 긍정적입니다. 또한 권력에 매력을 느끼는 유형 8이 약간 긍정적(0.6/2)으로 나타나지만, 이전 문항에서 유형 8은 0.3/2였고, 유형 7은 1.7/2였기 때문에, 이미 유형 7과는 쉽게 구분할 수 있습니다.
이처럼 각 문항을 신중히 선별하고, 특정 유형을 이롭게 혹은 불리하게 점수화함으로써 테스트의 신뢰도를 높이도록 설계되었습니다.
물론 같은 에니어그램 유형에 속한 사람이라 해도, 자신의 유형과 관련된 모든 문항에 항상 긍정적으로 답하지는 않습니다. 다만, 좋은 에니어그램 테스트라면 해당 유형을 가장 잘 나타내는 문항들을 우선적으로 반영해야 합니다.
아슬아슬한 결과들
이러한 장치를 모두 적용했음에도, 결과가 꽤 아슬아슬하게 나오는 경우가 있습니다. 예를 들어 80 %가 유형 8, 70 %가 유형 7, 35 %가 유형 3처럼, 두 유형 간 차이가 12% 미만인 상황입니다. 이럴 때 테스트 결과 화면에서는 사용자에게 결과가 ‘아슬아슬’하게 나왔다고 안내하고, (예시로 유형 8이 주 유형, 유형 7이 다음 후보지만 단 10% 차이뿐이므로) 각각의 유형 설명을 잘 읽어보며 자신과 더 부합하는지 검토하라고 권장합니다.
이 과정은 매우 중요합니다. 대부분의 다른 에니어그램 테스트는 이렇게 결과가 아슬아슬한 경우를 따로 언급하지 않고, 사용자가 제시된 유형을 곧이곧대로 받아들이게 만듭니다. 그 결과, 잘못된 유형을 주 유형으로 받아들이고 에니어그램의 잠재력을 활용하지 못하는 경우가 적지 않습니다. 실제로는 다른 유형도 상위권에 있었는데, 단지 메인으로 표기되지 않았다는 이유만으로 놓치는 경우가 많기 때문입니다.
사용자 평가
이처럼 응시자가 최종 결과를 확인할 때, enneagram-personality.com 테스트는 ‘주 유형을 제대로 찾았는가(다른 유형과 최소 12% 이상의 차이를 두었는가)’를 먼저 판단하여, 그렇지 않은 경우 가능한 유형들을 함께 안내하고 그중 가장 유력해 보이는 유형을 강조합니다.
그리고 알고리즘의 정교함과 효율성을 측정하기 위해, 테스트에서는 결과와 해당 유형 설명을 확인한 후 1점부터 5점까지 다음의 기준으로 평가하도록 요청하고 있습니다:
- 5/5 - 이 유형이 내 주 유형인 것 같다
- 4/5 - 나와 비슷하지만 내 주 유형은 아닐 듯하다
- 3/5 - 어느 정도는 맞는 것 같다
- 2/5 - 나와 맞지 않는 것 같다
- 1/5 - 전혀 나와 맞지 않는다
테스트와 문항에 대한 마지막 대규모 개선은 2023년 2월에 이루어졌고, 2023년 3월 1일부터 이 연구가 작성된 시점(2025년 12월 15일)까지 총 1,923명의 응시자가 자신의 결과를 평가해 주었습니다(해당 평가는 이 링크에서 언어별로 누구나 확인할 수 있습니다). 물론 전체 사용자 중 대부분은 평가를 남기지 않기 때문에, 평가 수와 실제 응시자 수에는 차이가 있습니다.
다음 표는 모든 평가를 합산한 결과입니다:
유형 |
평가자 수 |
1/5 |
2/5 |
3/5 |
4/5 |
5/5 |
1 |
136 |
0.74% (1) |
0.74% (1) |
9.56% (13) |
5.88% (8) |
83.09% (113) |
2 |
243 |
2.88% (7) |
2.47% (6) |
9.88% (24) |
7.00% (17) |
77.78% (189) |
3 |
245 |
3.67% (9) |
6.12% (15) |
14.29% (35) |
11.02% (27) |
64.90% (159) |
4 |
272 |
0.74% (2) |
0.74% (2) |
10.66% (29) |
7.35% (20) |
80.51% (219) |
5 |
216 |
0.46% (1) |
0.93% (2) |
4.63% (10) |
10.19% (22) |
83.8% (181) |
6 |
111 |
1.8% (2) |
0.9% (1) |
9.01% (10) |
12.61% (14) |
75.68% (84) |
7 |
190 |
1.58% (3) |
3.68% (7) |
7.89% (15) |
9.47% (18) |
77.37% (147) |
8 |
224 |
4.02% (9) |
0.00% (0) |
7.14% (16) |
8.04% (18) |
80.8% (181) |
9 |
286 |
2.1% (6) |
1.4% (4) |
6.29% (18) |
7.34% (21) |
82.87% (237) |
Total |
1923 |
2.08% (40) |
1.98% (38) |
8.84% (170) |
8.58% (165) |
78.52% (1510) |
표를 보면 알 수 있듯이, 1,923명 중 1,510명이 테스트가 자신의 주 유형을 제대로 찾아냈다고 판단하여, 약 80%에 달하는 평가자들이 긍정적인 결과를 준 셈입니다(5명 중 4명꼴).
유형별로 개별 사례를 분석하면, 대체로 80%가량의 응시자들이 자신을 잘 찾아냈다고 느낍니다. 다만, 유형 3은 약간 낮은 편인 65%의 만족도를 보이지만, 여전히 긍정적입니다. 이는 유형 3이 ‘카멜레온’, ‘연기자’로 불릴 정도로 스스로를 받아들이기 어려운 면이 있을 수 있기 때문입니다. 예컨대 ‘칭찬받으려는 욕구’를 수용하고 인정하는 일이 쉽지 않을 수 있고(특히 이미지에 가장 신경 쓰는 유형이기 때문에), 문항 자체가 매우 구체적이라도 거부감이 생길 여지가 있습니다.
결론
이처럼 여러 해에 걸쳐 질문과 알고리즘을 정교하게 개선하고, 내부에서 어떤 과정을 거쳤는지 비교적 투명하게 공개하는 유일한 사례라는 점에서, 에니어그램 테스트 enneagram-personality.com은 현존하는 인터넷상의 테스트 중에서 가장 높은 신뢰도를 갖출 가능성이 있습니다.
평가자 기준으로는 약 80%(5명 중 4명)가 자신에게 맞는 유형을 제대로 찾아준다고 응답했습니다. 물론 이 수치가 100%에 더 가깝다면 이상적이겠지만, 완벽에 도달하기 어려운 몇 가지 이유가 있습니다:
- 사용자 본인이 자신을 인정하거나 파악하기 어려울 수 있습니다. 에니어그램은 다른 성격검사와 달리 단순히 긍정적 자질만을 강조하지 않고, 깊은 내면의 ‘강박(컴펄션)’이나 ‘불균형’ 상태를 전제하기 때문입니다. 자신에게 있는 결점을 마주하거나, ‘불균형 상태’라는 개념을 이해하기 어려워하는 사람들도 적지 않습니다.
- 사용자가 자신의 실제 모습이 아니라, 본인이 생각하거나 바라는 이상적인 모습으로 답변해 버릴 가능성도 있습니다.
또한 에니어그램 이론 자체가 아직 완벽하지 않을 수 있고, 더 많은 기여나 연구가 필요할 수 있습니다. 예컨대, 우리가 아는 현대적 에니어그램 이론에 큰 영향을 준 정신과 의사 클라우디오 나란호의 연구도 비교적 최근(에니어그램 이론은 기원전 수천 년에 해당할 만큼 정확한 기원을 알 수 없다고 하기도 하죠)인 1980년대에 이뤄졌으며, 통합 및 분열(디스인트그레이션) 유형을 포함해 많은 개념들이 추가되었습니다.
게다가 에니어그램은 원래부터 ‘테스트’가 아니라 ‘이론’입니다. 따라서 스스로 공부하면서 자신의 유형을 탐색하는 것이 권장됩니다. enneagram-personality.com 같은 에니어그램 테스트는 에니어그램에 입문하는 데 꽤 유용하고 효과적인 도구이지만, 대략 80% 정도가 바로 주 유형을 찾아낼 수 있는 것으로 보입니다. 그렇다 하더라도 자신이 찾은 유형이 맞는지, 그리고 그 이론을 활용해 자기 발전에 어떻게 적용할 수 있는지 확인하기 위해서는 여러 출처를 참고해 공부해보는 것이 좋습니다.