九型人格测试的方法论与可靠性(2025)
阅读本研究后,您将更好地了解九型人格测试普遍面临的挑战,以及为使 enneagram-personality.com 成为目前网络上最可靠的九型人格测试而所做的工作和方法论。
目录
引言
enneagram-personality.com(前身为 enneagram.bz)的九型人格测试自 2018 年开始上线。它的设计目标就是力求最准确、最可靠,因为其创建者发现,当时互联网上主要的九型人格测试并不够可靠,导致很多人在测试时得出的结果与自己并不相符,从而错失了更好地运用九型人格的潜力。
一个可靠的九型人格测试需要精准的问题——它们对每个九型人格类型都有针对性,并且配合一个复杂的算法;这个算法会根据每个回答的具体情况,给某些类型"加分",也给其他类型"减分"。
精心打磨的算法及其要点
自该测试上线以来,已有超过 1,500,000 人参与了九型人格测试。庞大的数据量使得测试的管理方能够不断完善并"打磨"其算法。
实际上,这个算法相当复杂。因为每道题目都会在针对某些特定类型时增分,同时在针对其他类型时减分。为了实现最有效的打磨,团队一方面深入分析了各类型用户(在结果已被证实较为可靠的情况下)对每道题的平均回答倾向,且样本量大;另一方面,也会遵循九型人格的基本理论原则。有时,如果某一道题同时被好几种类型的人共同认同("模糊"了类型差异),那么就会考虑以更能区分类型的题目来替代。
举个例子,测试里有这么一个陈述:"我适应性强,社交活跃,想要融入某个社交圈子时,通常能很自然地加入"(类型 3)。之所以说它非常切合类型 3,是因为从大规模数据的平均回答来看(例如在 10,730 条结果中):
用户的回答选项如下:
- 2/2 = 非常符合
- 1/2 = 比较符合
- 0/2 = 中立
- -1/2 = 不太符合
- -2/2 = 完全不符合
从上述数据可看出,类型 3 的受测者大多表示"非常符合"(平均分 1.7/2)。而其他类型对于这道题要么偏中立要么大多持否定态度(例如 类型 5 平均为 -1.1/2,是相对内向的类型)。只有 类型 7 略微倾向"比较符合"(0.7/2)。
那么,如何区分类型 3 与类型 7(它们有时会相似)呢?这就需要精心打磨的测试来完成。举例来说,测试里还有另一道针对类型 3 的陈述:
"我常常给人一种'成功人士'的印象,这也激励着我。"
在这道题上,大多数类型要么持中立,要么持否定态度(类型 7 的平均分为 0/2),只有类型 3(1.1/2)和类型 8(0.6/2)略高,因为类型 8 对权力有一定吸引力。但要区分类型 8 与类型 7,前面那道题已经显示了明显差异:类型 8 为 0.3/2,而类型 7 为 1.7/2!
通过这些措施,每道题都经过精心打磨,以便它在尽可能凸显针对某些特定类型时,还能够有效排除其他类型。
当然,同一九型人格类型的不同人并不一定会对所有针对该类型的陈述都表示强烈认同。但优先采用那些对该类型"最具代表性"的陈述,有助于提高整体的准确性。
接近度较高的测试结果
即便测试通过了各种优化,有些人的结果依然会"非常接近",例如某人测出来:80% 类型 8、70% 类型 7、35% 类型 3 等。当类型间的分差低于 12%时,测试结果会提醒用户这是一份"接近度较高的结果",并提示用户仔细阅读各可能的主类型描述,结合自身情况进行辨别,防止因为测试分数接近而产生偏差。
这一步相当重要。因为绝大多数其他九型人格测试并不会给出这样的"接近度分析",也不会提醒用户如果结果之间分差很小,需要深入对比各候选类型。结果是很多人只看到测试"一锤定音"的类型,却忽视了与之接近的类型,导致和自己并不完全匹配的类型被误认为是"本我类型",从而错失了使用九型人格理论的更大潜力。
用户评价
在每位测试者完成测试并看到结果后,enneagram-personality.com 会明确指出该测试是否"自认为"找到了用户的主类型(即是否至少比其他类型多 12% 以上),如果差距不足,则会列举多个可能的类型,并指出哪种最有可能。
为了进一步完善算法、评估其效果,测试还会邀请用户在阅读完各自的测试结果后进行 1 到 5 的打分,评分标准如下:
- 5/5 - 看起来的确是我的主型
- 4/5 - 跟我挺像,但我不觉得这是我的主型
- 3/5 - 有点像
- 2/5 - 跟我差得比较远
- 1/5 - 完全不像我
该测试的上一轮重大更新是 2023 年 2 月,包括对算法和题目的再度完善。自 2023 年 3 月 1 日起至本研究撰写时(2025 年 12 月 15 日),共有 1,923 名测试者对结果进行了评分(此评分对所有人开放,可在此链接中查看,并可根据语言进行筛选)。测试者人数远多于评分人数,是因为大多数人测完并不会给出评价。
目前的评分结果如下:
类型 |
评价人数 |
1/5 |
2/5 |
3/5 |
4/5 |
5/5 |
1 |
136 |
0.74% (1) |
0.74% (1) |
9.56% (13) |
5.88% (8) |
83.09% (113) |
2 |
243 |
2.88% (7) |
2.47% (6) |
9.88% (24) |
7.00% (17) |
77.78% (189) |
3 |
245 |
3.67% (9) |
6.12% (15) |
14.29% (35) |
11.02% (27) |
64.90% (159) |
4 |
272 |
0.74% (2) |
0.74% (2) |
10.66% (29) |
7.35% (20) |
80.51% (219) |
5 |
216 |
0.46% (1) |
0.93% (2) |
4.63% (10) |
10.19% (22) |
83.8% (181) |
6 |
111 |
1.8% (2) |
0.9% (1) |
9.01% (10) |
12.61% (14) |
75.68% (84) |
7 |
190 |
1.58% (3) |
3.68% (7) |
7.89% (15) |
9.47% (18) |
77.37% (147) |
8 |
224 |
4.02% (9) |
0.00% (0) |
7.14% (16) |
8.04% (18) |
80.8% (181) |
9 |
286 |
2.1% (6) |
1.4% (4) |
6.29% (18) |
7.34% (21) |
82.87% (237) |
Total |
1923 |
2.08% (40) |
1.98% (38) |
8.84% (170) |
8.58% (165) |
78.52% (1510) |
从以上数据可以看出:在 1,923 名评价者中,有 1,510 人认为测试准确找出了他们的主类型,约占评价总数的 80%,即每 5 人中有 4 人认可结果。
再细分到各类型的评价,大多数类型都有约 80% 的人认可测试结果。只有 类型 3 略低(约 65%),但依旧是正向的。这种情况可能源于类型 3 被称为"变色龙"/"演员型",即便题目对类型 3 的刻画已相当精准,但理论上来说,九型人格中类型 3 最不容易承认自己追求他人的认可和赞赏(这往往不容易被接受),而且类型 3 通常也比较注重自我形象。
结论
凭借多年来对测试题目和算法的不断完善,以及目前唯一一份较为透明地展示内部工作和调研数据的报告,enneagram-personality.com 或许已成为网络上最可靠的九型人格测试。
在所有给出评分的用户中,约有 80% 的人表示测试确实指出了他们的主类型。理想情况当然是希望逼近 100%,但不可忽视的是,用户自身也会带来一定的主观偏差:
- 用户有时难以接受或认同自己的某些特质。与其他人格测试不同,九型人格不只关注优点(这些优点往往容易让人产生巴纳姆效应),还涉及到深层的强迫性动机以及在"失衡"状态下的表现。有相当比例的人在面对自己的"弱点"时,并不容易承认。
- 用户可能并未客观作答,而是依据自己"期望的形象"而回答问题。
九型人格理论本身也可能存在一定局限,或仍需更多研究发展,使其描述对更多具体情况更具包容性和适配性。别忘了,对现代九型人格理论影响巨大的克劳迪奥·纳兰霍在 1980 年代才开始对它进行重要阐述(与九型人格"千年历史"相比,这算是很晚近的事),例如他提出了整合和退化方向等概念。
最后,九型人格本身并非"测试",而是一门理论。要想更好地发现自己的类型,最好的方式依然是多方面了解和学习。九型人格测试如 enneagram-personality.com 或许可以给新手一个非常有用且行之有效的入门指引——在多数情况下(约 80%)能直接发现自己的主型。不过即便对测试结果感到认可,也依然建议阅读更多不同来源的资料,以便更加确认自己的九型人格类型,并充分利用九型人格理论来进行自我探索和发展。