九型人格測驗的方法論與可靠度（2025）

透過閱讀這份研究，您將能更清楚地了解九型人格測驗普遍面臨的挑戰，以及為了讓 enneagram-personality.com 成為目前線上最具可靠度的九型人格測驗而投入的研究方法與努力。

介紹

九型人格測驗 enneagram-personality.com（原稱 enneagram.bz）自 2018 年上線以來，一直以盡可能提高測驗的可靠度為目標。其創始人注意到網路上大部分常見的九型人格測驗都不夠精準，導致許多人在這些知名且便利的測驗上，得到與自身不符的結果，錯過了九型人格理論能帶來的成長潛能。

一個可靠的九型人格測驗，需要非常精準且針對每種九型人格類型的題目，並且必須搭配複雜的演算法。根據每題的作答，演算法會給予某些類型加分，同時也會扣除其他類型的分數。

演算法的完善與各面向

自測驗上線後，已有超過 1,500,000 人在 enneagram-personality.com 完成了九型人格測驗，這些龐大的數據使得測驗能不斷被打磨，以持續提升其演算法的精準度。

實際上，測驗演算法相當複雜：針對每一題，會使特定類型得到優勢或劣勢。為了達到最理想的優化效果，題目的篩選與調整是根據兩個主要方向進行：一方面是對大量數據進行統計分析，觀察在「結果足夠可靠」的前提下，各類型在每題的平均作答分數；另一方面是堅守九型人格的基礎理論。有時候如果發現某些題目被過多不同類型共同選擇，就會用能更聚焦於單一類型的新題目替換，避免過度重疊。

例如，測驗中有一句 「我本性適應力高、擅於社交，很自然地就能融入我想加入的社交圈」（針對 3 號類型）。從內部快速歸納來看，若以 10,730 份作答為例，各類型對此陳述的平均回答為：

Type 1 : 0/2
Type 2 : 0.3/2
Type 3 : 1.7/2
Type 4 : -0.4/2
Type 5 : -1.1/2
Type 6 : -0.5/2
Type 7 : 0.7/2
Type 8 : 0.3/2
Type 9 : 0.2/2

而測驗對應的作答方式則是：

2/2 = 非常符合
1/2 = 符合
0/2 = 中立
-1/2 = 不符合
-2/2 = 非常不符合

可以看出，3 號類型大多數人對這句話的認同度非常高（1.7/2）。其他類型要嘛趨近中立，要嘛負分較多（例如 5 號類型平均 -1.1/2，因其性格非常內向），只有 7 號類型（0.7/2）比其他類型更偏向正面，但仍較低於 3 號。

那麼該如何區分 3 號與 7 號，畢竟兩者可能看來有時相似？ 這正是九型人格測驗精細優化的關鍵所在。例如測驗中另一句同樣針對 3 號的陳述：

「我常常在他人眼中象徵著成功，這也成為我的動力。」

從這句話來看，絕大多數的類型都維持中立或負分（包括 7 號平均為 0/2），唯有 3 號（1.1/2）與 8 號（0.6/2）較正向。至於 8 號因為較追求權力，會稍微認同。然而我們可以藉由前一個題目來排除 8 號對應到 7 號的可能，因為先前的題目中 8 號平均 0.3/2，而 7 號平均則是 1.7/2！

透過這樣的原則，測驗中每一條陳述都被仔細地分析，能夠有效地對某些類型加分、或否定其他類型，以提升整體的測驗可靠度。

當然，同一類型的人並不一定每一題都能完全認同，但一份好的九型人格測驗會著重於那些最能代表該類型核心特質的陳述。

緊密的結果

即使透過上述各種優化與調整，仍有可能出現較為接近的結果。例如有時分數相差不到 12%（比方說結果顯示 80% 為 8 號、70% 為 7 號、35% 為 3 號等等），測驗就會提示使用者注意該結果的「緊密性」，並建議閱讀兩個高分的 dominant 類型描述，進一步比對哪一個更符合自身特質，避免先入為主。

這點非常重要，因為大多數的九型人格測驗並不會針對「緊密結果」做特別提醒，也沒有告訴使用者若分數相近就必須去閱讀其他可能的類型。這也導致許多人僅看測驗所顯示的「第一名」類型，而與自己真正的核心類型擦身而過，錯失九型人格能帶來的深層幫助。

使用者的評估

當測驗結果顯示時，若系統判斷某一類型的得分比其他類型至少多出 12%，就會直接認定該類型最有可能是使用者的核心類型；否則，系統會清楚顯示幾種可能性，並標示哪一種最為可行。

為了持續優化演算法與評估其成效，測驗會邀請使用者在看完結果與類型描述後，為準確度打 1 到 5 分，評分標準如下：

5/5 - 感覺與我的主要九型人格類型非常吻合
4/5 - 有些地方很像，但我覺得未必是我的類型
3/5 - 部分相似
2/5 - 與我不太符合
1/5 - 完全不像我

測驗的演算法與題庫在 2023 年 2 月進行了最近一次重大改版。自 2023/03/01 起，直到本研究撰寫之日（2025/12/15），共有 1,923 位使用者針對自己的測驗結果做了評分（所有評分皆可於此連結查閱，並可依語言篩選）。由於大部分使用者未留下任何評分，因此評分人數較少於測驗總人數。

以下是統計至今的整體評分概況：

類型	評分人數	1/5	2/5	3/5	4/5	5/5
1	136	0.74% (1)	0.74% (1)	9.56% (13)	5.88% (8)	83.09% (113)
2	243	2.88% (7)	2.47% (6)	9.88% (24)	7.00% (17)	77.78% (189)
3	245	3.67% (9)	6.12% (15)	14.29% (35)	11.02% (27)	64.90% (159)
4	272	0.74% (2)	0.74% (2)	10.66% (29)	7.35% (20)	80.51% (219)
5	216	0.46% (1)	0.93% (2)	4.63% (10)	10.19% (22)	83.8% (181)
6	111	1.8% (2)	0.9% (1)	9.01% (10)	12.61% (14)	75.68% (84)
7	190	1.58% (3)	3.68% (7)	7.89% (15)	9.47% (18)	77.37% (147)
8	224	4.02% (9)	0.00% (0)	7.14% (16)	8.04% (18)	80.8% (181)
9	286	2.1% (6)	1.4% (4)	6.29% (18)	7.34% (21)	82.87% (237)
Total	1923	2.08% (40)	1.98% (38)	8.84% (170)	8.58% (165)	78.52% (1510)

如表所示：1,923 位評分者當中，1,510 人認為測驗準確指出了自己的主要九型人格類型，約佔 80%（也就是五分之四）的比例。

就各個類型來看，絕大部分都維持在約 80% 的準確度。然而針對 3 號類型，雖然仍是正向，但其評分大約為 65%，稍微偏低一點。這可能是因為 3 號類型特質包含「變色龍」與「演員」的成分，即使測驗已經在題目上做了相當精準的設計，在理論上，3 號類型或許較不容易接受自己「渴望被認可」的部分（特別是對「追求讚賞」的需求），而且 3 號通常更在意自身形象，容易因這點產生不易認同的心態。

總結

經過多年的題庫優化與演算法調整，以及作為目前唯一公開展示過程與方法的測驗，enneagram-personality.com 有極高的可能性是網路上最可靠的九型人格測驗之一。

大約 80% 的評分者（五分之四）認為測驗成功找出他們的核心類型。雖然理想情況下能更接近 100%，但使用者本身也難以避免地帶有各種偏誤，使得測驗難以達到真正的「完美分數」：

部分使用者可能不願或不易接受、認同自己的特質。因為九型人格理論與許多一般人格測驗不同，它不只強調優點，也會探討「失衡」時的狀態。有些人可能不願意承認自己的缺點，或者不太理解「失衡」意味著並非時時處於負面狀態，而是在無法適當調節時才會出現。
也有人在作答時無法客觀回應，往往回答自己「理想中的樣子」，而非「實際狀態」。

再者，九型人格理論本身也可能存在其理論極限，需要更多人共同投入、拓展與修正，使不同類型的描述能更具包容性。要知道直到 1980 年代，像是精神科醫師 Claudio Naranjo 才對現代九型人格理論產生深遠影響（與其數千年來可能的起源相比算是相對近期），例如引入了整合與退化的類型等重要概念。

最後，九型人格理論本身並非從「測驗」出發，而更像是一門關於人性與性格的理論。建議想深入了解自己類型者，務必自行閱讀並研究各類型的特點。九型人格測驗（如 enneagram-personality.com）固然能作為入門參考，而且在約 80% 的情況下，能幫助使用者直接找到自己的主型。然而，就算已認為結果非常準確，仍值得進一步多方閱讀其他相關資料，以確定自身的九型人格定位，並最大化地運用九型人格理論於個人成長之中。

進行九型人格測驗 ➜

九型人格測驗的方法論與可靠度（2025）

目錄

介紹

演算法的完善與各面向

緊密的結果

使用者的評估

總結