表1. 二組消費者的產品滿意度評分

前單元提到平均數對極端的值非常敏感,而這種距離主要資料甚遠的分數,我們稱為離位點 ( outlier )。如表1第9及第10的資料。離位點可能的原因為:
1. 資料登錄錯誤
2. 受訪者誤解題目
3. 真正的離位點
前兩種可以在複驗資料及設計題目時改進修正,若為真正的離位點,實務上通常有下面的方式解決:
1. 增加受訪數:當受訪數或樣本夠大時,極端值影響力就會變小。通常超過30組即可,不過當然愈大愈好。
2. 剔除離位點:當受訪數不夠大時,避免極端值影響整體評價,可刪除離位點再行統計。但如果離位點不只1~2個時,研究者可能要深入分析離位點存在的原因,或許這並不是特殊案例。
3. 特別說明:平均數仍然依正常方式算出,但特別說明平均數受離位點影響。
4. 增加其他統計量:平均數仍然依正常方式算出,但補充如中位數、眾數、變異數等的統計量。
以上四種方式可以同時進行,以使整體調查報告更正確、更完整。
(二)中位數
所謂中位數就是資料由小排到大(或由大排到小亦可)最中間那個數。它最大的優點,就是不受極端值的影響;而最大的缺點,就是它只是經過排序,而非經計算求出的統計值,因此它對整體的代表性就略遜於平均數了。不過當計算不易時,只要觀察排序即可得出中位數,中位數也不失為一個好的代表值。而且若分佈狀況為常態分配時,中位數和平均數也會很接近。(未來會說明常態分配的意義及性質)
(三)眾數
眾數就是出現最多次的數值。不過有時同一筆資料會出現兩個以上的眾數。例如資料裡可能有8個82分和8個42分,眾數就有兩個,所以眾數的代表性又遜於中位數。不過觀察眾數出現的位置,可以提供很好的參考資訊,值得深入探討。
尤其若兩個眾數相距甚遠時,如82和42分都是眾數,行銷人員應該研究為什麼兩個眾數會隔這麼遠?是因為行銷區域的關係?還是產品設計出乎意料,造成兩極的觀感?在這裡眾數反而能提供比平均數和中位數更多的資訊。
本單元告訴你三種統計量的特性分別為:
1. 代表性:平均數>中位數>眾數
2. 便利性:中位數>眾數>平均數
3. 提供特別資訊:眾數>平均數=中位數
而在一份行銷企劃的相關報告裡,最好三種統計量都列出,會讓你的報告更專業及詳盡。