歡迎來到數據記錄、分析與呈現!
在這一章,我們將學習心理學家如何將研究中收集到的「混亂」資訊轉化為清晰、科學的結果。試想一下:如果研究員直接塞給你 500 份填好的問卷,你一定會不知所措。我們需要工具來整理、總結這些數據,並判斷它們的實際意義。如果數學看起來有點嚇人,別擔心——我們會一步一步來拆解!
1. 原始數據 (Raw Data):起點
原始數據是指你在進行任何運算之前,收集到的「未經處理」資訊。為了保持井然有序,心理學家會使用原始數據記錄表 (Raw data recording tables)。這基本上就是一個表格,讓你可以在收集到每個受試者的數據時,隨即記錄下來。
數字與精確度
記錄數據時,必須保持精確。你需要了解以下概念:
- 標準式 (Standard Form):一種用 10 的冪次來書寫極大或極小數字的方法。例如,\( 5,000 \) 會變為 \( 5 \times 10^3 \)。
- 小數形式 (Decimal Form):使用小數點來表示整體的零碎部分(例如 \( 0.75 \))。
- 有效數字 (Significant Figures):數字中具有意義的位數。如果你被要求以 2 位有效數字作答,\( 12.34 \) 就會變成 \( 12 \)。
- 估算 (Estimations):在計算精確答案之前,先做出一個「最佳猜測」,以檢查最終結果是否合理。
快速溫習:一定要在開始研究之前設計好你的表格,這樣才不會漏掉任何數據!
2. 數據的層次與類型
並非所有數據都是一樣的!我們會根據數據的性質及其「詳細程度」進行分類。請記住助記詞 N.O.I.R. 來掌握測量層次。
「NOIR」測量層次
- 名義數據 (Nominal):分為獨立類別的數據(名稱)。例子:你是吸煙者還是非吸煙者?
- 順序數據 (Ordinal):可以排序或分級,但級別之間的差距不相等的數據。例子:比賽獲得第 1、2、3 名。你知道誰跑得快,但不知道快了幾秒。
- 等距數據 (Interval):在具有相等間距的刻度上測量的數據。例子:攝氏溫度或智商測試分數。
數據類型
- 定量數據 (Quantitative):涉及數字的數據(例如:「花了多少秒?」)。
- 定性數據 (Qualitative):涉及文字與描述的數據(例如:「你在任務期間感覺如何?」)。
- 初級數據 (Primary):你自己為研究親自收集的數據。
- 次級數據 (Secondary):你所使用的由他人收集的數據(例如:政府統計數據)。
重點總結:等距數據是最「科學」且詳細的,而名義數據則是最簡單的。
3. 描述性統計:總結數據
描述性統計 (Descriptive statistics) 用於描述數據的基本特徵。它們不會告訴我們假設是否「正確」,只會呈現數據看起來的樣子。
集中趨勢測量(平均值)
- 平均數 (Mean):將所有分數相加後除以總人數。(最敏感,但會受極端值影響)。
- 中位數 (Median):按順序排列後的中間數值。(適合順序數據)。
- 眾數 (Mode):出現頻率最高的分數。(唯一適用於名義數據的指標)。
離散程度測量(分散性)
這些數據告訴我們分數是集中在一起,還是分散得很開。
- 全距 (Range):最高分與最低分之間的差異(最大值 - 最小值 + 1)。
- 變異數與標準差 (Variance & Standard Deviation):這些衡量分數平均偏離平均數的程度。標準差較大意味著數據分佈非常廣泛。
你知道嗎?心理學家也會使用比率 (ratios)、百分比 (percentages) 和分數 (fractions) 來簡化比較(例如:「60% 的受試者表示同意」)。
4. 數據呈現(圖表)
我們會根據數據類型使用不同的圖表。記住:圖表必須永遠擁有清晰的標題和坐標軸標籤!
- 頻數表 (Frequency Table):顯示事件發生頻率的統計表。
- 條形圖 (Bar Chart):用於名義數據。條形之間不相連,因為類別是獨立的。
- 直方圖 (Histogram):用於等距/連續數據。條形會相連,因為數據是在連續刻度上。
- 折線圖 (Line Graph):顯示數據隨時間或條件變化的趨勢。
- 圓餅圖 (Pie Chart):顯示群體如何被劃分為各個部分。
- 散點圖 (Scatter Diagram):用於相關性研究,顯示兩個變量之間的關係。
常見錯誤:不要將相關性數據畫成條形圖!請改用散點圖。
5. 推論統計:進行決策
這一步是為了判斷我們的結果是否真正具有顯著性 (significant)(發生了真實的效應?),還是純粹歸因於運氣/偶然 (luck/chance)。
概率與顯著性
心理學家通常使用 \( p \le 0.05 \) 作為顯著性水平 (significance level)。這意味著我們的結果純屬巧合的可能性只有 5%(或更低)。如果 \( p \le 0.05 \),我們就稱結果具有統計顯著性。
常態分佈與偏態分佈
- 常態分佈 (Normal Distribution):呈「鐘形曲線」,平均數、中位數和眾數都在中間。
- 偏態分佈 (Skewed Distribution):當數據向一側偏移時。正偏態在右側有長尾巴;負偏態在左側有長尾巴。
兩類錯誤
- 第一型錯誤 (Type 1 Error):「偽陽性」。當結果純屬偶然時,你卻宣稱結果具有顯著性。(你錯誤地拒絕了虛無假設)。
- 第二型錯誤 (Type 2 Error):「偽陰性」。當確實存在真實效應時,你卻宣稱結果是偶然造成的。(你錯誤地接受了虛無假設)。
避坑小撇步:為避免第一型錯誤,可以使用更嚴格的顯著性水平(例如 \( p \le 0.01 \))。
6. 該用哪種統計檢定?
在考試中你不需要親手計算這些複雜的數學,但你必須知道如何選擇!要使用參數檢定 (parametric test),數據必須是等距層次且符合常態分佈。如果不符合,我們則使用非參數檢定 (non-parametric tests)。
你必須知道的非參數檢定:
- 曼-惠特尼 U 檢定 (Mann-Whitney U):測試兩個獨立組別之間的差異(獨立樣本設計)。
- 威爾科克森符號秩檢定 (Wilcoxon Signed Ranks):測試同一群人在兩個條件下的差異(重複測量設計)。
- 卡方檢定 (Chi-square):測試名義數據之間的差異或關係。
- 二項符號檢定 (Binomial Sign Test):用於名義數據和重複測量設計的差異測試。
- 斯皮爾曼等級相關係數 (Spearman’s Rho):用於找出兩個變量之間的關係/相關性。
必學符號:
\( = \) (等於)
\( < \) (小於)
\( << \) (遠小於)
\( > \) (大於)
\( \propto \) (正比於)
\( \sim \) (大約)
重點總結:選擇正確的檢定就像為工作選擇正確的工具。如果你有名義數據並正在尋找相關性,你必須使用卡方檢定!