導言:解讀數字
歡迎!你已經規劃好研究、招募了參加者並收集了數據。但接下來呢?你手頭上可能有一堆數字或厚厚的訪問逐字稿。本章將介紹心理學家如何整理這些「雜亂」的資訊,透過分析找出其意義,並將其呈現出來以便他人理解。別擔心,如果你不是一個「數學高手」——我們會一步一步為你拆解所有內容!
1. 原始數據:起點
原始數據 (Raw data) 簡單來說,就是你在研究過程中收集到的最初、未經處理的資訊。在進行任何複雜的計算之前,你需要先將它們整理好。
設計數據記錄表
一個好的記錄表應該清晰且具邏輯性。它通常包含代表自變數 (Independent Variable, IV) 條件的欄位,以及代表每位參加者的列。 例子:如果你正在測試咖啡是否有助於記憶,其中一欄應為「咖啡組」,另一欄為「清水組」。
處理數字(數學技巧)
心理學涉及一些基礎算術,你需要熟悉以下概念:
- 標準形式 (Standard Form):一種書寫極大或極小數值的方法。例如,\(1.2 \times 10^3\) 只是 \(1,200\) 的另一種寫法。
- 小數形式 (Decimal Form):確保你能將分數(如 \(1/4\))轉換為小數 (\(0.25\))。
- 有效數字 (Significant Figures):這涉及四捨五入至最關鍵的位數。如果計算機顯示 \(12.34567\),老師可能要求你保留 3 位有效數字,即 \(12.3\)。
- 估算 (Estimations):有時候你需要對結果進行「估算」,以檢查你的最終計算結果看起來是否合理。
快速複習:請務必清楚標註你的表格,這樣即使是陌生人也能看懂這些數字代表什麼!
2. 數據類型
在心理學中,我們主要透過兩種方式將數據分類:按其性質(它看起來像什麼)和來源(它來自哪裡)。
數據性質:定量與定性
定量數據 (Quantitative Data):數字和統計數據。
例子:測驗得分 8/10。
優點:易於比較並製作成圖表。
缺點:缺乏細節;我們無法得知受試者*為什麼*得到那個分數。
定性數據 (Qualitative Data):文字、描述和意義。
例子:參加者描述其在實驗過程中的感受。
優點:細節豐富且具深度。
缺點:難以分析或在不同人之間進行比較。
數據來源:第一手與第二手
第一手數據 (Primary Data):你自己為特定研究收集的數據。
第二手數據 (Secondary Data):由他人收集的數據(例如使用政府統計資料或其他研究人員的結果)。
記憶小撇步:Primary(第一手)就是 Personal(個人的,你自己做的!)。Secondary(第二手)就是 Second-hand(二手轉來的)。
3. 數據層次(測量尺度)
這是一種為數值數據的精確度進行「分級」的方法,這是非常常見的考點!
- 名義尺度 (Nominal Level):數據被分成獨立類別,沒有先後「順序」。
例子:按最喜歡的顏色(紅、藍、綠)將人們分類。 - 次序尺度 (Ordinal Level):數據可以排列順序或等級,但等級之間的差距並不相等。
例子:比賽名次(第一名、第二名、第三名)。我們知道誰跑得更快,但不知道快了多少秒。 - 等距尺度 (Interval Level):在固定的刻度上測量,點與點之間的間距相等。這是最精確的。
例子:攝氏溫度或以秒為單位的時間。
重點總結:從名義尺度進階到等距尺度,就像從模糊的照片升級到高清影片一樣——你能獲得更豐富的細節!
4. 定性數據的分析
我們如何將長篇的訪談內容轉化為可分析的數據?我們使用將定性數據轉化為定量數據的過程。這通常涉及「編碼」——在文字中尋找主題並計算它們出現的次數。
例子:如果有五名參加者提到感到「緊張」,你可以為「焦慮」這個主題記錄數字「5」。
5. 描述統計
這些統計數據用於總結你的資料,以便觀察整體的「趨勢」。
集中趨勢測量(平均值)
1. 平均數 (Mean):將所有分數相加後除以分數總數。
適用情況:當你有等距數據且沒有極端的「離群值」時。
2. 中位數 (Median):當所有數字按順序排列時,位於中間的分數。
適用情況:當數據出現「異常」,有一兩個極高或極低的分數時。
3. 眾數 (Mode):出現次數最多的分數。
適用情況:當你有名義數據(類別)時。
離散程度測量(分佈)
這告訴我們分數是聚集在一起,還是分散得非常廣。
- 全距 (Range):最高分與最低分之間的差值。(最高分 \(-\) 最低分)。它很簡單,但如果有一個異常高的分數,可能會產生誤導!
- 變異數與標準差 (Variance and Standard Deviation):它們告訴我們平均而言,分數偏離平均值的程度。高標準差表示分數分佈極廣;低標準差表示參加者的得分非常相似。
你知道嗎?次數分配表(計數表)是在計算這些測量值之前整理原始數據最快的方法!
6. 數據視覺化:圖表
圖表能幫助我們瞬間觀察到模式。你必須知道哪種圖表適合哪種數據:
- 長條圖 (Bar Charts):用於名義數據(類別)。長條之間沒有相連。
- 直方圖 (Histograms):用於連續數據(如年齡或時間)。長條之間有相連。
- 折線圖 (Line Graphs):顯示某事物如何變化,通常隨時間變化。
- 圓餅圖 (Pie Charts):顯示整體中的比例或百分比。
- 散佈圖 (Scatter Diagrams):用於相關性研究,顯示兩個變數之間的關係。
常見錯誤:忘記標記 X 軸(水平)和 Y 軸(垂直)。請務必為你的圖表加上清晰的標題!
7. 推論統計:關鍵的「決定」
描述統計告訴我們數據「看起來」如何。推論統計則幫助我們判斷結果是「真實的」,還是純粹出於偶然。這是我們檢驗假設的地方。
機率與顯著性
心理學家使用顯著水準 (significance level),通常寫作 \(p < 0.05\)。這意味著結果純屬巧合的可能性小於 5%。如果 \(p < 0.05\),我們就會拒絕虛無假設 (null hypothesis) 並接受替代假設 (alternative hypothesis)。
第一類型錯誤與第二類型錯誤
- 第一類型錯誤 (Type 1 Error):「偽陽性」。你聲稱結果具有顯著性,但實際上它們只是偶然發生。(就像「狼來了」的故事,但其實根本沒有狼)。
- 第二類型錯誤 (Type 2 Error):「偽陰性」。你聲稱結果不具顯著性,但其實確實存在影響。(就像狼真的來了,你卻錯過了)。
選擇統計檢定
你不需要親自計算所有這些檢定,但你必須知道何時使用它們!這些「準則」取決於研究的設計和數據層次。
無母數檢定 (Non-Parametric Tests)(五大檢定):
1. 曼-惠特尼 U 檢定 (Mann-Whitney U):獨立組設計,次序數據。
2. 威爾卡森符號等級檢定 (Wilcoxon Signed Ranks):重複測量設計,次序數據。
3. 卡方檢定 (Chi-Square):獨立組設計,名義數據。(注意:你必須學會如何計算這個!)
4. 二項式符號檢定 (Binomial Sign):重複測量設計,名義數據。
5. 斯皮爾曼等級相關係數 (Spearman’s Rho):用於相關性研究。
母數檢定的準則:
這些是更「強大」的檢定,僅在以下情況使用:
- 數據為等距尺度。
- 數據遵循常態分佈(鐘形曲線)。
- 各組之間的變異數(離散程度)相似。
快速提示:使用助記詞來記住這些檢定,但請務必檢查教科書中的「檢定選擇」流程圖——它絕對能救你一命!
總結:數據之旅
1. 收集原始數據並以表格整理。
2. 識別數據層次(名義、次序或等距)。
3. 計算描述統計(平均數、中位數、眾數、全距、標準差)。
4. 製作圖表以視覺化呈現趨勢。
5. 進行推論統計檢定以查看結果是否顯著 (\(p < 0.05\))。
6. 在得出最終結論前,檢查是否有第一類型或第二類型錯誤。