Data recording, analysis and presentation - Psychology - H169 - Cambridge OCR AS Level

導言：解讀數字

歡迎！你已經規劃好研究、招募了參加者並收集了數據。但接下來呢？你手頭上可能有一堆數字或厚厚的訪問逐字稿。本章將介紹心理學家如何整理這些「雜亂」的資訊，透過分析找出其意義，並將其呈現出來以便他人理解。別擔心，如果你不是一個「數學高手」——我們會一步一步為你拆解所有內容！

1. 原始數據：起點

原始數據 (Raw data) 簡單來說，就是你在研究過程中收集到的最初、未經處理的資訊。在進行任何複雜的計算之前，你需要先將它們整理好。

設計數據記錄表

一個好的記錄表應該清晰且具邏輯性。它通常包含代表自變數 (Independent Variable, IV) 條件的欄位，以及代表每位參加者的列。 例子：如果你正在測試咖啡是否有助於記憶，其中一欄應為「咖啡組」，另一欄為「清水組」。

處理數字（數學技巧）

心理學涉及一些基礎算術，你需要熟悉以下概念：

標準形式 (Standard Form)：一種書寫極大或極小數值的方法。例如，\(1.2 \times 10^3\) 只是 \(1,200\) 的另一種寫法。
小數形式 (Decimal Form)：確保你能將分數（如 \(1/4\)）轉換為小數 (\(0.25\))。
有效數字 (Significant Figures)：這涉及四捨五入至最關鍵的位數。如果計算機顯示 \(12.34567\)，老師可能要求你保留 3 位有效數字，即 \(12.3\)。
估算 (Estimations)：有時候你需要對結果進行「估算」，以檢查你的最終計算結果看起來是否合理。

快速複習：請務必清楚標註你的表格，這樣即使是陌生人也能看懂這些數字代表什麼！

2. 數據類型

在心理學中，我們主要透過兩種方式將數據分類：按其性質（它看起來像什麼）和來源（它來自哪裡）。

數據性質：定量與定性

定量數據 (Quantitative Data)：數字和統計數據。 例子：測驗得分 8/10。
優點：易於比較並製作成圖表。
缺點：缺乏細節；我們無法得知受試者*為什麼*得到那個分數。

定性數據 (Qualitative Data)：文字、描述和意義。 例子：參加者描述其在實驗過程中的感受。
優點：細節豐富且具深度。
缺點：難以分析或在不同人之間進行比較。

數據來源：第一手與第二手

第一手數據 (Primary Data)：你自己為特定研究收集的數據。
第二手數據 (Secondary Data)：由他人收集的數據（例如使用政府統計資料或其他研究人員的結果）。

記憶小撇步：Primary（第一手）就是 Personal（個人的，你自己做的！）。Secondary（第二手）就是 Second-hand（二手轉來的）。

3. 數據層次（測量尺度）

這是一種為數值數據的精確度進行「分級」的方法，這是非常常見的考點！

名義尺度 (Nominal Level)：數據被分成獨立類別，沒有先後「順序」。
例子：按最喜歡的顏色（紅、藍、綠）將人們分類。
次序尺度 (Ordinal Level)：數據可以排列順序或等級，但等級之間的差距並不相等。
例子：比賽名次（第一名、第二名、第三名）。我們知道誰跑得更快，但不知道快了多少秒。
等距尺度 (Interval Level)：在固定的刻度上測量，點與點之間的間距相等。這是最精確的。
例子：攝氏溫度或以秒為單位的時間。

重點總結：從名義尺度進階到等距尺度，就像從模糊的照片升級到高清影片一樣——你能獲得更豐富的細節！

4. 定性數據的分析

我們如何將長篇的訪談內容轉化為可分析的數據？我們使用將定性數據轉化為定量數據的過程。這通常涉及「編碼」——在文字中尋找主題並計算它們出現的次數。
例子：如果有五名參加者提到感到「緊張」，你可以為「焦慮」這個主題記錄數字「5」。

5. 描述統計

這些統計數據用於總結你的資料，以便觀察整體的「趨勢」。

集中趨勢測量（平均值）

1. 平均數 (Mean)：將所有分數相加後除以分數總數。
適用情況：當你有等距數據且沒有極端的「離群值」時。
2. 中位數 (Median)：當所有數字按順序排列時，位於中間的分數。
適用情況：當數據出現「異常」，有一兩個極高或極低的分數時。
3. 眾數 (Mode)：出現次數最多的分數。
適用情況：當你有名義數據（類別）時。

離散程度測量（分佈）

這告訴我們分數是聚集在一起，還是分散得非常廣。

全距 (Range)：最高分與最低分之間的差值。（最高分 \(-\) 最低分）。它很簡單，但如果有一個異常高的分數，可能會產生誤導！
變異數與標準差 (Variance and Standard Deviation)：它們告訴我們平均而言，分數偏離平均值的程度。高標準差表示分數分佈極廣；低標準差表示參加者的得分非常相似。

你知道嗎？次數分配表（計數表）是在計算這些測量值之前整理原始數據最快的方法！

6. 數據視覺化：圖表

圖表能幫助我們瞬間觀察到模式。你必須知道哪種圖表適合哪種數據：

長條圖 (Bar Charts)：用於名義數據（類別）。長條之間沒有相連。
直方圖 (Histograms)：用於連續數據（如年齡或時間）。長條之間有相連。
折線圖 (Line Graphs)：顯示某事物如何變化，通常隨時間變化。
圓餅圖 (Pie Charts)：顯示整體中的比例或百分比。
散佈圖 (Scatter Diagrams)：用於相關性研究，顯示兩個變數之間的關係。

常見錯誤：忘記標記 X 軸（水平）和 Y 軸（垂直）。請務必為你的圖表加上清晰的標題！

7. 推論統計：關鍵的「決定」

描述統計告訴我們數據「看起來」如何。推論統計則幫助我們判斷結果是「真實的」，還是純粹出於偶然。這是我們檢驗假設的地方。

機率與顯著性

心理學家使用顯著水準 (significance level)，通常寫作 \(p < 0.05\)。這意味著結果純屬巧合的可能性小於 5%。如果 \(p < 0.05\)，我們就會拒絕虛無假設 (null hypothesis) 並接受替代假設 (alternative hypothesis)。

第一類型錯誤與第二類型錯誤

第一類型錯誤 (Type 1 Error)：「偽陽性」。你聲稱結果具有顯著性，但實際上它們只是偶然發生。（就像「狼來了」的故事，但其實根本沒有狼）。
第二類型錯誤 (Type 2 Error)：「偽陰性」。你聲稱結果不具顯著性，但其實確實存在影響。（就像狼真的來了，你卻錯過了）。

選擇統計檢定

你不需要親自計算所有這些檢定，但你必須知道何時使用它們！這些「準則」取決於研究的設計和數據層次。

無母數檢定 (Non-Parametric Tests)（五大檢定）：

1. 曼-惠特尼 U 檢定 (Mann-Whitney U)：獨立組設計，次序數據。
2. 威爾卡森符號等級檢定 (Wilcoxon Signed Ranks)：重複測量設計，次序數據。
3. 卡方檢定 (Chi-Square)：獨立組設計，名義數據。（注意：你必須學會如何計算這個！）
4. 二項式符號檢定 (Binomial Sign)：重複測量設計，名義數據。
5. 斯皮爾曼等級相關係數 (Spearman’s Rho)：用於相關性研究。

母數檢定的準則：

這些是更「強大」的檢定，僅在以下情況使用：

數據為等距尺度。
數據遵循常態分佈（鐘形曲線）。
各組之間的變異數（離散程度）相似。

快速提示：使用助記詞來記住這些檢定，但請務必檢查教科書中的「檢定選擇」流程圖——它絕對能救你一命！

總結：數據之旅

1. 收集原始數據並以表格整理。
2. 識別數據層次（名義、次序或等距）。
3. 計算描述統計（平均數、中位數、眾數、全距、標準差）。
4. 製作圖表以視覺化呈現趨勢。
5. 進行推論統計檢定以查看結果是否顯著 (\(p < 0.05\))。
6. 在得出最終結論前，檢查是否有第一類型或第二類型錯誤。

* thinka提供的內容由AI生成，可能並非總是準確或最新。請將其用作輔助資源，並與官方材料進行核實。