Data recording, analysis and presentation - Psychology - H167 - Cambridge OCR AS Level

歡迎來到數據的世界！

你已經設計好實驗、召集了參與者，也完成了研究。現在該怎麼辦？你手上有一堆「線索」（數據），但它們還沒能說出一個完整的故事。在本章中，我們將學習如何整理、分析並呈現這些數據，讓我們能真正理解人類心智運作的奧秘。將自己想像成一名翻譯官，把混亂的數字和文字轉化為清晰、科學的真相。

別擔心如果你自認不是「數學掛」——我們會把所有內容拆解，一步一步帶你搞定！

1. 處理原始數據

原始數據 (Raw data) 就是你在研究過程中收集到、未經任何處理的「原始資訊」。就像做蛋糕的原料一樣——在攪拌混合之前，你是看不見成品長什麼樣的。

原始數據記錄表

在進行實驗或觀察時，你需要一張原始數據記錄表 (raw data recording table)。這是一個簡單的表格，讓你可以在觀察到結果的當下，即時記錄分數或行為。 例子：一個表格，其中一欄是「參與者姓名」，另一欄是「解開謎題所需的時間」。

數據處理的數學技巧

心理學家會用一些數學小撇步來讓數據保持整齊：

標準式 (Standard Form)： 用於處理極大或極小的數字，格式為 \( A \times 10^n \)。例如，500 可以寫成 \( 5 \times 10^2 \)。
有效數字 (Significant Figures)： 指的是將數字四捨五入到有意義的位數。如果計算機算出 12.345678，你可以將其簡化為 12.3（3 位有效數字），讓數據更易讀。
估算 (Estimations)： 有時候，在進行大規模計算前先進行「預估」很有幫助，看看最終答案是否合理。如果你計算 10、12 和 14 的平均值，結果卻算出 50，你就知道自己肯定哪裡算錯了！

快速回顧： 原始數據是你研究結果的「初稿」。從一開始就使用表格來保持整潔吧！

2. 數據的層次與類型

數據並非生而平等！心理學家會對數據進行分類，以便之後判斷該使用哪種統計檢定。

定量數據 vs. 定性數據

定量數據 (Quantitative Data)： 以數字形式呈現的數據（例如：「記憶測驗的分數」）。容易分析，但缺乏細節。
定性數據 (Qualitative Data)： 以文字形式呈現的數據（例如：「參與者對測試感受的描述」）。細節豐富，但較難歸納總結。

初級數據 vs. 次級數據

初級數據 (Primary Data)： 你為了自己的研究親自收集的數據。
次級數據 (Secondary Data)： 已經存在的數據，由他人收集（例如：使用政府的犯罪統計資料）。

數據的三個層次

這是 OCR 課程中非常重要的部分。要記住它們，請記住 NOI 這個詞：

1. 名義層次 (Nominal Level)： 由類別或名稱組成的數據。你只是在「數人頭」。（例子：計算有多少人喜歡貓，多少人喜歡狗）。
2. 次序層次 (Ordinal Level)： 可以排序或「分等級」的數據，但級別之間的差距並不相等。（例子：比賽獲得第 1、2、3 名。你知道誰比較快，但不知道具體快了幾秒）。
3. 等距層次 (Interval Level)： 使用固定且相等間隔的刻度來測量的數據。（例子：攝氏溫度或秒數）。 這是最「科學」的數據層次。

重點總結： 識別你的數據層次（名義、次序或等距）是決定使用哪種統計檢定的第一步。

3. 描述性統計

描述性統計用於總結你的數據，讓你一眼就能看懂重點。

集中趨勢測量（中間值）

平均數 (Mean)： 即平均值。將所有分數相加後除以總數。（非常敏感；一個極端分數就可能毀掉它！）
中位數 (Median)： 當所有分數依序排列時，位於中間的分數。（如果有極端高分或極端低分，用中位數最好）。
眾數 (Mode)： 出現頻率最高的分數。（適用於名義數據）。

離散程度測量（分散度）

這些測量告訴我們分數是聚在一起，還是分散得很開。

全距 (Range)： 最高分與最低分之間的差異。（計算公式：最高分 - 最低分 + 1）。
變異數與標準差 (Variance and Standard Deviation)： 這些較為複雜。它們告訴我們每個分數平均偏離平均數的程度。標準差小代表大家的分數都差不多；標準差大則代表結果非常分散。

數據視覺化（圖表）

長條圖 (Bar Charts)： 用於名義數據（類別）。長條之間不能相連。
直方圖 (Histograms)： 用於等距數據（連續數字）。長條必須相連。
散佈圖 (Scatter Diagrams)： 用於相關性研究，顯示兩個變量之間的關係。
圓餅圖 (Pie Charts)： 用於顯示整體中的比例或百分比。

常見錯誤： 長條圖的長條千萬別連在一起！那只有直方圖才行。把長條圖想成是各類別之間的「社交距離」吧。

4. 推論統計

這聽起來很嚇人，但其實只是在回答一個問題：「我的結果純屬巧合，還是真的發現了什麼？」

機率與顯著性

心理學家使用 \( p < 0.05 \) 作為顯著性水平 (significance level)。這意味著結果純屬偶然發生的機率小於 5%。我們希望至少有 95% 的把握確認我們的發現是真實的！

常態分佈曲線 (Normal Distribution Curve)

如果你測量大群體的身高，大多數人會處於平均值，極高和極矮的只有少數。這會形成一個對稱、鐘形的曲線，稱為常態分佈。
如果曲線偏向一邊，則稱為偏態 (Skewed)。（例子：如果考試太容易，大多數人得分很高，會形成負偏態）。

選擇統計檢定

課程要求你知道何時使用特定的非參數檢定 (non-parametric tests)。不用擔心數學公式，只要知道怎麼選擇就行！

1. 卡方檢定 (Chi-square)： 用於名義數據和獨立測量。
2. 二項式符號檢定 (Binomial Sign Test)： 用於名義數據和重複測量。
3. 曼-惠特尼 U 檢定 (Mann-Whitney U)： 用於次序數據和獨立測量。
4. 威爾科克森符號秩檢定 (Wilcoxon Signed Ranks)： 用於次序數據和重複測量。
5. 斯皮爾曼等級相關係數 (Spearman’s Rho)： 當你想探討兩個變量之間的相關性時使用。

第一型與第二型錯誤

第一型錯誤 (Type 1 Error，即「偽陽性」)： 你宣稱有顯著結果，但其實沒有。你太樂觀了！（通常發生在顯著性水平太寬鬆時，如 10%）。
第二型錯誤 (Type 2 Error，即「偽陰性」)： 你宣稱沒有結果，但事實上有！你太保守了。（通常發生在顯著性水平太嚴格時，如 1%）。

你知道嗎？ 第一型錯誤就像沒火災卻響起火災警報；第二型錯誤則是真有火災，警報卻沒響！

5. 方法論問題

在分析數據時，我們必須檢查研究是否真的是好的「科學」。

信度 (Reliability)： 研究是否具一致性？如果再做一次，會得到同樣的結果嗎？
檢查方式：重測信度 (Test-retest)（再次進行測試）或 評分者信度 (Inter-rater)（兩名觀察者的記錄是否一致？）。

效度 (Validity)： 研究測量的是否真的是它宣稱要測量的東西？
檢查方式：生態效度 (Ecological validity)（是否像現實生活？）或 表面效度 (Face validity)（一眼看上去是否合理？）。

偏差 (Bias)： 小心社會期許偏差 (Social Desirability)（參與者表現得比實際更好）以及研究者偏差 (Researcher Bias)（心理學家只看到他們想看的）。

倫理考量： 請務必記住 BPS 倫理守則。你必須確保尊重 (Respect)（知情同意）、勝任能力 (Competence)、責任 (Responsibility)（事後說明）以及誠信 (Integrity)（除非必要，否則避免欺騙）。

最後小撇步： 當你撰寫關於數據的報告時，一定要誠實說明其局限性。沒有研究是完美的，承認這一點才是一位優秀心理學家的標誌！

* thinka提供的內容由AI生成，可能並非總是準確或最新。請將其用作輔助資源，並與官方材料進行核實。