Data recording, analysis and presentation - Psychology - H567 - Cambridge OCR A Level

歡迎來到數據記錄、分析與呈現！

在這一章，我們將學習心理學家如何將研究中收集到的「混亂」資訊轉化為清晰、科學的結果。試想一下：如果研究員直接塞給你 500 份填好的問卷，你一定會不知所措。我們需要工具來整理、總結這些數據，並判斷它們的實際意義。如果數學看起來有點嚇人，別擔心——我們會一步一步來拆解！

1. 原始數據 (Raw Data)：起點

原始數據是指你在進行任何運算之前，收集到的「未經處理」資訊。為了保持井然有序，心理學家會使用原始數據記錄表 (Raw data recording tables)。這基本上就是一個表格，讓你可以在收集到每個受試者的數據時，隨即記錄下來。

數字與精確度

記錄數據時，必須保持精確。你需要了解以下概念：

標準式 (Standard Form)：一種用 10 的冪次來書寫極大或極小數字的方法。例如，\( 5,000 \) 會變為 \( 5 \times 10^3 \)。
小數形式 (Decimal Form)：使用小數點來表示整體的零碎部分（例如 \( 0.75 \)）。
有效數字 (Significant Figures)：數字中具有意義的位數。如果你被要求以 2 位有效數字作答，\( 12.34 \) 就會變成 \( 12 \)。
估算 (Estimations)：在計算精確答案之前，先做出一個「最佳猜測」，以檢查最終結果是否合理。

快速溫習：一定要在開始研究之前設計好你的表格，這樣才不會漏掉任何數據！

2. 數據的層次與類型

並非所有數據都是一樣的！我們會根據數據的性質及其「詳細程度」進行分類。請記住助記詞 N.O.I.R. 來掌握測量層次。

「NOIR」測量層次

名義數據 (Nominal)：分為獨立類別的數據（名稱）。例子：你是吸煙者還是非吸煙者？
順序數據 (Ordinal)：可以排序或分級，但級別之間的差距不相等的數據。例子：比賽獲得第 1、2、3 名。你知道誰跑得快，但不知道快了幾秒。
等距數據 (Interval)：在具有相等間距的刻度上測量的數據。例子：攝氏溫度或智商測試分數。

數據類型

定量數據 (Quantitative)：涉及數字的數據（例如：「花了多少秒？」）。
定性數據 (Qualitative)：涉及文字與描述的數據（例如：「你在任務期間感覺如何？」）。
初級數據 (Primary)：你自己為研究親自收集的數據。
次級數據 (Secondary)：你所使用的由他人收集的數據（例如：政府統計數據）。

重點總結：等距數據是最「科學」且詳細的，而名義數據則是最簡單的。

3. 描述性統計：總結數據

描述性統計 (Descriptive statistics) 用於描述數據的基本特徵。它們不會告訴我們假設是否「正確」，只會呈現數據看起來的樣子。

集中趨勢測量（平均值）

平均數 (Mean)：將所有分數相加後除以總人數。（最敏感，但會受極端值影響）。
中位數 (Median)：按順序排列後的中間數值。（適合順序數據）。
眾數 (Mode)：出現頻率最高的分數。（唯一適用於名義數據的指標）。

離散程度測量（分散性）

這些數據告訴我們分數是集中在一起，還是分散得很開。

全距 (Range)：最高分與最低分之間的差異（最大值 - 最小值 + 1）。
變異數與標準差 (Variance & Standard Deviation)：這些衡量分數平均偏離平均數的程度。標準差較大意味著數據分佈非常廣泛。

你知道嗎？心理學家也會使用比率 (ratios)、百分比 (percentages) 和分數 (fractions) 來簡化比較（例如：「60% 的受試者表示同意」）。

4. 數據呈現（圖表）

我們會根據數據類型使用不同的圖表。記住：圖表必須永遠擁有清晰的標題和坐標軸標籤！

頻數表 (Frequency Table)：顯示事件發生頻率的統計表。
條形圖 (Bar Chart)：用於名義數據。條形之間不相連，因為類別是獨立的。
直方圖 (Histogram)：用於等距/連續數據。條形會相連，因為數據是在連續刻度上。
折線圖 (Line Graph)：顯示數據隨時間或條件變化的趨勢。
圓餅圖 (Pie Chart)：顯示群體如何被劃分為各個部分。
散點圖 (Scatter Diagram)：用於相關性研究，顯示兩個變量之間的關係。

常見錯誤：不要將相關性數據畫成條形圖！請改用散點圖。

5. 推論統計：進行決策

這一步是為了判斷我們的結果是否真正具有顯著性 (significant)（發生了真實的效應？），還是純粹歸因於運氣/偶然 (luck/chance)。

概率與顯著性

心理學家通常使用 \( p \le 0.05 \) 作為顯著性水平 (significance level)。這意味著我們的結果純屬巧合的可能性只有 5%（或更低）。如果 \( p \le 0.05 \)，我們就稱結果具有統計顯著性。

常態分佈與偏態分佈

常態分佈 (Normal Distribution)：呈「鐘形曲線」，平均數、中位數和眾數都在中間。
偏態分佈 (Skewed Distribution)：當數據向一側偏移時。正偏態在右側有長尾巴；負偏態在左側有長尾巴。

兩類錯誤

第一型錯誤 (Type 1 Error)：「偽陽性」。當結果純屬偶然時，你卻宣稱結果具有顯著性。（你錯誤地拒絕了虛無假設）。
第二型錯誤 (Type 2 Error)：「偽陰性」。當確實存在真實效應時，你卻宣稱結果是偶然造成的。（你錯誤地接受了虛無假設）。

避坑小撇步：為避免第一型錯誤，可以使用更嚴格的顯著性水平（例如 \( p \le 0.01 \)）。

6. 該用哪種統計檢定？

在考試中你不需要親手計算這些複雜的數學，但你必須知道如何選擇！要使用參數檢定 (parametric test)，數據必須是等距層次且符合常態分佈。如果不符合，我們則使用非參數檢定 (non-parametric tests)。

你必須知道的非參數檢定：

曼-惠特尼 U 檢定 (Mann-Whitney U)：測試兩個獨立組別之間的差異（獨立樣本設計）。
威爾科克森符號秩檢定 (Wilcoxon Signed Ranks)：測試同一群人在兩個條件下的差異（重複測量設計）。
卡方檢定 (Chi-square)：測試名義數據之間的差異或關係。
二項符號檢定 (Binomial Sign Test)：用於名義數據和重複測量設計的差異測試。
斯皮爾曼等級相關係數 (Spearman’s Rho)：用於找出兩個變量之間的關係/相關性。

必學符號：
\( = \) (等於)
\( < \) (小於)
\( << \) (遠小於)
\( > \) (大於)
\( \propto \) (正比於)
\( \sim \) (大約)

重點總結：選擇正確的檢定就像為工作選擇正確的工具。如果你有名義數據並正在尋找相關性，你必須使用卡方檢定！

* thinka提供的內容由AI生成，可能並非總是準確或最新。請將其用作輔助資源，並與官方材料進行核實。