Data recording, analysis and presentation - Psychology - H569 - Cambridge OCR A Level

歡迎來到數據記錄、分析與呈現！

哈囉！別被這一章的標題嚇到了。雖然它聽起來很「數學」，但事實上，這是在講述心理學家如何將複雜混亂的人類行為，轉化為清晰易懂的資訊。你可以把它看作是研究中的「說故事」環節——你已經收集了數據，現在要學習如何向大家解釋這些數據背後的意義。

無論你熱愛數字還是覺得它們有點棘手，這些筆記都旨在引導你一步步掌握這些流程。我們將涵蓋如何記錄數據、你會遇到的數據類型，以及用來找出規律的「神奇」公式。

1. 原始數據：起點

原始數據 (Raw data) 就是你在實驗或觀察期間收集到的「未經處理」資訊，在對其進行任何加工之前的狀態。

記錄表的设计與使用： 在開始之前，你需要一個清晰的地方來放置結果。一個好的記錄表應該有明確的標題，讓任何查看它的人都能清楚知道測量的是什麼。

標準形式與小數形式： 有時候數字會非常大或非常小。 標準形式 (Standard form) 是一種使用 10 的冪次來書寫這些數字的方法。例如，5,000 會變成 \( 5 \times 10^3 \)。 小數形式 (Decimal form) 是我們書寫數字的標準方式，例如 0.05。

有效數字 (Significant figures)： 這是關於將數字四捨五入到最重要的位數。 例子： 如果計算結果是 12.34567，將其取至 3 位有效數字，結果就是 12.3。

估算 (Estimations)： 有時候，心理學家會根據數據做出「最佳猜測」，看看最終結果是否合理。

快速回顧：
• 原始數據 = 「混亂」的初步結果。
• 記錄表 = 我們用來存放數據的「桶子」。
• 有效數字 = 只保留最重要的位數。

2. 數據類型

並非所有數據都是一樣的！心理學家使用四大類別：

量化數據 (Quantitative Data)： 這是以數字形式呈現的數據。 例子： 記憶測驗中 8/10 的分數。 + 優點： 容易比較並轉換成圖表。 - 缺點： 缺乏細節；它無法告訴我們某人為何得到那個分數。

質性數據 (Qualitative Data)： 這是以文字、描述或意義形式呈現的數據。 例子： 某人描述其感受的訪談逐字稿。 + 優點： 非常豐富且詳盡。 - 缺點： 很難針對不同的人進行總結或比較。

主要數據 (Primary Data)： 你為了特定研究而親自收集的數據。 例子： 你對同學進行的問卷調查。

次要數據 (Secondary Data)： 你正在使用的、由其他人收集的數據。 例子： 使用政府的犯罪率統計資料。

重點總結： 量化關於數量（有多少），而質性關於品質（它是什麼樣的）。

3. 測量層次（數據層次）

這是一種對數據精確度進行「排名」的方式。你可以用助記詞 NOI 來記住它。

1. 名目層次數據 (Nominal Level Data)： 最基本的層次。數據被放入類別或命名的群組中。 例子： 計算有多少人是「左撇子」與「右撇子」。

2. 次序層次數據 (Ordinal Level Data)： 可以進行排序或排名的數據，但排名之間的差距並不相等。 例子： 比賽中的第 1、2、3 名。你知道誰跑得比較快，但第 1 名可能領先第 2 名 10 秒，而第 2 名只領先第 3 名 1 秒。

3. 等距層次數據 (Interval Level Data)： 最精確的層次。數據是在具有固定、相等間隔的量表上測量的。 例子： 攝氏溫度。10°C 到 11°C 之間的差距與 20°C 到 21°C 之間的差距完全相同。

4. 描述性統計：總結數據

一旦有了數字，就需要總結它們。我們使用集中趨勢量數 (Measures of Central Tendency)（中間值）和離散程度量數 (Measures of Dispersion)（數據的分散程度）。

集中趨勢量數

• 平均數 (Mean)： 數學上的平均值。將所有分數相加並除以分數的總個數。 公式： \( \bar{x} = \frac{\sum x}{n} \)。
• 中位數 (Median)： 將所有分數排序後位於中間的數值。
• 眾數 (Mode)： 出現次數最多的分數。

離散程度量數

• 全距 (Range)： 最高分與最低分之間的差值（通常會再加 1）。
• 變異數 (Variance)： 顯示分數偏離平均值程度的計算。
• 標準差 (Standard Deviation)： 最受歡迎的量數。它顯示每個分數與平均值的平均距離。 類比： 如果班級的平均身高是 160 公分，小標準差意味著每個人都差不多是 160 公分。大標準差則意味著有些人非常矮，而有些人非常高。

其他數學知識

• 比率 (Ratio)： 比較兩個數量（例如 2:1）。
• 百分比 (Percentage)： 以 100 為基數的分數。
• 分數 (Fractions)： 整體的一部分（例如 1/4）。
• 次數分配表 (Frequency Tables)： 通常稱為「計數表」，用於計算事物發生的頻率。

5. 數據呈現：圖表

如果你不是藝術家也不要擔心！只要記住哪種圖表對應哪種數據即可：

長條圖 (Bar Charts)： 用於名目（類別）數據。長條之間不應該相連。
直方圖 (Histograms)： 用於等距數據。長條必須相連，因為數據是連續的。
散佈圖 (Scatter Diagrams)： 用於相關性 (Correlations)。你繪製點來查看兩個變數之間是否存在關係。
折線圖 (Line Graphs)： 用於顯示事物的變化，通常是隨時間的變化。
圓餅圖 (Pie Charts)： 用於顯示整體的比例（百分比）。

常見錯誤： 學生常會為連續數據繪製長條圖。記住：如果是分開的類別（如「貓與狗」），一定要留空隙！

6. 質性數據的分析

我們該拿那些文字怎麼辦呢？我們可以將質性數據轉換為量化數據。

這通常是透過內容分析法 (Content Analysis) 來完成的。你檢視文字（如訪談逐字稿）並計算某些主題或「編碼」出現了多少次。 例子： 如果你訪問人們關於學校的感受，你可以計算他們說出「壓力」這個詞的次數。瞬間，你的文字就變成了數字！

7. 推論統計：結果是否「真實」？

這部分能幫助心理學家判斷結果是因為自變數 (IV，即他們改變的東西) 造成的，還是僅僅出於「運氣」（隨機誤差）。

機率與顯著性

心理學家通常使用 \( p \le 0.05 \) 的顯著水準 (Significance level)。這意味著結果由偶然產生的機率為 5%（或更低）。如果 \( p \le 0.05 \)，我們就會拒絕虛無假設 (null hypothesis) 並接受對立假設 (alternative hypothesis)。

分配

常態分配 (Normal Distribution)： 一種對稱的「鐘形」曲線，平均數、中位數和眾數都在中間。
偏態分配 (Skewed Distributions)： 當結果集中在一端時。 正偏態 (Positive Skew)： 大多數分數較低（「尾巴」指向右側）。 負偏態 (Negative Skew)： 大多數分數較高（「尾巴」指向左側）。

選擇統計檢定

你需要知道選擇這五種無母數檢定 (non-parametric tests) 的標準：

1. 曼-惠特尼 U 檢定 (Mann-Whitney U)： 用於獨立樣本設計 (Independent Measures) 和次序數據。
2. 威爾卡森符號等級檢定 (Wilcoxon Signed Ranks)： 用於重複量測設計 (Repeated Measures) 和次序數據。
3. 卡方檢定 (Chi-Square)： 用於獨立組別和名目數據。
4. 二項式符號檢定 (Binomial Sign)： 用於重複量測和名目數據。
5. 斯皮爾曼等級相關係數 (Spearman’s Rho)： 用於尋找相關性時。

研究中的誤差

第一型誤差 (Type 1 Error，型一錯誤/偽陽性)： 你聲稱結果具有顯著性，但實際上它們只是隨機發生的。（你太寬鬆了）。
第二型誤差 (Type 2 Error，型二錯誤/偽陰性)： 你聲稱結果不具顯著性，但實際上存在效應。（你太嚴格了）。

本節重點：
• 推論統計檢定告訴我們是否能信任我們的結果。
• p ≤ 0.05 是魔法數字。
• 第一型誤差 = 看見了不存在的鬼魂。
• 第二型誤差 = 錯過了站在你身後那個真實的鬼魂！

必知符號

你必須能夠在考試中識別並使用這些符號：
= 等於
< 小於
<< 遠小於
>> 遠大於
> 大於
∝ 成正比
~ 大約
≥ 大於或等於
≤ 小於或等於

* thinka提供的內容由AI生成，可能並非總是準確或最新。請將其用作輔助資源，並與官方材料進行核實。