歡迎來到數據記錄、分析與呈現!
哈囉!別被這一章的標題嚇到了。雖然它聽起來很「數學」,但事實上,這是在講述心理學家如何將複雜混亂的人類行為,轉化為清晰易懂的資訊。你可以把它看作是研究中的「說故事」環節——你已經收集了數據,現在要學習如何向大家解釋這些數據背後的意義。
無論你熱愛數字還是覺得它們有點棘手,這些筆記都旨在引導你一步步掌握這些流程。我們將涵蓋如何記錄數據、你會遇到的數據類型,以及用來找出規律的「神奇」公式。
1. 原始數據:起點
原始數據 (Raw data) 就是你在實驗或觀察期間收集到的「未經處理」資訊,在對其進行任何加工之前的狀態。
記錄表的设计與使用: 在開始之前,你需要一個清晰的地方來放置結果。一個好的記錄表應該有明確的標題,讓任何查看它的人都能清楚知道測量的是什麼。
標準形式與小數形式: 有時候數字會非常大或非常小。
標準形式 (Standard form) 是一種使用 10 的冪次來書寫這些數字的方法。例如,5,000 會變成 \( 5 \times 10^3 \)。
小數形式 (Decimal form) 是我們書寫數字的標準方式,例如 0.05。
有效數字 (Significant figures): 這是關於將數字四捨五入到最重要的位數。
例子: 如果計算結果是 12.34567,將其取至 3 位有效數字,結果就是 12.3。
估算 (Estimations): 有時候,心理學家會根據數據做出「最佳猜測」,看看最終結果是否合理。
快速回顧:
• 原始數據 = 「混亂」的初步結果。
• 記錄表 = 我們用來存放數據的「桶子」。
• 有效數字 = 只保留最重要的位數。
2. 數據類型
並非所有數據都是一樣的!心理學家使用四大類別:
量化數據 (Quantitative Data): 這是以數字形式呈現的數據。
例子: 記憶測驗中 8/10 的分數。
+ 優點: 容易比較並轉換成圖表。
- 缺點: 缺乏細節;它無法告訴我們某人為何得到那個分數。
質性數據 (Qualitative Data): 這是以文字、描述或意義形式呈現的數據。
例子: 某人描述其感受的訪談逐字稿。
+ 優點: 非常豐富且詳盡。
- 缺點: 很難針對不同的人進行總結或比較。
主要數據 (Primary Data): 你為了特定研究而親自收集的數據。
例子: 你對同學進行的問卷調查。
次要數據 (Secondary Data): 你正在使用的、由其他人收集的數據。
例子: 使用政府的犯罪率統計資料。
重點總結: 量化關於數量(有多少),而質性關於品質(它是什麼樣的)。
3. 測量層次(數據層次)
這是一種對數據精確度進行「排名」的方式。你可以用助記詞 NOI 來記住它。
1. 名目層次數據 (Nominal Level Data): 最基本的層次。數據被放入類別或命名的群組中。
例子: 計算有多少人是「左撇子」與「右撇子」。
2. 次序層次數據 (Ordinal Level Data): 可以進行排序或排名的數據,但排名之間的差距並不相等。
例子: 比賽中的第 1、2、3 名。你知道誰跑得比較快,但第 1 名可能領先第 2 名 10 秒,而第 2 名只領先第 3 名 1 秒。
3. 等距層次數據 (Interval Level Data): 最精確的層次。數據是在具有固定、相等間隔的量表上測量的。
例子: 攝氏溫度。10°C 到 11°C 之間的差距與 20°C 到 21°C 之間的差距完全相同。
4. 描述性統計:總結數據
一旦有了數字,就需要總結它們。我們使用集中趨勢量數 (Measures of Central Tendency)(中間值)和離散程度量數 (Measures of Dispersion)(數據的分散程度)。
集中趨勢量數
• 平均數 (Mean): 數學上的平均值。將所有分數相加並除以分數的總個數。
公式: \( \bar{x} = \frac{\sum x}{n} \)。
• 中位數 (Median): 將所有分數排序後位於中間的數值。
• 眾數 (Mode): 出現次數最多的分數。
離散程度量數
• 全距 (Range): 最高分與最低分之間的差值(通常會再加 1)。
• 變異數 (Variance): 顯示分數偏離平均值程度的計算。
• 標準差 (Standard Deviation): 最受歡迎的量數。它顯示每個分數與平均值的平均距離。
類比: 如果班級的平均身高是 160 公分,小標準差意味著每個人都差不多是 160 公分。大標準差則意味著有些人非常矮,而有些人非常高。
其他數學知識
• 比率 (Ratio): 比較兩個數量(例如 2:1)。
• 百分比 (Percentage): 以 100 為基數的分數。
• 分數 (Fractions): 整體的一部分(例如 1/4)。
• 次數分配表 (Frequency Tables): 通常稱為「計數表」,用於計算事物發生的頻率。
5. 數據呈現:圖表
如果你不是藝術家也不要擔心!只要記住哪種圖表對應哪種數據即可:
長條圖 (Bar Charts): 用於名目(類別)數據。長條之間不應該相連。
直方圖 (Histograms): 用於等距數據。長條必須相連,因為數據是連續的。
散佈圖 (Scatter Diagrams): 用於相關性 (Correlations)。你繪製點來查看兩個變數之間是否存在關係。
折線圖 (Line Graphs): 用於顯示事物的變化,通常是隨時間的變化。
圓餅圖 (Pie Charts): 用於顯示整體的比例(百分比)。
常見錯誤: 學生常會為連續數據繪製長條圖。記住:如果是分開的類別(如「貓與狗」),一定要留空隙!
6. 質性數據的分析
我們該拿那些文字怎麼辦呢?我們可以將質性數據轉換為量化數據。
這通常是透過內容分析法 (Content Analysis) 來完成的。你檢視文字(如訪談逐字稿)並計算某些主題或「編碼」出現了多少次。
例子: 如果你訪問人們關於學校的感受,你可以計算他們說出「壓力」這個詞的次數。瞬間,你的文字就變成了數字!
7. 推論統計:結果是否「真實」?
這部分能幫助心理學家判斷結果是因為自變數 (IV,即他們改變的東西) 造成的,還是僅僅出於「運氣」(隨機誤差)。
機率與顯著性
心理學家通常使用 \( p \le 0.05 \) 的顯著水準 (Significance level)。這意味著結果由偶然產生的機率為 5%(或更低)。如果 \( p \le 0.05 \),我們就會拒絕虛無假設 (null hypothesis) 並接受對立假設 (alternative hypothesis)。
分配
常態分配 (Normal Distribution): 一種對稱的「鐘形」曲線,平均數、中位數和眾數都在中間。
偏態分配 (Skewed Distributions): 當結果集中在一端時。
正偏態 (Positive Skew): 大多數分數較低(「尾巴」指向右側)。
負偏態 (Negative Skew): 大多數分數較高(「尾巴」指向左側)。
選擇統計檢定
你需要知道選擇這五種無母數檢定 (non-parametric tests) 的標準:
1. 曼-惠特尼 U 檢定 (Mann-Whitney U): 用於獨立樣本設計 (Independent Measures) 和次序數據。
2. 威爾卡森符號等級檢定 (Wilcoxon Signed Ranks): 用於重複量測設計 (Repeated Measures) 和次序數據。
3. 卡方檢定 (Chi-Square): 用於獨立組別和名目數據。
4. 二項式符號檢定 (Binomial Sign): 用於重複量測和名目數據。
5. 斯皮爾曼等級相關係數 (Spearman’s Rho): 用於尋找相關性時。
研究中的誤差
第一型誤差 (Type 1 Error,型一錯誤/偽陽性): 你聲稱結果具有顯著性,但實際上它們只是隨機發生的。(你太寬鬆了)。
第二型誤差 (Type 2 Error,型二錯誤/偽陰性): 你聲稱結果不具顯著性,但實際上存在效應。(你太嚴格了)。
本節重點:
• 推論統計檢定告訴我們是否能信任我們的結果。
• p ≤ 0.05 是魔法數字。
• 第一型誤差 = 看見了不存在的鬼魂。
• 第二型誤差 = 錯過了站在你身後那個真實的鬼魂!
必知符號
你必須能夠在考試中識別並使用這些符號:
= 等於
< 小於
<< 遠小於
>> 遠大於
> 大於
∝ 成正比
~ 大約
≥ 大於或等於
≤ 小於或等於