歡迎來到數據的世界!
你已經設計好實驗、召集了參與者,也完成了研究。現在該怎麼辦?你手上有一堆「線索」(數據),但它們還沒能說出一個完整的故事。在本章中,我們將學習如何整理、分析並呈現這些數據,讓我們能真正理解人類心智運作的奧秘。將自己想像成一名翻譯官,把混亂的數字和文字轉化為清晰、科學的真相。
別擔心如果你自認不是「數學掛」——我們會把所有內容拆解,一步一步帶你搞定!
1. 處理原始數據
原始數據 (Raw data) 就是你在研究過程中收集到、未經任何處理的「原始資訊」。就像做蛋糕的原料一樣——在攪拌混合之前,你是看不見成品長什麼樣的。
原始數據記錄表
在進行實驗或觀察時,你需要一張原始數據記錄表 (raw data recording table)。這是一個簡單的表格,讓你可以在觀察到結果的當下,即時記錄分數或行為。 例子:一個表格,其中一欄是「參與者姓名」,另一欄是「解開謎題所需的時間」。
數據處理的數學技巧
心理學家會用一些數學小撇步來讓數據保持整齊:
標準式 (Standard Form): 用於處理極大或極小的數字,格式為 \( A \times 10^n \)。例如,500 可以寫成 \( 5 \times 10^2 \)。
有效數字 (Significant Figures): 指的是將數字四捨五入到有意義的位數。如果計算機算出 12.345678,你可以將其簡化為 12.3(3 位有效數字),讓數據更易讀。
估算 (Estimations): 有時候,在進行大規模計算前先進行「預估」很有幫助,看看最終答案是否合理。如果你計算 10、12 和 14 的平均值,結果卻算出 50,你就知道自己肯定哪裡算錯了!
快速回顧: 原始數據是你研究結果的「初稿」。從一開始就使用表格來保持整潔吧!
2. 數據的層次與類型
數據並非生而平等!心理學家會對數據進行分類,以便之後判斷該使用哪種統計檢定。
定量數據 vs. 定性數據
定量數據 (Quantitative Data): 以數字形式呈現的數據(例如:「記憶測驗的分數」)。容易分析,但缺乏細節。
定性數據 (Qualitative Data): 以文字形式呈現的數據(例如:「參與者對測試感受的描述」)。細節豐富,但較難歸納總結。
初級數據 vs. 次級數據
初級數據 (Primary Data): 你為了自己的研究親自收集的數據。
次級數據 (Secondary Data): 已經存在的數據,由他人收集(例如:使用政府的犯罪統計資料)。
數據的三個層次
這是 OCR 課程中非常重要的部分。要記住它們,請記住 NOI 這個詞:
1. 名義層次 (Nominal Level): 由類別或名稱組成的數據。你只是在「數人頭」。(例子:計算有多少人喜歡貓,多少人喜歡狗)。
2. 次序層次 (Ordinal Level): 可以排序或「分等級」的數據,但級別之間的差距並不相等。(例子:比賽獲得第 1、2、3 名。你知道誰比較快,但不知道具體快了幾秒)。
3. 等距層次 (Interval Level): 使用固定且相等間隔的刻度來測量的數據。(例子:攝氏溫度或秒數)。 這是最「科學」的數據層次。
重點總結: 識別你的數據層次(名義、次序或等距)是決定使用哪種統計檢定的第一步。
3. 描述性統計
描述性統計用於總結你的數據,讓你一眼就能看懂重點。
集中趨勢測量(中間值)
平均數 (Mean): 即平均值。將所有分數相加後除以總數。(非常敏感;一個極端分數就可能毀掉它!)
中位數 (Median): 當所有分數依序排列時,位於中間的分數。(如果有極端高分或極端低分,用中位數最好)。
眾數 (Mode): 出現頻率最高的分數。(適用於名義數據)。
離散程度測量(分散度)
這些測量告訴我們分數是聚在一起,還是分散得很開。
全距 (Range): 最高分與最低分之間的差異。(計算公式:最高分 - 最低分 + 1)。
變異數與標準差 (Variance and Standard Deviation): 這些較為複雜。它們告訴我們每個分數平均偏離平均數的程度。標準差小代表大家的分數都差不多;標準差大則代表結果非常分散。
數據視覺化(圖表)
長條圖 (Bar Charts): 用於名義數據(類別)。長條之間不能相連。
直方圖 (Histograms): 用於等距數據(連續數字)。長條必須相連。
散佈圖 (Scatter Diagrams): 用於相關性研究,顯示兩個變量之間的關係。
圓餅圖 (Pie Charts): 用於顯示整體中的比例或百分比。
常見錯誤: 長條圖的長條千萬別連在一起!那只有直方圖才行。把長條圖想成是各類別之間的「社交距離」吧。
4. 推論統計
這聽起來很嚇人,但其實只是在回答一個問題:「我的結果純屬巧合,還是真的發現了什麼?」
機率與顯著性
心理學家使用 \( p < 0.05 \) 作為顯著性水平 (significance level)。這意味著結果純屬偶然發生的機率小於 5%。我們希望至少有 95% 的把握確認我們的發現是真實的!
常態分佈曲線 (Normal Distribution Curve)
如果你測量大群體的身高,大多數人會處於平均值,極高和極矮的只有少數。這會形成一個對稱、鐘形的曲線,稱為常態分佈。
如果曲線偏向一邊,則稱為偏態 (Skewed)。(例子:如果考試太容易,大多數人得分很高,會形成負偏態)。
選擇統計檢定
課程要求你知道何時使用特定的非參數檢定 (non-parametric tests)。不用擔心數學公式,只要知道怎麼選擇就行!
1. 卡方檢定 (Chi-square): 用於名義數據和獨立測量。
2. 二項式符號檢定 (Binomial Sign Test): 用於名義數據和重複測量。
3. 曼-惠特尼 U 檢定 (Mann-Whitney U): 用於次序數據和獨立測量。
4. 威爾科克森符號秩檢定 (Wilcoxon Signed Ranks): 用於次序數據和重複測量。
5. 斯皮爾曼等級相關係數 (Spearman’s Rho): 當你想探討兩個變量之間的相關性時使用。
第一型與第二型錯誤
第一型錯誤 (Type 1 Error,即「偽陽性」): 你宣稱有顯著結果,但其實沒有。你太樂觀了!(通常發生在顯著性水平太寬鬆時,如 10%)。
第二型錯誤 (Type 2 Error,即「偽陰性」): 你宣稱沒有結果,但事實上有!你太保守了。(通常發生在顯著性水平太嚴格時,如 1%)。
你知道嗎? 第一型錯誤就像沒火災卻響起火災警報;第二型錯誤則是真有火災,警報卻沒響!
5. 方法論問題
在分析數據時,我們必須檢查研究是否真的是好的「科學」。
信度 (Reliability): 研究是否具一致性?如果再做一次,會得到同樣的結果嗎?
檢查方式:重測信度 (Test-retest)(再次進行測試)或 評分者信度 (Inter-rater)(兩名觀察者的記錄是否一致?)。
效度 (Validity): 研究測量的是否真的是它宣稱要測量的東西?
檢查方式:生態效度 (Ecological validity)(是否像現實生活?)或 表面效度 (Face validity)(一眼看上去是否合理?)。
偏差 (Bias): 小心社會期許偏差 (Social Desirability)(參與者表現得比實際更好)以及研究者偏差 (Researcher Bias)(心理學家只看到他們想看的)。
倫理考量: 請務必記住 BPS 倫理守則。你必須確保尊重 (Respect)(知情同意)、勝任能力 (Competence)、責任 (Responsibility)(事後說明)以及誠信 (Integrity)(除非必要,否則避免欺騙)。
最後小撇步: 當你撰寫關於數據的報告時,一定要誠實說明其局限性。沒有研究是完美的,承認這一點才是一位優秀心理學家的標誌!