歡迎來到數據分析的世界!
在解難(Problem Solving)的領域裡,數據絕不僅是一堆枯燥的數字,它們是等待被拆解的故事。無論你面對的是氣候變化的趨勢圖,還是電子遊戲的高分排行榜,「數據分析」的核心其實離不開兩點:改變數據的呈現方式使其更易於理解,以及找出數字背後的「因果邏輯」。別擔心如果你不是數學天才;這個章節談論的更多是邏輯與「偵探工作」,而非艱深的算術!
3.1 轉換數據
有時,數據的呈現方式可能很難閱讀。轉換數據是指將這些資訊以另一種等效的方式呈現出來。這就像將句子從一種語言翻譯成另一種語言——意思保持不變,但形式改變了。
辨識不同的表達方式
你需要具備一種能力,即看出圓形圖(pie chart)、長條圖(bar chart)和數據表(data table)其實都可以呈現完全相同的資訊。例如,如果表格顯示 50% 的學生喜歡蘋果,另外 50% 喜歡香蕉,你應該能一眼看出哪一個圓形圖是剛好被平分成兩半的。
小貼士:比較不同的圖表時,先找出「極端值」。哪一個類別最大?哪一個最小?如果長條圖顯示「藍色」的條狀最高,那麼圓形圖中的「藍色」區塊也必須是最大的一塊!
辨識模型的特徵
「模型」不過是一條解釋事物運作規律的法則或圖表。其中一個最重要的特徵就是圖表的斜率(gradient)。
例子:如果你有一張顯示計程車車資的圖表,線條的「陡峭程度」就代表了每公里的價格。
如果線條呈現:
1. 陡峭:每公里價格很高。
2. 平緩:每公里價格很低。
3. 水平:表示無論距離增加多少,都沒有額外費用。
空間轉換(圖磚與圖案)
數據並不總是數字;有時它是視覺化的。你可能會被要求辨認某個圖案或「圖磚」在經過旋轉(rotated)或翻轉(flipped)後的樣子(這屬於變換)。
類比:試想一塊有圖案的地磚。如果你將它旋轉 90 度,角落的圖形就會跟著移動。要解決這類問題,請選定一個特定的「特徵」(例如左上角的紅點),然後追蹤它在轉動後的去向。
重點總結:數據可以換掉它的「外衣」(呈現形式),但「核心內容」(事實)始終如一。透過尋找最大和最小值,你可以快速將不同的圖表進行配對。
3.2 解釋數據趨勢
當你看懂了數據,下一步就是解釋發生了什麼事。為什麼線條往上升?為什麼它在六月份突然暴跌?
提出趨勢的解釋
趨勢(trend)是事物發展或變化的普遍方向。你的工作是為這種變化提出一個合乎邏輯的解釋。
例子:如果圖表顯示七月份的冰淇淋銷量突然翻倍,一個合理的解釋是天氣變熱了。如果與此同時雨傘的銷量也激增,那可能代表那是一個非常多雨的夏天!
你知道嗎?有時候趨勢會在特定的「門檻(threshold)」發生改變。例如,手機計劃可能前 500MB 的費用為 \( \$10 \),但一旦超過這個限制,收費「趨勢」就會變得更陡(更昂貴)。
將模型套用到資訊中
這聽起來很高級,但它實際上只是指「找出隱藏的規律」。如果你拿到了一些數據,你能算出背後的公式嗎?
步驟範例:
1. 2公里的車程收費 \( \$5 \)。
2. 5公里的車程收費 \( \$11 \)。
3. 距離差是 \( 3km \)。
4. 價格差是 \( \$6 \)。
5. 因此,「模型」或規則是:價格為每公里 \( \$2 \)(外加 \( \$1 \) 的起步費)。
記憶法:使用數學中「Y 的變化量 / X 的變化量」的技巧來找出變化率!在「思維技巧」(Thinking Skills)科,我們稱之為「擬合參數(fitting a parameter)」。
重點總結:趨勢通常都有合理的成因。要找出數字背後的「規則」,請觀察數據中兩點之間的差異。
快速複習:避免常見錯誤
1. 不要混淆「相關性」與「因果關係」:僅僅因為兩件事同時發生(例如鯊魚襲擊次數和冰淇淋銷量都在夏天上升),並不代表其中一個是另一個的「原因」(並不是冰淇淋讓鯊魚變餓——只是天氣熱的時候更多人去海邊玩水而已!)。
2. 注意刻度:務必檢查圖表側面(y 軸)和底部(x 軸)的數字。有些圖表會透過改變刻度,刻意讓變化看起來更「嚇人」或更「陡峭」。
3. 檢查「固定成本」:在許多模型中,在任何變動發生前都會有一個起始值(例如打電話時,即使通話未滿一分鐘,也會先收取 \( \$3 \) 的「接通費」)。
如果一開始覺得困難,別擔心!數據分析是一項透過練習就能變得輕鬆的技能。從新聞報導或體育統計數據中的圖表開始,試著問自己:「他們還有什麼其他方式可以呈現這些數據?」以及「解釋這些數字的規律是什麼?」