欢迎来到数据分析的世界!
在解难(Problem Solving)的领域里,数据绝不仅是一堆枯燥的数字,它们是等待被拆解的故事。无论你面对的是气候变化的趋势图,还是电子游戏的高分排行榜,「数据分析」的核心其实离不开两点:改变数据的呈现方式使其更易于理解,以及找出数字背后的「因果逻辑」。别担心如果你不是数学天才;这个章节谈论的更多是逻辑与「侦探工作」,而非艰深的算术!
3.1 转换数据
有时,数据的呈现方式可能很难阅读。转换数据是指将这些信息以另一种等效的方式呈现出来。这就像将句子从一种语言翻译成另一种语言——意思保持不变,但形式改变了。
辨识不同的表达方式
你需要具备一种能力,即看出圆形图(pie chart)、条形图(bar chart)和数据表(data table)其实都可以呈现完全相同的信息。例如,如果表格显示 50% 的学生喜欢苹果,另外 50% 喜欢香蕉,你应该能一眼看出哪一个圆形图是刚好被平分成两半的。
小贴士:比较不同的图表时,先找出「极端值」。哪一个类别最大?哪一个最小?如果条形图显示「蓝色」的条状最高,那么圆形图中的「蓝色」区块也必须是最大的一块!
辨识模型的特征
「模型」不过是一条解释事物运作规律的法则或图表。其中一个最重要的特征就是图表的斜率(gradient)。
例子:如果你有一张显示出租车车资的图表,线条的「陡峭程度」就代表了每公里的价格。
如果线条呈现:
1. 陡峭:每公里价格很高。
2. 平缓:每公里价格很低。
3. 水平:表示无论距离增加多少,都没有额外费用。
空间转换(图砖与图案)
数据并不总是数字;有时它是视觉化的。你可能会被要求辨认某个图案或「图砖」在经过旋转(rotated)或翻转(flipped)后的样子(这属于变换)。
类比:试想一块有图案的地砖。如果你将它旋转 90 度,角落的图形就会跟着移动。要解决这类问题,请选定一个特定的「特征」(例如左上角的红点),然后追踪它在转动后的去向。
重点总结:数据可以换掉它的「外衣」(呈现形式),但「核心内容」(事实)始终如一。透过寻找最大和最小值,你可以快速将不同的图表进行配对。
3.2 解释数据趋势
当你读懂了数据,下一步就是解释发生了什么事。为什么线条往上升?为什么它在六月份突然暴跌?
提出趋势的解释
趋势(trend)是事物发展或变化的普遍方向。你的工作是为这种变化提出一个合乎逻辑的解释。
例子:如果图表显示七月份的冰淇淋销量突然翻倍,一个合理的解释是天气变热了。如果与此同时间雨伞的销量也激增,那可能代表那是一个非常多雨的夏天!
你知道吗?有时候趋势会在特定的「门槛(threshold)」发生改变。例如,手机计划可能前 500MB 的费用为 \( \$10 \),但一旦超过这个限制,收费「趋势」就会变得更陡(更昂贵)。
将模型套用到信息中
这听起来很高级,但它实际上只是指「找出隐藏的规律」。如果你拿到了一些数据,你能算出背后的公式吗?
步骤范例:
1. 2公里的车程收费 \( \$5 \)。
2. 5公里的车程收费 \( \$11 \)。
3. 距离差是 \( 3km \)。
4. 价格差是 \( \$6 \)。
5. 因此,「模型」或规则是:价格为每公里 \( \$2 \)(外加 \( \$1 \) 的起步费)。
记忆法:使用数学中「Y 的变化量 / X 的变化量」的技巧来找出变化率!在「思维技巧」(Thinking Skills)科,我们称之为「拟合参数(fitting a parameter)」。
重点总结:趋势通常都有合理的成因。要找出数字背后的「规则」,请观察数据中两点之间的差异。
快速复习:避免常见错误
1. 不要混淆「相关性」与「因果关系」:仅仅因为两件事同时发生(例如鲨鱼袭击次数和冰淇淋销量都在夏天上升),并不代表其中一个是另一个的「原因」(并不是冰淇淋让鲨鱼变饿——只是天气热的时候更多人去海边玩水而已!)。
2. 注意刻度:务必检查图表侧面(y 轴)和底部(x 轴)的数字。有些图表会透过改变刻度,刻意让变化看起来更「吓人」或更「陡峭」。
3. 检查「固定成本」:在许多模型中,在任何变动发生前都会有一个起始值(例如打电话时,即使通话未满一分钟,也会先收取 \( \$3 \) 的「接通费」)。
如果一开始觉得困难,别担心!数据分析是一项透过练习就能变得轻松的技能。从新闻报道或体育统计数据中的图表开始,试着问自己:「他们还有什么其他方式可以呈现这些数据?」以及「解释这些数字的规律是什么?」