歡迎來到數據與資訊的世界!

歡迎來到這個領域!無論你是科技達人,還是覺得電腦有點複雜的初學者,這些筆記都是為你準備的。在本章中,我們將探索原始事實(數據 Data)是如何轉化為有用的資訊(資訊 Information)。把它想像成烹飪:數據就是你的原始食材,而資訊就是你用這些食材精心製作出的美味佳餚。讓我們開始吧!

1.1 數據與資訊

乍看之下,這兩個詞似乎意思相同,但在資訊科技(IT)中,它們可是有很大的區別!

有什麼區別?

數據 (Data) 由原始的事實和數字組成,它們沒有背景訊息。單獨來看,數據基本上沒什麼用處。
範例:39, 42, 38。(這些僅僅是數字而已)。

資訊 (Information) 是經過處理並賦予了背景 (Context)意義 (Meaning) 的數據。
範例:「過去三天的每日最高氣溫分別為 39°C、42°C 和 38°C。」現在這些數字就有意義了!

核心概念: 數據 + 背景 + 意義 = 資訊。

直接數據與間接數據

數據主要有兩種收集方式:

1. 直接數據 (Direct Data): 這是「親力親為」的數據。你(或你的機構)為了當前的特定任務而專門收集的數據。
來源: 問卷調查 (Questionnaires)面試 (Interviews)觀察 (Observations)數據記錄 (Data Logging)(例如感應器記錄溫度)。

2. 間接數據 (Indirect Data): 這是「二手」數據。它們最初是為了某個目的而收集的,但現在被用於其他用途。
來源: 選民登記冊 (Electoral registers)人口普查數據 (Census data)氣象記錄 (Weather records),或從其他企業購買的資訊。

優缺點比較

直接數據:
(+) 非常切題,因為提問內容是你自己決定的。
(-) 收集成本可能較高且耗時。

間接數據:
(+) 通常獲取速度更快、成本更低(因為資料已經存在了!)。
(-) 可能過時,或者不完全符合你的需求。

快速回顧: 數據是原始事實。資訊是具有意義的數據。直接數據由你自己收集;間接數據則由他人收集。

1.2 資訊品質

並非所有的資訊都是好資訊!為了具有參考價值,資訊必須具備高品質。如果覺得要記的東西太多也不用擔心,只要記得 ARADC 原則:

1. 準確性 (Accuracy): 資料是否正確?如果氣象報告說倫敦 12 月的氣溫是 50°C,那顯然不準確!
2. 相關性 (Relevance): 這是否是你真正需要的?如果你想買房,一份汽車價格表對你來說就沒用。
3. 時效性 (Age): 資料是否最新?對於 2022 年才興建的道路,2010 年的地圖就沒有參考價值。
4. 詳細程度 (Level of Detail): 資訊是否充足(或過多)?老闆需要的是摘要,而不是一份包含每一筆銷售紀錄的 500 頁清單。
5. 完整性 (Completeness): 是否有任何遺漏?如果一個電話號碼少了最後兩位數字,那它就毫無用處。

核心要點: 高品質的資訊必須準確、相關、及時、足夠詳細且完整。

1.3 加密 (Encryption)

加密 (Encryption) 是一種將數據擾亂的過程,使得未經授權的人無法讀取。這就像是用一種只有你和摯友才懂的密碼來寫祕密紙條一樣。

加密方法

1. 對稱加密 (Symmetric Encryption): 使用相同的密鑰 (Key) 來加密(鎖定)和解密(解鎖)數據。
比喻:房門鑰匙。你用同一把鑰匙鎖門,稍後也是用這把鑰匙開門。

2. 非對稱加密 (Asymmetric Encryption): 使用一對密鑰——公開密鑰 (Public Key)(任何人都可以用它來加密數據)和 私有密鑰 (Private Key)(只有擁有者持有,用於解密數據)。
比喻:信箱。任何人都可以把郵件投進投遞口(公開),但只有擁有者有鑰匙可以打開信箱並讀取郵件(私有)。

協定 (網際網路規則)

當你在瀏覽器中看到「https」和鎖頭圖示時,你正在使用 SSL (安全通訊端層)TLS (傳輸層安全性協定)。這些協定能保護數據在你的電腦(用戶端)與網站(伺服器)之間傳輸時的安全。IPsec 是另一種經常用於 VPN 的協定,用於確保網際網路協定通訊的安全。

你知道嗎? TLS 基本上就是 SSL 的更新且更安全版本!

1.4 檢查數據準確性

在我們處理數據之前,需要確保它已經過「清理」。我們透過驗證 (Validation)核對 (Verification) 來做到這一點。這兩個詞聽起來很像,但其實完全不同!

驗證 (Validation - 合理性檢查)

驗證是電腦進行的檢查,用於確認數據是否符合特定規則。
- 存在性檢查 (Presence Check): 你是否漏填了欄位?
- 範圍檢查 (Range Check): 數字是否在 1 到 100 之間?
- 類型檢查 (Type Check): 你是否在應該輸入數字的地方輸入了字母?
- 格式檢查 (Format Check): 郵遞區號看起來是否像「AB1 2CD」的格式?
- 檢驗碼 (Check Digit): 對代碼(如 ISBN)進行數學運算,以確保數字正確。

核對 (Verification - 正確性檢查)

核對是檢查數據是否與原始來源一致。
- 視覺檢查 (Visual Check): 將螢幕上的內容與紙本表格進行對照。
- 二次輸入 (Double Data Entry): 連續兩次輸入相同的密碼(如果兩次輸入不符,代表你打錯了!)。

其他技術性檢查:

- 同位檢查 (Parity Check): 檢查二進位字串中 1 的數量是奇數還是偶數,以偵測傳輸中的錯誤。
- 檢驗和/雜湊總值 (Checksum/Hash Total): 根據數據計算出一個數值,並在接收端進行對比,以確保數據在傳輸過程中沒有被更改。

要避免的常見誤區: 驗證不能保證數據 100% 正確。如果你在年齡欄輸入「19」(事實上你 18 歲),電腦不會知道你在撒謊,並且會接受它,因為這是一個「合理」的數字!

1.5 數據處理 (Data Processing)

電腦如何處理數據?主要有三種方式:

1. 批次處理 (Batch Processing)

數據經過一段時間的收集後,一次性地進行處理,通常在「非尖峰」時段(例如深夜)進行。一旦開始,通常不需要人工干預。
範例: 水電費帳單薪資發放 (Payroll)信用卡帳單
關鍵術語: 主檔 (Master File)(主要的永久數據)與 異動檔 (Transaction File)(隨後應用到主檔的日常變動數據)。

2. 線上處理 (Online Processing)

使用者與系統互動,數據幾乎立即得到處理。
範例: 網上購物預訂機票電子轉帳 (EFT)

3. 即時處理 (Real-Time Processing)

適用於需要立即響應的系統,因為輸出的結果會影響下一個輸入。這常應用於控制系統 (Control Systems)
- 微處理器控制: 防盜警報器空調系統交通號誌
- 無線感應器網路: 智慧家居自動駕駛車輛導彈導引系統

範例:溫室控制

1. 感應器測量光線/溫度。
2. 數據傳送到微處理器
3. 電腦將其與「預設」值進行比較。
4. 如果溫度過低,電腦發送訊號給驅動器 (Actuator) 開啟加熱器。
5. 溫度發生變化(輸入改變),循環再次開始!

快速回顧: 批次 = 稍後處理。線上 = 現在處理。即時 = 為挽救生命或控制機器而進行的瞬間反應。

最後的鼓勵

如果現在覺得這些術語太多太繁雜,不用擔心!學習 IT 的最好方法,是思考你日常生活中是如何使用這些技術的。每一次你登入網站(加密)、輸入兩次密碼(核對),或者等待每月的電話帳單(批次處理),你其實都在應用這些概念!繼續加油!