歡迎來到 AI 的世界!
你好!今天我們要探索計算機科學中最令人興奮的領域之一:人工智能(AI)的應用。別擔心,這聽起來可能像科幻小說,但我們會將其拆解成簡單、貼近現實的概念。讀完這些筆記後,你將了解電腦如何從大數據(Big Data)中「學習」,以及機器學習(Machine Learning)如何幫助它們像人類一樣(嗯,幾乎!)做出決定。讓我們開始吧!
1. 基礎:大數據 (Big Data)
在 AI 變得聰明之前,它需要大量資訊,我們稱之為大數據。你可以把大數據想像成一座規模龐大且擴張速度極快、人類根本讀不完的圖書館。從技術層面來說,大數據是指那些規模太大或太複雜,傳統數據處理軟件無法處理的數據集。
大數據的三個 V (The Three Vs)
要判斷某個事物是否屬於「大數據」,我們可以觀察三個 V。這裡有一個簡單的記憶方法:
1. 容量 (Volume):指數據的總量。我們說的不是幾 GB,而是 TB 或 PB 等級的數據。
類比:如果一般數據集是一桶水,大數據的「容量」就是整片海洋。
2. 速度 (Velocity):指數據產生和處理的速度。
例子:想想 Twitter (X)。每秒鐘都有成千上萬條推文發佈。數據正源源不絕地「串流」進來。
3. 多樣性 (Variety):指數據呈現多種不同的格式,而不僅僅是試算表中整齊的行列。它包含影片、電郵、傳感器數據和語音記錄等。
記憶小撇步:想像一個「綜藝節目」——裡面有歌手、舞者和喜劇演員。大數據同樣包含照片、文字和聲音。
快速複習:為什麼我們要在乎?
傳統數據庫(如帶有表格和鍵值的關係型數據庫)在處理大數據時會遇到困難,因為它們並非為處理如此龐大的多樣性或速度而設計。然而,AI 系統卻能利用這些特性蓬勃發展!
重點摘要: 大數據由龐大的容量、高速的速度和廣泛的多樣性定義。它是推動 AI 的「燃料」。
2. 機器學習 (Machine Learning, ML)
機器學習是 AI 的一個子集。程序員不需要編寫成千上萬條「如果-那麼」(If-Then) 的規則,而是讓電腦利用演算法 (Algorithms) 從數據中找出規律並自行制定規則。它從經驗中「學習」。
考試中你需要知道兩種主要的機器學習方式:
A. 監督式學習 (Supervised Learning)
在監督式學習中,電腦會接收「已標記 (Labeled)」的數據。這意味著電腦同時看到了輸入資訊和正確答案。
例子:你向電腦展示 1,000 張貓的圖片和 1,000 張狗的圖片,並告訴它哪些是貓,哪些是狗。最終,當你展示一張新圖片時,它就能自行識別出貓的特徵。
類比: 這就像學生跟隨老師學習,老師會檢查作業並提供標準答案。
B. 非監督式學習 (Unsupervised Learning)
在非監督式學習中,電腦接收到的數據沒有標籤也沒有答案。它必須自行找出規律,並根據相似性將數據分組。
例子:你給電腦成千上萬名超市顧客的購物數據。它可能會注意到一組人買了很多嬰兒奶粉和尿布,而另一組人買了高級芝士和紅酒。它在沒有預設目標的情況下,自動將顧客「群聚 (Clusters)」分成不同類別。
類比: 這就像一個幼兒在玩形狀積木時,自然地將圓形的放在一堆,正方形的放在另一堆。
避免常見錯誤:
別搞混這兩者!只要記住:監督式 = 有老師/有標籤。非監督式 = 沒有老師/自行尋找隱藏規律。
重點摘要: 機器學習讓電腦透過識別規律來提升任務表現。監督式使用已標記數據,而非監督式則在未標記數據中自行建立結構。
3. 人工神經網絡 (Artificial Neural Networks, ANN)
這聽起來很複雜,但別擔心!人工神經網絡只是一種模擬人腦運作方式的軟件。它由多層「神經元」(實際上就是數學函數)組成。
神經網絡的結構
一個 ANN 通常包含三個主要部分:
1. 輸入層 (Input Layer):原始數據進入系統的地方(例如圖片的像素)。
2. 隱藏層 (Hidden Layers):進行「思考」的地方。可以有多個隱藏層,它們透過對數據應用權重 (Weights) 來處理資訊。
3. 輸出層 (Output Layer):最終的結果或預測(例如「這張圖片有 98% 的機率是貓」)。
它們如何學習?(權重與閾值)
神經元之間的每個連接都有一個權重。權重就是一個數字,用來告訴網絡該特定資訊的重要性。在訓練過程中,如果網絡犯了錯,它會稍微調整這些權重,直到得出正確答案。這個過程稱為訓練 (Training)。
你知道嗎? 這就是 Siri 或 Alexa 等語音助手理解你的方式!它們利用神經網絡將你聲音的聲波轉化為文字,然後再轉化為指令。
重點摘要: 神經網絡利用輸入層、隱藏層和輸出層來模擬大腦。它們使用權重來確定數據的重要性,並透過訓練不斷進步。
4. AI 的現實應用
了解了「原理」後,讓我們看看「應用」。在考試中,你可能會被要求討論這些應用:
1. 醫療保健:AI 分析醫學影像(如 X 光片)的速度比人類快得多,能更早發現癌症等疾病跡象。這使用了監督式學習和神經網絡。
2. 金融:銀行利用 AI 來偵測欺詐行為。如果你突然在另一個國家花費了 5,000 美元,AI 會注意到這個規律不符合你平時的消費容量或多樣性,並將其標記為異常。
3. 自動駕駛車輛:自動駕駛汽車利用來自傳感器的大數據(速度)和神經網絡,即時識別停車標誌、行人和其他車輛。
最後快速複習箱
- 大數據: 高容量、高速度、高多樣性。
- 機器學習: 監督式(有標籤)vs 非監督式(無標籤)。
- 神經網絡: 輸入層 → 隱藏層 → 輸出層;使用權重。
- AI 目標: 執行通常需要人類智慧才能完成的任務。
恭喜你讀完這一章!如果神經網絡背後的數學看起來有點神秘,別擔心——在 AS Level 階段,最重要的是理解這些概念、3 個 V 以及學習類型。你一定行的!