導言:追蹤詞彙的生命週期
你有沒有想過,為什麼我們現在不再說 "hither" 或 "thou",但大家卻突然都知道 "podcast" 是什麼意思?語言是不斷移動、呼吸和演變的。在你的英國語文(9093)課程中,你需要理解這些變化是如何以及為何發生的。在觀察這些變化時,其中一個最酷的工具就是 n-gram 圖表(n-gram graph)。別被這個名字嚇倒了——它只是一種把詞彙歷史轉化為圖像的方式而已!
在這些筆記中,我們將拆解這些圖表是什麼、如何解讀,以及它們如何幫助你分析考試中遇到的文本的語境(context)和詞彙(vocabulary)。
究竟什麼是「n-gram」?
在查看圖表之前,我們需要知道我們在統計什麼。n-gram 簡而言之就是一大段文本中的一系列項目(通常是詞彙)。其中的 "n" 代表一個數字。
• 1-gram (unigram/一元語法): 單個詞彙。例如:"Telephone"。
• 2-gram (bigram/二元語法): 兩個詞組成的詞組。例如:"Mobile phone"。
• 3-gram (trigram/三元語法): 三個詞組成的詞組。例如:"Smart mobile phone"。
快速回顧: 可以把 n-gram 想像成一條「詞彙鏈」。數字代表鏈條中有多少個環節。
理解圖表
n-gram 圖表(如 Google Ngram Viewer)顯示了特定的詞彙或詞組在書籍中隨長時間出現的頻率。當你在考試中看到它時,解讀方法如下:
水平軸(X 軸): 代表時間(通常是年份或十年)。它告訴你數據是何時收集的。
垂直軸(Y 軸): 代表頻率。它告訴你該詞彙有多受歡迎。通常以百分比形式顯示,例如 \( 0.0001\% \)。這表示在該年出版的每一百萬個詞彙中,該詞出現的次數。
比喻: 把圖表想像成詞彙的「人氣競賽」。如果線條上升,代表該詞正在勝出!如果線條下降,代表該詞正在「輸掉」,甚至逐漸被遺忘。
為什麼線條會移動?(分析語言變化)
這是你 Paper 1 和 Paper 2 分析中最重要的一部分。你看到的不是簡單的線條,而是歷史。當你在 n-gram 圖表上看到變化時,請問自己「為什麼?」
1. 上升趨勢(人氣上升)
當線條爬升時,通常象徵著社會或技術的變革。例如,"internet" 的 n-gram 在幾個世紀以來一直為零,直到 1990 年左右垂直飆升。
• 新發明: 當技術誕生時,像 "automobile" 或 "computer" 這類詞彙便會出現。
• 社會轉型: "women's rights"(婦女權利)這一詞組在 20 世紀社會焦點轉移時,出現了巨大的高峰。
2. 下降趨勢(人氣下降)
當線條下降時,代表該詞正在變得古舊(archaic)或廢棄(obsolete,不再使用)。
• 替代: 通常一個詞「死亡」是因為有更新的詞取而代之。你可能會看到 "wireless" 的線條下降,而 "radio" 的線條上升。
• 失去相關性: 像 "apothecary"(藥劑師)這樣的詞因為我們開始改用 "pharmacist" 或 "chemist" 而被淘汰。
3. 高峰與低谷
有時你會看到圖表中突然出現一座「山峰」但隨即消失。這通常與特定的歷史事件有關。例如,"rationing"(配給)一詞在第一次世界大戰和第二次世界大戰期間會出現高峰,但在其他時期則非常低。
關鍵總結: n-gram 圖表上的每一條線都在講述當時世界語境的故事。如果線條移動了,說明世界發生了變化!
連結課程大綱:語言要素
課程大綱要求你展現對語言要素(linguistic elements)的知識,例如詞彙(vocabulary)和詞類(word classes)。n-gram 可以這樣幫助你:
• 詞彙學(Lexis): n-gram 是我們詞彙演變的終極證明。你可以用它來探討非正式語言(俚語)如何隨著時間推移在書面文本中變得更加普遍。
• 詞態學(Morphology): 你可以觀察詞尾是如何變化的。例如,比較 "learnt" 和 "learned",可以看出美式英語拼寫如何隨時間影響英式英語。
• 語用學(Pragmatics): 有時一個詞並未消失,而是其含義改變了。雖然 n-gram 不一定能直接顯示含義,但它可以展示像 "gay" 這樣的詞,隨著其主要用法從「快樂」轉變為特定的社會身份,其使用頻率是如何變化的。
應避免的常見錯誤
錯誤 1:混淆「百分比」與「總數」。
如果 Y 軸上的數字非常小(如 \( 0.000005\% \)),不必擔心。英語中有數以百萬計的詞彙!重要的是線條的趨勢,而不是那個微小的數值。
錯誤 2:忽略語境。
如果你看到一個詞在 1860 年出現峰值,不要只說「它變受歡迎了」。運用你的歷史知識!提及這可能與美國內戰或工業革命有關。語境是獲取高分的關鍵。
錯誤 3:認為「平線」代表該詞無人使用。
平線只是代表受歡迎程度保持不變。這稱為穩定性(stability)。像 "the", "and", 和 "of" 這些詞有著非常平坦且位處高位的線條,因為我們永遠需要它們!
快速回顧箱
你知道嗎? 用於製作這些圖表的文本集合稱為語料庫(corpus)。它就像一個巨大的數位圖書館,電腦透過「閱讀」它來尋找數據。
記憶小撇步: 把 N-grams 想像成 "Now-grams"(現在詞彙)與 "Then-grams"(過去詞彙)。它們比較了我們「現在」說的話與「那時」人們說的話。
分析步驟總結:
1. 識別 n-grams(正在比較的詞彙或詞組)。
2. 查看底部軸上的時間段。
3. 描述趨勢(是上升、下降還是穩定?)。
4. 解釋原因(將其與歷史、社會或技術因素聯繫起來)。
5. 連結到語言學術語(詞彙、古語、新詞)。
如果起初覺得這些有點棘手,不用擔心!一旦你開始將詞彙視為會隨著人氣成長與萎縮的「生物」,閱讀這些圖表就會變得像閱讀人類歷史的地圖一樣簡單。