歡迎來到主題 8:知覺 (Perception)!
你有沒有想過為什麼遠方的道路看起來會匯聚成一點?或者為什麼你在燒焦的吐司上能「看出」一張人臉?這就是知覺 (perception)!在本章中,我們將學習大腦如何獲取眼睛所見的基本訊息,並將其轉化為有意義的世界。這是 Paper 2 的核心部分,讓我們開始吧!
如果有些名稱聽起來很專業,不用擔心——我們會用生活中的例子為你拆解!
1. 深度知覺線索 (Depth Cues):我們如何看到 3D 世界
實際上,我們的眼睛看世界時是 2D 的(就像一張平面照片),但大腦會運用各種「線索」來判斷物體的距離。我們將其分為兩類:單眼線索 (Monocular)(只需一隻眼睛)和雙眼線索 (Binocular)(需要兩隻眼睛)。
單眼深度線索 (Monocular Depth Cues) - 單眼即可
1. 遮蔽 (Superimposition): 當一個物體遮擋了另一個物體的一部分時,位於前面的物體看起來會比較近。
例子:如果你的手提電腦放在咖啡杯前面,你就會知道手提電腦比較近。
2. 相對大小 (Relative Size): 較小的物體看起來比較大的物體更遠。
例子:一個站在 50 米外的人看起來很小,但你不會覺得他是一個玩偶;你知道他只是因為距離遠。
3. 線性透視 (Linear Perspective): 平行線在遠處看起來會相交(匯聚)。
例子:看看筆直的長路或鐵軌;它們在遠方的地平線上看起來好像觸碰在一起。
4. 紋理梯度 (Texture Gradient): 我們可以看到近處物體的許多細節,但較遠處的物體看起來會模糊或平滑。
例子:看著鋪滿鵝卵石的海灘——你腳邊的每一顆石頭都清晰可見,但遠處看起來就像一片灰濛濛的平整表面。
5. 平面高度 (Height in the Plane): 在視野中位置較高的物體通常看起來較遠。
例子:如果你畫一幅畫,山脈在畫紙上的位置通常比前景的草地「更高」。
雙眼深度線索 (Binocular Depth Cues) - 雙眼協作
立體視差 (Stereopsis): 由於雙眼相距約 6 厘米,每隻眼睛看到的影像略有不同。你的大腦會融合這兩個影像來計算深度。
記憶小撇步: 想像一下「立體聲」(Stereo) 音響——你需要兩個喇叭才能獲得完整的音效!
快速回顧: 深度線索是大腦用來將平面影像轉化為 3D 世界的「線索」。單眼 = 1 隻眼,雙眼 = 2 隻眼。
2. 視覺錯覺與恆常性 (Visual Illusions and Constancies)
有時候大腦也會出錯!當我們的知覺被欺騙時,就會發生視覺錯覺 (Visual Illusions)。
錯覺的類型
虛幻圖形 (Fictions): 看到實際上並不存在的東西(例如:卡尼薩三角錯覺 (Kanizsa Triangle),你會看到一個其實沒畫出來的白色三角形)。
雙穩態圖形 (Ambiguous Figures): 一個可以有兩種不同解讀方式的影像(例如:「內克爾立方體 (Necker Cube)」或看起來既像鴨子又像兔子的圖畫)。
扭曲錯覺 (Distortions): 大腦對物體大小或長度的誤判(例如:繆勒-萊耶錯覺 (Müller-Lyer illusion),兩條長度相同的線,因為箭頭方向不同而看起來長度不一)。
視覺恆常性 (Visual Constancies)
即使視網膜上的影像發生變化,我們仍知道物體本身沒有改變。這就是恆常性 (constancy)。
形狀恆常性 (Shape Constancy): 知道門即使在擺動時看起來像梯形,但它本質上仍然是長方形。
顏色恆常性 (Colour Constancy): 知道你的紅襯衫在昏暗的房間裡仍然是紅色的。
大小恆常性 (Size Constancy): 知道巴士即使因為距離一英里遠而看起來很小,但它實際上依然是巨大的。
重點總結: 錯覺表明知覺不僅僅是「看到」,它是大腦的一種詮釋。而恆常性則幫助我們的世界保持穩定。
3. 吉布森的直接知覺理論 (Gibson’s Direct Theory) - 先天論 (Nature)
詹姆斯·吉布森 (James Gibson) 主張知覺是與生俱來 (innate) 的。他認為環境提供了我們所需的所有訊息,我們無需進行額外的「思考」或「猜測」。
1. 感官輸入 (Sensory Input): 我們持續從周圍環境接收訊息流。
2. 光流 (Optic Flow): 當我們移動時,周圍的世界會像「流動」一樣從身邊掠過。這能告訴我們移動的速度和方向。
3. 不變量 (Invariants): 環境中即便我們移動也保持不變的特徵(例如紋理)。
4. 賦予意義 (Affordances): 我們不僅看到物體,還能看出它們的「功能」。
例子:椅子「賦予」我們坐的功能。按鈕「賦予」我們按的功能。
優點: 它解釋了我們如何在不假思索的情況下進行駕駛或運動等快速活動。
缺點: 它難以解釋為什麼我們會產生視覺錯覺(如果知覺是「直接」的,我們理應不會被騙才對!)。
4. 格雷戈里的建構知覺理論 (Gregory’s Constructivist Theory) - 後天論 (Nurture)
理查德·格雷戈里 (Richard Gregory) 主張知覺是一個學習得來 (learned) 的過程。他認為眼睛提供的訊息通常是「不完整」的,大腦必須主動去補全缺失的部分。
1. 感官輸入 (Sensory Input): 來自眼睛的訊息通常是「碎片化」或「混亂」的。
2. 知覺假設 (Perceptual Hypothesis): 大腦會對所見事物進行「有根據的猜測」。
3. 推論 (Inferences): 我們利用已有的知識來理解這個世界。
4. 先驗知識 (Prior Knowledge): 過去的經驗幫助我們解讀新的事物。
例子:如果你在廚房看到一個模糊的形狀,你的大腦會「推論」它是多士爐,因為多士爐通常就放在那裡。
優點: 它完美解釋了視覺錯覺——錯覺不過是「錯誤的假設」而已。
缺點: 它無法解釋為什麼嬰兒(沒有先驗知識)也能具備深度知覺。
常見避坑指南: 別搞混了!Gibson = Gets it directly (直接獲取,先天論)。Gregory = Guesses (猜測,後天論)。
5. 知覺心向 (Perceptual Set):為什麼我們會看見我們想看見的東西?
知覺心向 (Perceptual Set) 是指以特定方式感知事物的傾向或「準備狀態」。我們的大腦已經被預先「設定」好去做出反應。
1. 動機 (Motivation): 我們想要或需要的東西會影響我們所見。
你知道嗎?飢餓的人比剛吃飽的人更容易從模糊的影像中看出食物!
2. 期望 (Expectation): 我們傾向於看見我們預期會看見的東西。如果你被告知即將看一部恐怖片,你可能會把衣架上的外套誤認成鬼魂。
3. 情緒 (Emotion): 我們的感受會改變我們的知覺。如果你感到恐懼,陰暗的巷子看起來會比實際情況更危險。
4. 文化 (Culture): 成長背景會改變我們解讀影像的方式。來自西方文化的人(生活在充滿直線的「木構世界」)比來自部落文化的人更容易被某些錯覺所欺騙。
重點總結: 我們的內部狀態(心情、飢餓感、背景)就像是觀察世界的過濾器。
6. 你必須知道的經典研究
研究 1:Haber 和 Levin (2001) - 大小與距離
目的: 觀察我們是否利用對物體「典型大小」的認知來判斷距離。
過程: 讓參與者在不同距離觀察常見物體(如燈泡)和「中性」物體(如木圓盤)。
發現: 參與者判斷常見物體的距離時準確得多,因為他們知道燈泡「應該」有多大。
結論: 對大小的先驗知識(大小恆常性)對於判斷距離至關重要。
研究 2:Carmichael, Hogan 和 Walter (1932) - 語言與知覺
目的: 觀察標籤(詞彙)是否會影響我們記憶和感知形狀的方式。
過程: 向參與者展示模糊的圖畫。一組被賦予標籤 A(例如:「這是掃帚」),另一組被賦予標籤 B(例如:「這是步槍」)。隨後,他們需要憑記憶畫出這些圖形。
發現: 他們畫出的圖形更像他們被賦予的標籤,而不是原始的形狀。
結論: 我們的知覺會受到口頭標籤和「基模 (schemas)」(心智捷徑)的影響。
快速回顧: Haber & Levin = 大小對距離很重要。Carmichael 等人 = 文字會改變我們看待事物的方式。
最終複習清單
- 你能定義單眼與雙眼線索嗎?
- 你能解釋吉布森(直接知覺)與格雷戈里(建構知覺)理論的區別嗎?
- 你知道知覺心向的 4 個因素嗎(動機、期望、情緒、文化)?
- 你能描述 Haber & Levin 研究的發現嗎?
做得好!知覺聽起來可能有點燒腦,但一旦你明白大腦其實只是在努力理解這個混亂的世界,一切就會豁然開朗。繼續加油,記住那些關鍵術語!