🐘 綜合學習筆記:Fagen 等人(大象學習研究)(2014) 🐘

歡迎來到學習取向!

你好!這項核心研究 Fagen 等人的研究,是一個絕佳的例子,展示了心理學理論——特別是學習取向 (Learning Approach)——如何應用於現實生活中,在這種情況下,是用於改善尼泊爾工作大象的福利與管理。你將會看到操作制約 (Operant Conditioning) 的實際運作!

第一部分:正在調查的心理學概念

1.1 學習取向的基本假設

記住,學習取向假設所有行為都是透過與環境的互動與經驗而獲得的。本研究主要集中在操作制約上。

什麼是操作制約?

操作制約是基於自主行為的後果 (consequences) 來進行學習。大象執行一項行為(操作),而該行為的後果決定了這種行為是否會再次發生。

  • 增強 (Reinforcement): 使行為更有可能再次發生的後果。Fagen 等人的研究幾乎完全依賴此方法。
  • 懲罰 (Punishment): 使行為較不可能再次發生的後果(例如傳統嚴厲的訓練方法,而 Fagen 等人旨在取代這些方法)。
1.2 操作制約中的關鍵概念 (Fagen 等人)

本研究特別使用了三個核心概念來達成複雜的訓練目標:

  1. 增強類型:
    • 初級增強物 (Primary Reinforcement): 滿足生物性需求(例如食物、水)。對大象而言,這是美味的獎勵,如甘蔗或飯糰
    • 次級增強物 (Secondary Reinforcement): 本身沒有生物價值,但透過與初級增強物的聯結而習得(例如金錢、讚美或響片聲)。在本研究中,使用了言語讚美以及哨子/響片
  2. 塑造 (Shaping): 這是獎勵期望行為的漸進式接近 (successive approximations) 的過程。你會獎勵那些越來越接近最終複雜行為的小步驟。
    比喻:教導狗翻滾。首先,獎勵趴下。然後,獎勵趴下且稍微轉身。最後,獎勵完整的翻滾。
  3. 行為連鎖 (Behavioural Chaining): 將幾個已經學會的小行為,按特定順序連結起來,形成一個複雜的程序。大象必須學會執行「洗鼻」任務的一系列動作順序。

快速回顧: Fagen 等人利用正向後果(零食/讚美)逐步教導大象一套複雜的多步驟程序,取代了舊有的負面訓練方法。

第二部分:核心研究:Fagen, Acharya & Kaufman (2014)

2.1 研究背景

傳統上,像在尼泊爾這樣的地方,工作大象通常是使用厭惡性方法 (aversive methods)(懲罰或負增強)進行訓練。這些方法可能會導致動物產生壓力和攻擊性。
研究中具體探討的行為——洗鼻 (trunk wash)——是預防感染所必需的獸醫護理,但若以激進方式訓練,大象往往會抗拒。Fagen 等人致力於尋找一種人道且有效的替代方案。

2.2 研究目的

主要目的是研究使用正向增強訓練 (Positive Reinforcement Training, PRT) 來教導工作大象執行一項特定的、複雜的獸醫行為(洗鼻),以改善牠們的圈養管理與福利。

2.3 程序與方法學

研究方法:

本研究主要使用結構化的觀察法 (observation) 來衡量大象的進展,但它是以培訓介入計畫的形式進行的。

樣本:

八頭位於尼泊爾的工作亞洲象 (Asian elephants)(包含公象與母象)。這是一個相對較小且特殊的動物樣本。

程序中的關鍵特徵:

該程序主要依賴於使用初級和次級增強物的塑造 (shaping)行為連鎖 (behavioural chaining)

逐步訓練過程(使用塑造法):

  1. 目標: 教導大象忍受洗鼻過程(一項必要的獸醫程序)。
  2. 初始階段(標誌訓練 Target Training): 大象僅因將鼻子放在指定的「標誌」(一塊橡膠墊)上就獲得獎勵(零食/讚美)。這為後續行為奠定了基礎。
  3. 漸進式接近: 訓練師逐步提高要求。只有當大象達到以下要求時才會給予獎勵:
    • 在標誌上停留更長時間。
    • 在標誌上時,允許訓練師觸摸鼻子。
    • 允許在鼻子附近澆少量的水。
  4. 最終行為: 大象將鼻子放在標誌上,忍受完整的沖洗過程,並保持姿勢直到訓練師示意結束。這一連串的動作就是行為連鎖
數據收集(測量指標):

研究人員使用行為檢核表 (behavioural checklist) 來客觀地衡量成功與否。

  • 量化數據: 測量指標包括準確度 (accuracy)(大象是否正確執行任務?)和潛伏期 (latency)(大象在指令發出後需要多久才開始執行行為?)。
  • 質性數據(福利): 觀察內容包括關於大象生理狀態的記錄(例如:掙扎、壓力跡象),這顯示了牠們福利的改善。

記憶小幫手: Fagen 使用 PRT(正向增強訓練)來清洗大象鼻子 (Wash the Trunk)。

第三部分:結果、發現與結論

3.1 關鍵結果(量化發現)

  • 大象學習複雜的洗鼻行為的速度非常快
  • 在訓練完成後,大象在執行任務時表現出持續且高水平的準確度(通常超過 90%)。
  • 平均潛伏期(開始行為所需的時間)在訓練期間顯著減少,顯示大象能快速且可靠地回應指令。
  • 即使在沒有立即給予初級增強物(食物)的情況下,僅使用次級增強物(哨子/讚美),成功率依然很高。這證明了次級增強訓練非常成功。

3.2 主要結論

Fagen 等人得出結論,正向增強訓練是一種有效且非厭惡性的方法,可用於教導工作大象執行獸醫程序等複雜行為。此外,這種方法透過以合作、正向的互動取代嚴厲的傳統方法,改善了大象的福利

第四部分:評估與辯論

4.1 優點與缺點

優點:
  • 對日常生活的高度應用: 研究結果對於在全球(動物園、保育區、工作動物)改善圈養動物的管理與福利具有即時的實踐價值。
  • 高生態效度: 本研究是在尼泊爾大象自然的工作環境中進行,而非無菌實驗室,這使得結果能高度代表現實生活中的行為。
  • 客觀測量: 使用結構化的行為檢核表來記錄準確度和潛伏期,意味著收集的數據是客觀的,並降低了主觀解釋的風險。
缺點:
  • 低可推論性 (Generalisability): 樣本量較小(8 頭大象)且性質特定(尼泊爾的工作亞洲象)。結果可能無法推論到非洲象或處於不同圈養環境(如歐洲動物園)的大象身上。
  • 觀察者偏差 (Observer Bias) 的可能性: 訓練師/研究人員參與了訓練,他們與動物之間的密切關係可能會使他們在潛意識中對行為的解讀更正面(儘管結構化檢核表有助於減輕此影響)。

4.2 議題與辯論

動物在心理學研究中的使用

這項研究在動物研究倫理方面得分很高,因為其主要目的是將傷害減至最低,並將效益達到最大

  • 減輕傷害: 研究積極地用溫和的正向增強法取代了潛在有害的負面訓練技術,改善了大象的生活質量。
  • 程序: 沒有造成任何痛苦或折磨;全程使用獎勵機制。
  • 居住/物種: 研究在該大象固有的工作環境中進行,且方法論是專門針對大象的智慧和社會性而量身定制的。
先天與後天 (Nature Versus Nurture)

本研究強烈支持辯論中後天 (Nurture) 的觀點。研究表明,複雜行為(如忍受洗鼻)是透過環境互動和系統性訓練(操作制約)而習得的,而非純粹天生(先天)的。

個體與情境解釋

本研究強調了情境解釋 (Situational Explanation)。大象的行為(學習洗鼻)是由外部環境解釋的——具體而言,是增強物的系統性應用和細心的訓練結構。然而,觀察到的個體學習速度差異也顯示了個體因素(如個性或先前的學習經驗)的某些影響。

核心總結: Fagen 等人證明了「善良是有用的」!正向增強是動物管理的有力工具,證明了即使在大型圈養動物身上,複雜的學習過程也能可靠地發生。