史丹佛 Smallville 虛擬小鎮 Part.2 初始條件定義

筆記第二部分對應「Generative Agents: Interactive Simulacra of Human Behavior」中的 GENERATIVE AGENT BEHAVIOR AND INTERACTION,會簡單介紹關於實驗的初始設定,包含 Agent 的個人檔案、互動模式、定義「一天」,以及實驗中最重要的結果:Emergent Social Behaviors。

論文中有提到關於整個沙盒如何設計,但由於和Multi-Agent設計無關,在這邊不細講。

初始設定

  • Agent

    實驗團隊建立 25 位獨特的 Agent,其核心設定包含:

    • 視覺呈現:由簡單的像素頭像代表。
    • 種子記憶 (Seed Memories)
      • 開發者為每位 Agent 撰寫一段自然語言描述。
      • 內容涵蓋:職業、家庭關係、社交圈與性格特徵
      • 初始化方式:系統將描述中以分號分隔的短句轉化為 Agent 的「初始記憶」。

    下面是其中一位John Lin的設定:

    John Lin is a pharmacy shopkeeper at the Willow Market and Pharmacy who loves to help people. He is always looking for ways to make the process of getting medication easier for his customers; John Lin is living with his wife, Mei Lin, who is a college professor, and son, Eddy Lin, who is a student studying music theory; John Lin loves his family very much; John Lin has known the old couple next-door, Sam Moore and Jennifer Moore, for a few years; John Lin thinks Sam Moore is a kind and nice man; John Lin knows his neighbor, Yuriko Yamamoto, well; John Lin knows of his neighbors, Tamara Taylor and Carmen Ortiz, but has not met them before; John Lin and Tom Moreno are colleagues at The Willows Market and Pharmacy; John Lin and Tom Moreno are friends and like to discuss local politics together; John Lin knows
    the Moreno family somewhat well — the husband Tom Moreno and the wife Jane Moreno.
    
  • Communication & Action
    • 在每個 time step,Agent 會輸出一段描述當前動作的自然語言,動作會被轉化為沙盒世界中的實際位移,動作為變成頭頂的 emoji,方便觀察
    • Agent 間可以用自然語言溝通,主要根據在沙盒世界中的地理位置,判斷擦肩而過或是開啟對話。
  • User Controls 用戶可以透過兩種身份與 Agent 進行交互:
交互身份 控制方式 效果與案例
外部角色 用戶指定一個身份(如:記者)。 Agent以社會關係回覆(如:告知記者投票意向)。
內在聲音 用戶扮演 Agent 的「內在聲音」(Inner Voice)。 Agent 會將其視為強制性指令(如:決定參選)。

所謂「一天」

  • 行為生成核心邏輯
    • 初始驅動:由自然語言描述作為基礎(Seed Memory)。
    • 動態演化:隨著沙盒時間推進,Agent 透過互動、建立記憶與協調活動,使其行為不斷演化。
  • 舉例:John Lin 一家的晨間時間線 (7:00 AM - 9:00 AM)
時間 角色 行為內容
07:00 John Lin 起床、刷牙、沖澡、穿衣、吃早餐、在客廳餐桌看報紙。
08:00 Eddy Lin 起床並趕著準備上課,與即將出門的 John 進行簡短交流。
隨後 Mei Lin 起床後與 John 會合,詢問兒子 Eddy 的近況。
09:00 各自活動 John:開啟藥局櫃檯;Mei:進行教學與研究。
  • 社交與記憶傳遞分析 透過 John 與家人間的對話,展示了 Agent 的記憶與語境理解能力

    #### 場景一:父子對話(資訊產生)

    • 內容:Eddy 告訴 John 他正在為課程創作一段音樂,雖然這週截止但過程很有趣。
    • 關鍵點:這是新記憶的生成點。

    #### 場景二:夫妻對話(記憶檢索與傳遞)

    • 內容:當 Mei 詢問 Eddy 是否已去學校時,John 能夠準確回憶並轉述先前的對話。
    • 對話回溯
      **John**: 「是的,他剛走。他正在為課堂寫一段音樂作品。」
      **John**: 「我想他真的很喜歡這件事,他說很有趣。」
      
    • 關鍵點:展現了 Agent 不僅能儲存事實,還能根據先前的社交內容進行跨角色資訊傳遞
  • 核心機制總結

    1. 行為自主性:Agent 根據預設身分自主安排盥洗、用餐與工作的先後順序。
    2. 社交協調:Agent 能察覺環境中的其他成員並啟動對話。
    3. 記憶連貫性:Agent 能將與 A Agent 的對話內容,在隨後與 B Agent 的互動中進行檢索與應用,形成了真實的社會網路互動。

Emergent Social Behaviors

Agent 透過交換資訊、建立關係與協調活動,展現出超越單一指令的複雜社會動態。其核心包含三大面向:

  1. Information Diffusion

    資訊會像現實世界一樣,透過對話在 Agent 之間流動與傳播。

    • 機制:當 Agent 遇見彼此並開啟對話時,會分享彼此的近況或聽到的消息。
    • 案例:市長選舉
      1. 初始源頭:Sam 告訴 Tom 他要參選鎮長。
      2. 二次傳播:Tom 隨後與 John 討論 Sam 的勝選機率(此時 John 也已從其他管道聽說此消息)。
      3. 社會影響:最終「參選」的消息傳遍小鎮,形成支持與猶豫的不同輿論群體。
  2. Relationship Memory

    Agent 不僅能認識新朋友,還能記錄並回憶過去互動的細節。

    • 機制:系統會儲存初次見面的情境與對話內容,並在未來的互動中檢索這些記憶。
    • 案例:攝影專案
      • 初次見面:Sam 在公園偶遇陌生人 Latoya,Latoya 提到正在做攝影專案。
      • 後續互動:下次見面時,Sam 能主動詢問:「嘿 Latoya,妳的攝影專案進展得如何?」展現了長期的關係連結。
  3. Coordination

    Agent 能夠共同規劃並執行複雜的群體活動。

    • 核心特性:用戶僅需設定一個初始意圖 (Seed Intent),其餘細節由 Agent 架構自主完成。
    • 案例:情人節派對
階段 參與者與行為
初始設定 用戶設定 Isabella 想辦派對,且 Maria 暗戀 Klaus。
宣傳與邀約 Isabella 在咖啡館或路路上遇到朋友時,主動發出邀請。
分工合作 Isabella 佈置場地;Maria 主動幫忙佈置。
社交鏈動 Maria 藉機邀請暗戀對象 Klaus 參加派對。
最終成果 2月14日當天,5 位 Agent 準時出現在咖啡館享受聚會。
  • 核心結論:湧現性 (Emergence)

    這段落強調了 Generative Agent 架構的強大之處:用戶干預極小化,社會行為極大化

    • 低度人工干預:用戶不需要手動編寫「宣傳、佈置、邀約、赴約」等繁瑣指令。
    • 自主社會化:Agent 會根據其架構(記憶 $\rightarrow$ 規劃 $\rightarrow$ 反思)自主決定散播消息、尋求幫助、甚至約出暗戀對象。

留言

Loading comments...