史丹佛 Smallville 虛擬小鎮 Part.2 初始條件定義
筆記第二部分對應「Generative Agents: Interactive Simulacra of Human Behavior」中的 GENERATIVE AGENT BEHAVIOR AND INTERACTION,會簡單介紹關於實驗的初始設定,包含 Agent 的個人檔案、互動模式、定義「一天」,以及實驗中最重要的結果:Emergent Social Behaviors。
論文中有提到關於整個沙盒如何設計,但由於和Multi-Agent設計無關,在這邊不細講。
初始設定
-
Agent
實驗團隊建立 25 位獨特的 Agent,其核心設定包含:
- 視覺呈現:由簡單的像素頭像代表。
- 種子記憶 (Seed Memories):
- 開發者為每位 Agent 撰寫一段自然語言描述。
- 內容涵蓋:職業、家庭關係、社交圈與性格特徵。
- 初始化方式:系統將描述中以分號分隔的短句轉化為 Agent 的「初始記憶」。
下面是其中一位John Lin的設定:
John Lin is a pharmacy shopkeeper at the Willow Market and Pharmacy who loves to help people. He is always looking for ways to make the process of getting medication easier for his customers; John Lin is living with his wife, Mei Lin, who is a college professor, and son, Eddy Lin, who is a student studying music theory; John Lin loves his family very much; John Lin has known the old couple next-door, Sam Moore and Jennifer Moore, for a few years; John Lin thinks Sam Moore is a kind and nice man; John Lin knows his neighbor, Yuriko Yamamoto, well; John Lin knows of his neighbors, Tamara Taylor and Carmen Ortiz, but has not met them before; John Lin and Tom Moreno are colleagues at The Willows Market and Pharmacy; John Lin and Tom Moreno are friends and like to discuss local politics together; John Lin knows the Moreno family somewhat well — the husband Tom Moreno and the wife Jane Moreno. - Communication & Action
- 在每個 time step,Agent 會輸出一段描述當前動作的自然語言,動作會被轉化為沙盒世界中的實際位移,動作為變成頭頂的 emoji,方便觀察
- Agent 間可以用自然語言溝通,主要根據在沙盒世界中的地理位置,判斷擦肩而過或是開啟對話。
- User Controls 用戶可以透過兩種身份與 Agent 進行交互:
| 交互身份 | 控制方式 | 效果與案例 |
|---|---|---|
| 外部角色 | 用戶指定一個身份(如:記者)。 | Agent以社會關係回覆(如:告知記者投票意向)。 |
| 內在聲音 | 用戶扮演 Agent 的「內在聲音」(Inner Voice)。 | Agent 會將其視為強制性指令(如:決定參選)。 |
所謂「一天」
- 行為生成核心邏輯
- 初始驅動:由自然語言描述作為基礎(Seed Memory)。
- 動態演化:隨著沙盒時間推進,Agent 透過互動、建立記憶與協調活動,使其行為不斷演化。
- 舉例:John Lin 一家的晨間時間線 (7:00 AM - 9:00 AM)
| 時間 | 角色 | 行為內容 |
|---|---|---|
| 07:00 | John Lin | 起床、刷牙、沖澡、穿衣、吃早餐、在客廳餐桌看報紙。 |
| 08:00 | Eddy Lin | 起床並趕著準備上課,與即將出門的 John 進行簡短交流。 |
| 隨後 | Mei Lin | 起床後與 John 會合,詢問兒子 Eddy 的近況。 |
| 09:00 | 各自活動 | John:開啟藥局櫃檯;Mei:進行教學與研究。 |
-
社交與記憶傳遞分析 透過 John 與家人間的對話,展示了 Agent 的記憶與語境理解能力:
#### 場景一:父子對話(資訊產生)
- 內容:Eddy 告訴 John 他正在為課程創作一段音樂,雖然這週截止但過程很有趣。
- 關鍵點:這是新記憶的生成點。
#### 場景二:夫妻對話(記憶檢索與傳遞)
- 內容:當 Mei 詢問 Eddy 是否已去學校時,John 能夠準確回憶並轉述先前的對話。
- 對話回溯:
**John**: 「是的,他剛走。他正在為課堂寫一段音樂作品。」 **John**: 「我想他真的很喜歡這件事,他說很有趣。」 - 關鍵點:展現了 Agent 不僅能儲存事實,還能根據先前的社交內容進行跨角色資訊傳遞。
-
核心機制總結
- 行為自主性:Agent 根據預設身分自主安排盥洗、用餐與工作的先後順序。
- 社交協調:Agent 能察覺環境中的其他成員並啟動對話。
- 記憶連貫性:Agent 能將與 A Agent 的對話內容,在隨後與 B Agent 的互動中進行檢索與應用,形成了真實的社會網路互動。
Emergent Social Behaviors
Agent 透過交換資訊、建立關係與協調活動,展現出超越單一指令的複雜社會動態。其核心包含三大面向:
-
Information Diffusion
資訊會像現實世界一樣,透過對話在 Agent 之間流動與傳播。
- 機制:當 Agent 遇見彼此並開啟對話時,會分享彼此的近況或聽到的消息。
- 案例:市長選舉
- 初始源頭:Sam 告訴 Tom 他要參選鎮長。
- 二次傳播:Tom 隨後與 John 討論 Sam 的勝選機率(此時 John 也已從其他管道聽說此消息)。
- 社會影響:最終「參選」的消息傳遍小鎮,形成支持與猶豫的不同輿論群體。
-
Relationship Memory
Agent 不僅能認識新朋友,還能記錄並回憶過去互動的細節。
- 機制:系統會儲存初次見面的情境與對話內容,並在未來的互動中檢索這些記憶。
- 案例:攝影專案
- 初次見面:Sam 在公園偶遇陌生人 Latoya,Latoya 提到正在做攝影專案。
- 後續互動:下次見面時,Sam 能主動詢問:「嘿 Latoya,妳的攝影專案進展得如何?」展現了長期的關係連結。
-
Coordination
Agent 能夠共同規劃並執行複雜的群體活動。
- 核心特性:用戶僅需設定一個初始意圖 (Seed Intent),其餘細節由 Agent 架構自主完成。
- 案例:情人節派對
| 階段 | 參與者與行為 |
|---|---|
| 初始設定 | 用戶設定 Isabella 想辦派對,且 Maria 暗戀 Klaus。 |
| 宣傳與邀約 | Isabella 在咖啡館或路路上遇到朋友時,主動發出邀請。 |
| 分工合作 | Isabella 佈置場地;Maria 主動幫忙佈置。 |
| 社交鏈動 | Maria 藉機邀請暗戀對象 Klaus 參加派對。 |
| 最終成果 | 2月14日當天,5 位 Agent 準時出現在咖啡館享受聚會。 |
-
核心結論:湧現性 (Emergence)
這段落強調了 Generative Agent 架構的強大之處:用戶干預極小化,社會行為極大化。
- 低度人工干預:用戶不需要手動編寫「宣傳、佈置、邀約、赴約」等繁瑣指令。
- 自主社會化:Agent 會根據其架構(記憶 $\rightarrow$ 規劃 $\rightarrow$ 反思)自主決定散播消息、尋求幫助、甚至約出暗戀對象。
留言
Loading comments...