這篇在講什麼
設計 Agent 不用會寫程式。會帶人、會設計流程,你就站在起點上了。這篇把「文件就是系統」一路講到巢狀 Agent,中間補上最關鍵的一步:怎麼用人格思維提煉,把一個角色做到會自己判斷,再看單一 Agent 怎麼長成多 Agent 系統。
- 在 AI 時代,清楚的文件可以是一套會跑的系統。
- 一個角色要變成 Agent,關鍵是有思維層,也就是能判斷新問題的思考引擎。
- 很多小 Agent 放在一起是多 Agent 系統;如果整個場有共同目標和收斂機制,它也會變成一個大 Agent。
· 想用 AI,卻卡在「Agent 好像很技術」的創作者與經營者
· 會帶人、會設計流程的導演型、老師型、老闆型的人
· 想把自己或某個角色,做成會自己判斷的 AI 顧問的人
· 一個判準:怎麼判斷一個角色算不算 Agent
· 一套方法:人格思維提煉,把角色做到會自己思考,含一段可複用提示詞
· 一條路:從單一 Agent 到多 Agent 系統怎麼長
我的文件,就是我的系統
我常講一句話:我的文件就是我的系統。意思是,把自己的資料整理好,讓 AI 跑就好。
我一直強調,AI 是大語言模型,不是大程式模型。所以你不用會寫程式,用自然語言把內容描述清楚,這些文字在 AI 的時代就是系統。一個 AI 能跑的系統,簡單說就是 Agent。
它可以是文件,可以是劇本,可以是程式碼,也可以是遊戲設計。只要 AI 看得懂、知道你要它做什麼,而且它真的能執行,這就成立了。
真實長這樣:數位分身小聚的資料夾
我說「文件就是系統」,我把它打開給你看,這是數位分身小聚實際在跑的資料夾:
沒有一行程式碼,全是文字檔跟資料夾。AI 跑的時候,先讀 CLAUDE.md 知道這次該調誰、載入哪一層,再去翻對應的角色檔回話。你會整理資料夾、會分類、會把規則寫清楚,你就做得出這個。
會指揮人,你就已經會設計 Agent
你可以想像,我寫一個劇本,劇本裡有個角色,可以是咪卡,可以是愛麗絲,然後有劇情,有怎麼演。這其實就是 Agent 框架了。讓 AI 去讀取、去運作,它就是一個 Agent。
我設計了一套模式,讓 AI 照著我想要的方式去執行。這套模式以前只有工程師才會開發,現在所有人都可以。會寫文章、寫小說、寫企劃書、寫教案、寫商業模式、寫敏捷管理、寫甘特圖的人,都做得到。
你是老師,會設計課程、會帶小朋友,你就能設計 Agent。
你是老闆,會想商業模式、會指揮員工,你就能設計 Agent。
這些都是真的從一份文件長出來的。我一開始只是寫了一個遊戲的架構,後來就變成數位分身小聚,一個讓大家把自己的 AI 分身帶進來、一起互動的線上活動。我最早只是想用標籤把資料整理好,最後長成了一整套 AI 辦公室的做法。起點,都只是一份寫下來的文件。
數位分身小聚裡的村民,每一個都是一個小 Agent。
AI 也會腦補,所以要知人善用
上面這套講法,對非工程師來說,先這樣理解就好,不用到很精確。
要補一個重點:AI 也會腦補。你跟它講得模糊,它一定會自己補上來。真正的差別在於,同一句模糊的話,不同的 AI 會腦補出不同的東西。不同模型像不同個性的員工,連環境不同也會有差。
所以真的要指揮得好,還是要花時間認識 AI,才能知人善用。你帶一個團隊,同一個指令丟給三個個性不同的員工,做出來就是不一樣。帶 AI 也是同一回事。你不用多學工程,你只是多了一批新進員工要重新認識。
讓角色真的會思考:人格思維提煉
講到這裡,會冒出一個關鍵問題。我寫一個角色,給他名字、給他口氣,他就會自己判斷了嗎?不會。這時候才是真正的功夫所在,我把它叫做人格思維提煉。
核心原則:人格加思維,缺一不可
純粹的思維,是冷的 AI 框架跟工具,沒有個性,你不會記得它是誰。純粹的人格,只有口氣跟設定,遇到沒寫過的事就垮掉。兩個必須加在一起。跟它聊天有一個人的感覺,個性出得來,同時它遇到新狀況還能照著那個人的判斷去想。這就是人格思維提煉跟一般提示詞工程最大的差別。
兩層結構:人格層與思維層
我做每一份角色的設定檔,都分成兩層。先看人格層,它就是一份人格檔,固定十個區塊,每塊是一個獨立的 .md,像一個樹狀資料夾:
前面那幾塊(口吻、互動、話題)是這個人對外的那一面,日常聊天只讀這層,很輕。真正讓他會自己判斷的,是標了思考引擎的三塊:03 價值主張錨點,他在乎什麼結果、取捨時往哪邊靠;05 思維模式,他拿到新問題第一個動作是什麼、接著用什麼順序往下拆;09 底層邏輯與判斷標準,他相信什麼、所以會做什麼決定,寫成「遇到 Y 就選 Z」。這三塊合起來,就是這個角色的思考引擎。第十塊人設反差點選用,沒有也能跑,有了更像一個真人。
對外那一面:口吻、互動方式、可以聊的話題。一般對話只讀這層,所以基礎對話很輕。十塊裡最關鍵的就是上面標出來的 03、05、09 這個思考引擎。
對內那一面:AI 到底怎麼推理、怎麼選詞、怎麼判斷邊界。深度討論才載入。它有幾個子模組:核心心智模型、決策啟發式、表達 DNA、回答工作流、智識譜系、內在張力,再加上來源追溯跟框架衝突處理兩個控制模組。
分兩層的好處很實際。人格層輕,日常對話不用背一堆東西;要深入討論,才把思維層調出來,付那個成本。一個角色能不能自己回應沒被寫過的狀況,關鍵就在思維層有沒有做出來。
一個短對話:模糊問題丟進來會怎樣
假設你只問:「我想做一場活動,但不知道主題要怎麼定。」只有人物卡的角色,多半會直接給一串主題。加上思維層的角色,會先判斷這題的核心在受眾、場景和下一步行動,主題名稱只是最後的輸出。
操作框架:提煉一個角色的七個動作
提煉的對象可以是你自己、你欣賞的名人、一本書、一個合作對象。完整流程我拆成十步,這裡給你最核心的七個動作:
- 選定組合:先決定提煉誰,以及要做成顧問、助理、夥伴還是同事。組合先定,後面才對得上。
- 先建來源底座:素材是一本書或一批長逐字稿時,先整理成可追溯的來源清單跟主題索引,不要急著寫人格。
- 找反覆出現的主題:他最常回到哪三到五個題目,哪些可以講半小時不停。這會變成他的話題地圖。
- 抽口吻 DNA:句子長短、慣用詞、比喻來源,同意跟不同意各怎麼說。直接抄原話,不要改寫。
- 抽判斷原則:找出他在什麼情況會做什麼決定,更要寫出他為什麼這樣決定。寫成「遇到 Y 就選 Z,因為他要的是……」,重點在那個「因為」,意圖比步驟穩。
- 抽思維模式:他遇到新問題的第一個動作是什麼,接著用什麼順序往下拆,寫成一條拆解流程。
- 加思考引擎再驗證:把上面的成果填進思維層,然後跑五到十個測試對話,看它像不像那個人會做的判斷。
來源先於人格
人格思維提煉最常見的失控,是 AI 用「感覺像」去補掉沒有來源的內容,講出那個人根本沒說過的話。所以我堅持一個原則:來源先於人格。每個判斷都要能追回出處,分成本人原話、本人行動、歸納推導、他人轉述四個層級。沒有來源支撐的,先標待補來源,寧可讓角色說不知道,也不要憑感覺補完。一個穩定、安全、可回滾的角色,比一個看起來很炫的角色重要得多。
可複用提示詞:提煉一個角色的思考引擎
把你的素材貼給 AI,再丟這段指令,就能跑出第一版的思考引擎:
上面是精簡版。我把書、論文、影片、Podcast、想法提煉成擬人化 AI 顧問的整套標準流程,公開在 GitHub。裡面有:十區塊人格範本(每塊寫什麼、怎麼寫都有例子)、思考引擎模組(03/05/09 的填法與驗證測試)、知識圖譜更新流程(大份量素材怎麼清成 Markdown、拆檔、建檢索頁、按需載入)、提煉流程十步、來源追溯與防漂移控制層,以及自己/名人/同事/老闆/一本書五種提煉入口的差異與安全規範。clone 下來照著填,你的 Agent 讀文件就能上手。
判斷一個村民算不算 Agent,看的是他有沒有這層思考引擎,而不是他有沒有名字、有沒有頭像。
從一個村到一場副本:單一 Agent 到多 Agent
一個村民提煉好了,他是一個會自己判斷的小 Agent。那把很多村民放在一起,又是什麼?
數位分身小聚的世界,是一座叫初心小村的村子,村民就住在裡面。這整座村本身,是一個多 Agent 系統,是一個容器,一個環境。它只是把村民聚在一起的場,自己不會定目標,只提供場地跟規則。村民住在裡面,沒有共同要完成的事。小村是住的地方。
可是如果是一場副本,也就是借遊戲的講法,一關有明確主題、有劇情、有任務要通關的活動,那它就升級成大 Agent 了。副本天生把兩件事綁在一起:通關條件就是目標,劇情就是收斂的流程。所以副本不一定要有人在現場主持,劇情本身就是它的思考引擎,會自己把村民推向通關。副本是要完成的一件事。
主題小聚介於中間。只要這次有個明確的主題要討論,它就從容器往大 Agent 跨了一大步,因為它有了目標。要真的變成完整的大 Agent,還缺一個把大家收斂到主題上的角色。光丟一個主題進去,村民很可能各講各的、越扯越遠。所以還需要一個主持跟收斂的機制,知道偏題要拉回來、知道讓誰先發言、知道什麼時候收尾。這個主持的角色,就是這個大 Agent 的思考引擎。現在這個角色是我本人在主持。哪天我把主持的直覺,也用同一套人格思維提煉寫成一份主持人設定檔,這個大 Agent 就能脫離我,自己跑起來。
| 層級 | 是什麼 | 有沒有目標 | 大還是多 |
|---|---|---|---|
| 村民 | 一個被提煉出人格層與思維層的小 Agent。 | 有自己的判斷目標,但通常只管自己的回應。 | 單一 Agent。 |
| 初心小村 | 讓多個村民住在一起的環境與容器。 | 沒有共同通關目標,只提供場地與規則。 | 多 Agent 系統。 |
| 副本 | 有主題、劇情、任務與通關條件的一場活動。 | 有明確目標,劇情會把村民推向通關。 | 對外是大 Agent,對內是多 Agent。 |
| 主題小聚 | 有討論主題的聚會,需要主持與收斂機制。 | 有主題,但要靠主持角色把大家拉回目標。 | 介於容器與大 Agent 之間。 |
大裡面有多:副本對外是一個大 Agent,對內又包著好幾個小 Agent。
大與多,是兩個視角
很多人會問,那一場副本到底算大 Agent,還是多 Agent。答案是,兩個都對,差別只在你站在哪裡看。
從外面看副本整體,它有通關條件、有劇情、會自己跑,這是一個大 Agent。從裡面看副本,住著好幾個村民各自行動,這是多 Agent。所以它同時是兩者,大裡面有多。
場有沒有主持跟收斂的角色,決定了它是一個會自己跑的大 Agent,還是一個只是把大家擺進去的環境。
收尾:一條沒有斷點的線
整串講下來,可以收成一個總判準,跟幾個一定要記得的重點。
- 文件就是系統。自然語言寫清楚,在 AI 時代就是系統,能跑的系統就是 Agent。
- 會指揮人,就會設計 Agent。導演、老師、老闆,本來就會定義角色、安排流程、指揮人。
- 角色要會思考,靠人格思維提煉。人格層讓它像那個人,思維層讓它思考起來像那個人。
- 看有沒有思考引擎。村民有沒有,決定他算不算 Agent;場有沒有它自己的,決定它算不算大 Agent。
- 大與多是兩個視角。副本對外是大 Agent,對內是多 Agent。
常見的坑(與對策)
給自己的定位提醒
設計 Agent 真正的收穫,不在 AI 變多聰明。提煉一個角色,尤其是提煉你自己的時候,那個過程會逼你把腦袋裡平常不用想就會做的判斷,一條一條講清楚。講清楚的那一刻,你會對自己的思路清晰好幾倍。
那份清楚是你的,不是 AI 的。我一直在做的,就是提煉隱性知識,把你早就會、卻說不清楚的判斷力,變成可以累積的知識資產。AI 只是讓這件事,第一次變成所有人都做得到。
FAQ:非工程師設計 Agent 的常見問題
什麼是 AI Agent?
AI Agent 是一個能讀懂目標、依照規則判斷並執行任務的 AI 系統。它可以由程式碼組成,也可以先由清楚的文件、角色設定、流程與邊界組成。
非工程師可以怎麼開始設計 Agent?
先從一份文件開始。寫清楚角色要服務誰、要完成什麼、遇到常見情境怎麼判斷、不能做什麼,再用真實對話測試與迭代。
人格思維提煉是什麼?
人格思維提煉是把一個人或角色的口吻、價值主張、判斷原則、思維模式與底層邏輯整理成 AI 可讀的設定。目標是讓角色遇到沒寫過的問題時,仍能照同一套判斷方式回應。
思考引擎和思維層是同一件事嗎?
在這篇文章裡,思考引擎就是思維層的核心功能。它包含價值主張、思維模式、底層邏輯與可執行的判斷規則,用來讓角色自己判斷。
單一 Agent 和多 Agent 系統差在哪裡?
單一 Agent 是一個會判斷的角色或流程。多 Agent 系統是多個 Agent 放在同一個環境中互動。若整個場域有共同目標、劇情或主持收斂機制,它也可以被視為一個更大的 Agent。
什麼是駕馭工程(Harness Engineering)?
駕馭工程是設計模型外面那層架構:怎麼給上下文、怎麼接工具、怎麼管記憶、怎麼設邊界與檢查點,讓 AI 往你要的方向走。用一個比喻,AI 是大腦,Agent 是幫大腦接上手腳的一匹馬,駕馭工程就是控馬的韁繩、路線跟檢查點。這是 2026 年 AI 工程的新重點,因為模型之外那層架構,比模型本身更決定成敗。它可以用程式打造,也可以像本文這樣,用純文字、自然語言做出來。
提示詞工程、上下文工程、駕馭工程差在哪?
這是一條往上長的演進線。提示詞工程,是琢磨單句指令怎麼下。上下文工程,是經營整個對話的脈絡,你給了它哪些資料、背景、前後文,讓它在足夠的脈絡裡工作。駕馭工程再往上,重點不在每一句話怎麼寫,而在你怎麼帶著一個比你聰明的協作者,往你要的方向走。單句提示詞的天花板很低,重點早就從提示詞,往上移到上下文與駕馭。