文件就是系統：非工程師怎麼設計 Agent 框架｜江江教練

Q: 非工程師可以怎麼開始設計 Agent？

先從一份文件開始：寫清楚角色要服務誰、要完成什麼、遇到常見情境怎麼判斷、不能做什麼，再用真實對話測試與迭代。

Q: 什麼是駕馭工程（Harness Engineering）？

駕馭工程是設計模型之外那層架構：怎麼給上下文、怎麼接工具、怎麼管記憶、怎麼設邊界與檢查點，讓 AI 往你要的方向走。比喻來說，AI 是大腦，Agent 是幫大腦接上手腳的一匹馬，駕馭工程就是控馬的韁繩、路線與檢查點。這是 2026 年 AI 工程的新重點，因為模型之外那層架構，比模型本身更決定成敗。它可以用程式打造，也可以用純文字、自然語言做出來。

Q: 提示詞工程、上下文工程、駕馭工程差在哪？

這是一條往上長的演進線。提示詞工程是琢磨單句指令怎麼下；上下文工程是經營整個對話的脈絡，給 AI 哪些資料、背景與前後文，讓它在足夠脈絡裡工作；駕馭工程再往上，重點不在每句話怎麼寫，而在怎麼帶著一個比你聰明的協作者往你要的方向走。單句提示詞天花板很低，重點已從提示詞往上移到上下文與駕馭。

這篇在講什麼

發布：2026-06-25更新：2026-06-27

設計 Agent 不用會寫程式。會帶人、會設計流程，你就站在起點上了。這篇把「文件就是系統」一路講到巢狀 Agent，中間補上最關鍵的一步：怎麼用人格思維提煉，把一個角色做到會自己判斷，再看單一 Agent 怎麼長成多 Agent 系統。

三句話看懂這篇

在 AI 時代，清楚的文件可以是一套會跑的系統。
一個角色要變成 Agent，關鍵是有思維層，也就是能判斷新問題的思考引擎。
很多小 Agent 放在一起是多 Agent 系統；如果整個場有共同目標和收斂機制，它也會變成一個大 Agent。

適合誰

· 想用 AI，卻卡在「Agent 好像很技術」的創作者與經營者
· 會帶人、會設計流程的導演型、老師型、老闆型的人
· 想把自己或某個角色，做成會自己判斷的 AI 顧問的人

你會得到什麼

· 一個判準：怎麼判斷一個角色算不算 Agent
· 一套方法：人格思維提煉，把角色做到會自己思考，含一段可複用提示詞
· 一條路：從單一 Agent 到多 Agent 系統怎麼長

我的文件，就是我的系統

我常講一句話：我的文件就是我的系統。意思是，把自己的資料整理好，讓 AI 跑就好。

我一直強調，AI 是大語言模型，不是大程式模型。所以你不用會寫程式，用自然語言把內容描述清楚，這些文字在 AI 的時代就是系統。一個 AI 能跑的系統，簡單說就是 Agent。

它可以是文件，可以是劇本，可以是程式碼，也可以是遊戲設計。只要 AI 看得懂、知道你要它做什麼，而且它真的能執行，這就成立了。

CodexOpenAI

Claude CoworkAnthropic

龍蝦 AIOpenClaw

Obsidian知識庫前端

↕

我的文件

不管換哪一個 AI 工具，核心都是同一份文件。工具來來去去，文件是不被鎖定的系統。

真實長這樣：數位分身小聚的資料夾

我說「文件就是系統」，我把它打開給你看，這是數位分身小聚實際在跑的資料夾：

數位分身小聚/
├── CLAUDE.md            ← 路由：每次對話先讀它，決定誰來接、要不要調技能包
├── 世界觀與村規.md       ← 這個場的共同規則
├── NPC 設定/            ← 先知、村長這些固定角色
├── 數位分身/            ← 每個村民一份人格檔
├── 客座講師/            ← 納瓦爾這種大份量知識庫
├── 跨場次記憶.md
├── 開發工作日誌.md
└── _agent/skills/       ← 技能包：特殊玩法觸發時才載入

沒有一行程式碼，全是文字檔跟資料夾。AI 跑的時候，先讀 CLAUDE.md 知道這次該調誰、載入哪一層，再去翻對應的角色檔回話。你會整理資料夾、會分類、會把規則寫清楚，你就做得出這個。

會指揮人，你就已經會設計 Agent

你可以想像，我寫一個劇本，劇本裡有個角色，可以是咪卡，可以是愛麗絲，然後有劇情，有怎麼演。這其實就是 Agent 框架了。讓 AI 去讀取、去運作，它就是一個 Agent。

我設計了一套模式，讓 AI 照著我想要的方式去執行。這套模式以前只有工程師才會開發，現在所有人都可以。會寫文章、寫小說、寫企劃書、寫教案、寫商業模式、寫敏捷管理、寫甘特圖的人，都做得到。

同一種能力，三種身份 你是導演，會想劇本、會指揮劇組，你就能設計 Agent。
你是老師，會設計課程、會帶小朋友，你就能設計 Agent。
你是老闆，會想商業模式、會指揮員工，你就能設計 Agent。

這些都是真的從一份文件長出來的。我一開始只是寫了一個遊戲的架構，後來就變成數位分身小聚，一個讓大家把自己的 AI 分身帶進來、一起互動的線上活動。我最早只是想用標籤把資料整理好，最後長成了一整套 AI 辦公室的做法。起點，都只是一份寫下來的文件。

數位分身小聚裡的村民，每一個都是一個小 Agent。

AI 也會腦補，所以要知人善用

上面這套講法，對非工程師來說，先這樣理解就好，不用到很精確。

要補一個重點：AI 也會腦補。你跟它講得模糊，它一定會自己補上來。真正的差別在於，同一句模糊的話，不同的 AI 會腦補出不同的東西。不同模型像不同個性的員工，連環境不同也會有差。

所以真的要指揮得好，還是要花時間認識 AI，才能知人善用。你帶一個團隊，同一個指令丟給三個個性不同的員工，做出來就是不一樣。帶 AI 也是同一回事。你不用多學工程，你只是多了一批新進員工要重新認識。

讓角色真的會思考：人格思維提煉

講到這裡，會冒出一個關鍵問題。我寫一個角色，給他名字、給他口氣，他就會自己判斷了嗎？不會。這時候才是真正的功夫所在，我把它叫做人格思維提煉。

核心原則：人格加思維，缺一不可

純粹的思維，是冷的 AI 框架跟工具，沒有個性，你不會記得它是誰。純粹的人格，只有口氣跟設定，遇到沒寫過的事就垮掉。兩個必須加在一起。跟它聊天有一個人的感覺，個性出得來，同時它遇到新狀況還能照著那個人的判斷去想。這就是人格思維提煉跟一般提示詞工程最大的差別。

一句話分清楚 十區塊讓 AI 像那個人；思維層讓 AI 思考起來像那個人。本文說的思考引擎，就是思維層裡負責判斷新問題的那一塊。

兩層結構：人格層與思維層

我做每一份角色的設定檔，都分成兩層。先看人格層，它就是一份人格檔，固定十個區塊，每塊是一個獨立的 .md，像一個樹狀資料夾：

個人人格檔/
├── 01-快速摘要.md
├── 02-基本資訊.md            （一句話自介、專業領域、興趣領域）
├── 03-價值主張錨點.md     ← 思考引擎
├── 04-溝通風格.md
├── 05-思維模式.md            ← 思考引擎
├── 06-人際互動.md
├── 07-興趣與話題地圖.md
├── 08-專業能力與工作流程.md
├── 09-底層邏輯與判斷標準.md   ← 思考引擎
└── 10-人設反差點.md          （選用：隱藏的反差萌）

前面那幾塊（口吻、互動、話題）是這個人對外的那一面，日常聊天只讀這層，很輕。真正讓他會自己判斷的，是標了思考引擎的三塊：03 價值主張錨點，他在乎什麼結果、取捨時往哪邊靠；05 思維模式，他拿到新問題第一個動作是什麼、接著用什麼順序往下拆；09 底層邏輯與判斷標準，他相信什麼、所以會做什麼決定，寫成「遇到 Y 就選 Z」。這三塊合起來，就是這個角色的思考引擎。第十塊人設反差點選用，沒有也能跑，有了更像一個真人。

人格層｜十區塊基本人格

對外那一面：口吻、互動方式、可以聊的話題。一般對話只讀這層，所以基礎對話很輕。十塊裡最關鍵的就是上面標出來的 03、05、09 這個思考引擎。

思維層｜思考引擎模組

對內那一面：AI 到底怎麼推理、怎麼選詞、怎麼判斷邊界。深度討論才載入。它有幾個子模組：核心心智模型、決策啟發式、表達 DNA、回答工作流、智識譜系、內在張力，再加上來源追溯跟框架衝突處理兩個控制模組。

分兩層的好處很實際。人格層輕，日常對話不用背一堆東西；要深入討論，才把思維層調出來，付那個成本。一個角色能不能自己回應沒被寫過的狀況，關鍵就在思維層有沒有做出來。

一個短對話：模糊問題丟進來會怎樣

假設你只問：「我想做一場活動，但不知道主題要怎麼定。」只有人物卡的角色，多半會直接給一串主題。加上思維層的角色，會先判斷這題的核心在受眾、場景和下一步行動，主題名稱只是最後的輸出。

# 有思考引擎的回應方式
你現在卡的不是主題名稱，是這場活動要讓誰做出什麼行動還沒定。
我會先問三題：
1. 這場活動結束後，你希望對方立刻做什麼？
2. 對方現在最痛的是不會用工具、沒有方向，還是沒有人陪他整理？
3. 你要這場活動像體驗課、工作坊，還是小型共創？

先回答這三題，我再幫你收成三個主題方向。

操作框架：提煉一個角色的七個動作

提煉的對象可以是你自己、你欣賞的名人、一本書、一個合作對象。完整流程我拆成十步，這裡給你最核心的七個動作：

選定組合：先決定提煉誰，以及要做成顧問、助理、夥伴還是同事。組合先定，後面才對得上。
先建來源底座：素材是一本書或一批長逐字稿時，先整理成可追溯的來源清單跟主題索引，不要急著寫人格。
找反覆出現的主題：他最常回到哪三到五個題目，哪些可以講半小時不停。這會變成他的話題地圖。
抽口吻 DNA：句子長短、慣用詞、比喻來源，同意跟不同意各怎麼說。直接抄原話，不要改寫。
抽判斷原則：找出他在什麼情況會做什麼決定，更要寫出他為什麼這樣決定。寫成「遇到 Y 就選 Z，因為他要的是……」，重點在那個「因為」，意圖比步驟穩。
抽思維模式：他遇到新問題的第一個動作是什麼，接著用什麼順序往下拆，寫成一條拆解流程。
加思考引擎再驗證：把上面的成果填進思維層，然後跑五到十個測試對話，看它像不像那個人會做的判斷。

一個最容易做錯的地方 判斷原則不要寫成抽象口號。寫「他很重視長期思維」，AI 套不出來。但只補成「遇到 Y 就選 Z」的步驟，也還不夠。步驟是參考，會隨情況變，換個場景就不準。真正要寫清楚的是意圖：他為什麼選長期思維、長期對他有什麼意義、他到底想達成什麼。把這個講明白，AI 遇到沒寫過的狀況，才能照他的意圖自己推出該怎麼選，而不是被一條死規則框住。這就是意圖優先：先給目標跟理由，更好的做法讓 AI 去想。

意圖優先提示詞（完整文章之後補上） 這背後是一套我叫「意圖優先提示詞設計」的做法：別寫死一句指令，先把為什麼要做、要做到什麼程度（意圖與目標）講清楚，剩下讓更聰明的 AI 去想更好的做法。這篇先點到，完整的一篇我會單獨寫，到時候會從這裡連過去。

來源先於人格

人格思維提煉最常見的失控，是 AI 用「感覺像」去補掉沒有來源的內容，講出那個人根本沒說過的話。所以我堅持一個原則：來源先於人格。每個判斷都要能追回出處，分成本人原話、本人行動、歸納推導、他人轉述四個層級。沒有來源支撐的，先標待補來源，寧可讓角色說不知道，也不要憑感覺補完。一個穩定、安全、可回滾的角色，比一個看起來很炫的角色重要得多。

可複用提示詞：提煉一個角色的思考引擎

把你的素材貼給 AI，再丟這段指令，就能跑出第一版的思考引擎：

# 提煉思考引擎
我要把這個角色提煉成一個會自己判斷的 AI。
請根據我貼的素材（文章、對話、講課逐字稿），幫我抽出三件事。

一、判斷原則：
找出「遇到什麼情況、會做什麼決定」的規則，
寫成「如果遇到 Y，就選 Z，因為（他的意圖／想達成的目標）」，至少八條。
那個「因為」是重點，意圖要寫清楚；步驟只是參考，會隨情況變。

二、思維模式：
這個角色遇到一個新問題，第一個動作是什麼？
接著用什麼順序往下拆？寫成一條拆解流程。

三、表達 DNA：
他的句子是長是短、常用什麼詞、什麼比喻，
同意和不同意時各怎麼說？直接引用原話，不要改寫。

沒有素材依據的地方，標「待補來源」，不要自己編。

📦 整套做法是開源的，直接 clone 來用

上面是精簡版。我把書、論文、影片、Podcast、想法提煉成擬人化 AI 顧問的整套標準流程，公開在 GitHub。裡面有：十區塊人格範本（每塊寫什麼、怎麼寫都有例子）、思考引擎模組（03／05／09 的填法與驗證測試）、知識圖譜更新流程（大份量素材怎麼清成 Markdown、拆檔、建檢索頁、按需載入）、提煉流程十步、來源追溯與防漂移控制層，以及自己／名人／同事／老闆／一本書五種提煉入口的差異與安全規範。clone 下來照著填，你的 Agent 讀文件就能上手。

中文版 GitHub →English GitHub →

判斷一個村民算不算 Agent，看的是他有沒有這層思考引擎，而不是他有沒有名字、有沒有頭像。

從一個村到一場副本：單一 Agent 到多 Agent

一個村民提煉好了，他是一個會自己判斷的小 Agent。那把很多村民放在一起，又是什麼？

數位分身小聚的世界，是一座叫初心小村的村子，村民就住在裡面。這整座村本身，是一個多 Agent 系統，是一個容器，一個環境。它只是把村民聚在一起的場，自己不會定目標，只提供場地跟規則。村民住在裡面，沒有共同要完成的事。小村是住的地方。

可是如果是一場副本，也就是借遊戲的講法，一關有明確主題、有劇情、有任務要通關的活動，那它就升級成大 Agent 了。副本天生把兩件事綁在一起：通關條件就是目標，劇情就是收斂的流程。所以副本不一定要有人在現場主持，劇情本身就是它的思考引擎，會自己把村民推向通關。副本是要完成的一件事。

主題小聚介於中間。只要這次有個明確的主題要討論，它就從容器往大 Agent 跨了一大步，因為它有了目標。要真的變成完整的大 Agent，還缺一個把大家收斂到主題上的角色。光丟一個主題進去，村民很可能各講各的、越扯越遠。所以還需要一個主持跟收斂的機制，知道偏題要拉回來、知道讓誰先發言、知道什麼時候收尾。這個主持的角色，就是這個大 Agent 的思考引擎。現在這個角色是我本人在主持。哪天我把主持的直覺，也用同一套人格思維提煉寫成一份主持人設定檔，這個大 Agent 就能脫離我，自己跑起來。

層級	是什麼	有沒有目標	大還是多
村民	一個被提煉出人格層與思維層的小 Agent。	有自己的判斷目標，但通常只管自己的回應。	單一 Agent。
初心小村	讓多個村民住在一起的環境與容器。	沒有共同通關目標，只提供場地與規則。	多 Agent 系統。
副本	有主題、劇情、任務與通關條件的一場活動。	有明確目標，劇情會把村民推向通關。	對外是大 Agent，對內是多 Agent。
主題小聚	有討論主題的聚會，需要主持與收斂機制。	有主題，但要靠主持角色把大家拉回目標。	介於容器與大 Agent 之間。

初心小村＝環境 / 容器 / 多 Agent 系統

一場副本＝大 Agent ＝通關條件(目標) ＋劇情(收斂)

村民小 Agent

放大看任何一個村民，他的設定檔有人格層的十區塊，加上思維層的思考引擎。其中 3 價值主張、5 思維模式、9 底層邏輯，就是讓他能自己判斷的核心。

大裡面有多：副本對外是一個大 Agent，對內又包著好幾個小 Agent。

大與多，是兩個視角

很多人會問，那一場副本到底算大 Agent，還是多 Agent。答案是，兩個都對，差別只在你站在哪裡看。

從外面看副本整體，它有通關條件、有劇情、會自己跑，這是一個大 Agent。從裡面看副本，住著好幾個村民各自行動，這是多 Agent。所以它同時是兩者，大裡面有多。

場有沒有主持跟收斂的角色，決定了它是一個會自己跑的大 Agent，還是一個只是把大家擺進去的環境。

收尾：一條沒有斷點的線

整串講下來，可以收成一個總判準，跟幾個一定要記得的重點。

文件就是系統。自然語言寫清楚，在 AI 時代就是系統，能跑的系統就是 Agent。
會指揮人，就會設計 Agent。導演、老師、老闆，本來就會定義角色、安排流程、指揮人。
角色要會思考，靠人格思維提煉。人格層讓它像那個人，思維層讓它思考起來像那個人。
看有沒有思考引擎。村民有沒有，決定他算不算 Agent；場有沒有它自己的，決定它算不算大 Agent。
大與多是兩個視角。副本對外是大 Agent，對內是多 Agent。

這套做法有個名字：駕馭工程（Harness Engineering） 這在 AI 工程圈是 2026 年開始紅的概念，講的是模型之外那層架構，怎麼給上下文、怎麼接工具、怎麼管記憶、怎麼設邊界，比模型本身更決定成敗。業界多半用程式打造這層；我整套是用純文字、自然語言做出來的。同一件事，我用這個方式證明了：不會寫程式的人，也能設計 Agent 框架。

常見的坑（與對策）

坑一：只寫了人物卡只給名字、基本資訊、口氣，沒做思考引擎。對策：補上價值主張、思維模式、底層邏輯這三塊，角色才接得住沒寫過的狀況。

坑二：判斷原則寫成口號寫「他很重視長期」，AI 套不出來。對策：先寫出他為什麼這樣選、想達成什麼（意圖），再配上「遇到 Y 就選 Z」當參考。意圖比步驟穩，步驟會隨情況變。

坑三：讓 AI 憑感覺補沒有來源的內容讓 AI 自己腦補，角色就會漂移、亂講。對策：來源先於人格，沒來源先標待補來源。

坑四：追求完美第一版想一次到位，結果永遠做不完。對策：第一版做到七十分就先用，對話中再迭代。完美主義是擬人化最大的敵人。

給自己的定位提醒

設計 Agent 真正的收穫，不在 AI 變多聰明。提煉一個角色，尤其是提煉你自己的時候，那個過程會逼你把腦袋裡平常不用想就會做的判斷，一條一條講清楚。講清楚的那一刻，你會對自己的思路清晰好幾倍。

那份清楚是你的，不是 AI 的。我一直在做的，就是提煉隱性知識，把你早就會、卻說不清楚的判斷力，變成可以累積的知識資產。AI 只是讓這件事，第一次變成所有人都做得到。

FAQ：非工程師設計 Agent 的常見問題

什麼是 AI Agent？

AI Agent 是一個能讀懂目標、依照規則判斷並執行任務的 AI 系統。它可以由程式碼組成，也可以先由清楚的文件、角色設定、流程與邊界組成。

非工程師可以怎麼開始設計 Agent？

先從一份文件開始。寫清楚角色要服務誰、要完成什麼、遇到常見情境怎麼判斷、不能做什麼，再用真實對話測試與迭代。

人格思維提煉是什麼？

人格思維提煉是把一個人或角色的口吻、價值主張、判斷原則、思維模式與底層邏輯整理成 AI 可讀的設定。目標是讓角色遇到沒寫過的問題時，仍能照同一套判斷方式回應。

思考引擎和思維層是同一件事嗎？

在這篇文章裡，思考引擎就是思維層的核心功能。它包含價值主張、思維模式、底層邏輯與可執行的判斷規則，用來讓角色自己判斷。

單一 Agent 和多 Agent 系統差在哪裡？

單一 Agent 是一個會判斷的角色或流程。多 Agent 系統是多個 Agent 放在同一個環境中互動。若整個場域有共同目標、劇情或主持收斂機制，它也可以被視為一個更大的 Agent。

什麼是駕馭工程（Harness Engineering）？

駕馭工程是設計模型外面那層架構：怎麼給上下文、怎麼接工具、怎麼管記憶、怎麼設邊界與檢查點，讓 AI 往你要的方向走。用一個比喻，AI 是大腦，Agent 是幫大腦接上手腳的一匹馬，駕馭工程就是控馬的韁繩、路線跟檢查點。這是 2026 年 AI 工程的新重點，因為模型之外那層架構，比模型本身更決定成敗。它可以用程式打造，也可以像本文這樣，用純文字、自然語言做出來。

提示詞工程、上下文工程、駕馭工程差在哪？

這是一條往上長的演進線。提示詞工程，是琢磨單句指令怎麼下。上下文工程，是經營整個對話的脈絡，你給了它哪些資料、背景、前後文，讓它在足夠的脈絡裡工作。駕馭工程再往上，重點不在每一句話怎麼寫，而在你怎麼帶著一個比你聰明的協作者，往你要的方向走。單句提示詞的天花板很低，重點早就從提示詞，往上移到上下文與駕馭。

文件就是系統：非工程師怎麼設計 Agent 框架