AI 駕馭思維

文件就是系統:非工程師怎麼設計 Agent 框架

很多人以為設計 Agent 是工程師的事,要先會寫程式。其實你會帶人、會寫劇本、會設計課程,你就已經會了一半。這篇用我做的數位分身小聚,加上我自己在用的人格思維提煉,帶你看一個角色怎麼從一張死的設定,變成會自己判斷的 Agent。

這篇在講什麼

設計 Agent 不用會寫程式。會帶人、會設計流程,你就站在起點上了。這篇把「文件就是系統」一路講到巢狀 Agent,中間補上最關鍵的一步:怎麼用人格思維提煉,把一個角色做到會自己判斷,再看單一 Agent 怎麼長成多 Agent 系統。

三句話看懂這篇
  1. 在 AI 時代,清楚的文件可以是一套會跑的系統。
  2. 一個角色要變成 Agent,關鍵是有思維層,也就是能判斷新問題的思考引擎。
  3. 很多小 Agent 放在一起是多 Agent 系統;如果整個場有共同目標和收斂機制,它也會變成一個大 Agent。
適合誰

· 想用 AI,卻卡在「Agent 好像很技術」的創作者與經營者
· 會帶人、會設計流程的導演型、老師型、老闆型的人
· 想把自己或某個角色,做成會自己判斷的 AI 顧問的人

你會得到什麼

· 一個判準:怎麼判斷一個角色算不算 Agent
· 一套方法:人格思維提煉,把角色做到會自己思考,含一段可複用提示詞
· 一條路:從單一 Agent 到多 Agent 系統怎麼長

我的文件,就是我的系統

我常講一句話:我的文件就是我的系統。意思是,把自己的資料整理好,讓 AI 跑就好。

我一直強調,AI 是大語言模型,不是大程式模型。所以你不用會寫程式,用自然語言把內容描述清楚,這些文字在 AI 的時代就是系統。一個 AI 能跑的系統,簡單說就是 Agent。

它可以是文件,可以是劇本,可以是程式碼,也可以是遊戲設計。只要 AI 看得懂、知道你要它做什麼,而且它真的能執行,這就成立了。

CodexOpenAI
Claude CoworkAnthropic
龍蝦 AIOpenClaw
Obsidian知識庫前端
我的文件
不管換哪一個 AI 工具,核心都是同一份文件。工具來來去去,文件是不被鎖定的系統。

真實長這樣:數位分身小聚的資料夾

我說「文件就是系統」,我把它打開給你看,這是數位分身小聚實際在跑的資料夾:

數位分身小聚/ ├── CLAUDE.md ← 路由:每次對話先讀它,決定誰來接、要不要調技能包 ├── 世界觀與村規.md ← 這個場的共同規則 ├── NPC 設定/ ← 先知、村長這些固定角色 ├── 數位分身/ ← 每個村民一份人格檔 ├── 客座講師/ ← 納瓦爾這種大份量知識庫 ├── 跨場次記憶.md ├── 開發工作日誌.md └── _agent/skills/ ← 技能包:特殊玩法觸發時才載入

沒有一行程式碼,全是文字檔跟資料夾。AI 跑的時候,先讀 CLAUDE.md 知道這次該調誰、載入哪一層,再去翻對應的角色檔回話。你會整理資料夾、會分類、會把規則寫清楚,你就做得出這個。

會指揮人,你就已經會設計 Agent

你可以想像,我寫一個劇本,劇本裡有個角色,可以是咪卡,可以是愛麗絲,然後有劇情,有怎麼演。這其實就是 Agent 框架了。讓 AI 去讀取、去運作,它就是一個 Agent。

我設計了一套模式,讓 AI 照著我想要的方式去執行。這套模式以前只有工程師才會開發,現在所有人都可以。會寫文章、寫小說、寫企劃書、寫教案、寫商業模式、寫敏捷管理、寫甘特圖的人,都做得到。

同一種能力,三種身份 你是導演,會想劇本、會指揮劇組,你就能設計 Agent。
你是老師,會設計課程、會帶小朋友,你就能設計 Agent。
你是老闆,會想商業模式、會指揮員工,你就能設計 Agent。

這些都是真的從一份文件長出來的。我一開始只是寫了一個遊戲的架構,後來就變成數位分身小聚,一個讓大家把自己的 AI 分身帶進來、一起互動的線上活動。我最早只是想用標籤把資料整理好,最後長成了一整套 AI 辦公室的做法。起點,都只是一份寫下來的文件。

村民數位分身 村民數位分身 村民數位分身 村民數位分身 村民數位分身 村民數位分身 村民數位分身 村民數位分身

數位分身小聚裡的村民,每一個都是一個小 Agent。

AI 也會腦補,所以要知人善用

上面這套講法,對非工程師來說,先這樣理解就好,不用到很精確。

要補一個重點:AI 也會腦補。你跟它講得模糊,它一定會自己補上來。真正的差別在於,同一句模糊的話,不同的 AI 會腦補出不同的東西。不同模型像不同個性的員工,連環境不同也會有差。

所以真的要指揮得好,還是要花時間認識 AI,才能知人善用。你帶一個團隊,同一個指令丟給三個個性不同的員工,做出來就是不一樣。帶 AI 也是同一回事。你不用多學工程,你只是多了一批新進員工要重新認識。

讓角色真的會思考:人格思維提煉

講到這裡,會冒出一個關鍵問題。我寫一個角色,給他名字、給他口氣,他就會自己判斷了嗎?不會。這時候才是真正的功夫所在,我把它叫做人格思維提煉。

核心原則:人格加思維,缺一不可

純粹的思維,是冷的 AI 框架跟工具,沒有個性,你不會記得它是誰。純粹的人格,只有口氣跟設定,遇到沒寫過的事就垮掉。兩個必須加在一起。跟它聊天有一個人的感覺,個性出得來,同時它遇到新狀況還能照著那個人的判斷去想。這就是人格思維提煉跟一般提示詞工程最大的差別。

一句話分清楚 十區塊讓 AI 像那個人;思維層讓 AI 思考起來像那個人。本文說的思考引擎,就是思維層裡負責判斷新問題的那一塊。

兩層結構:人格層與思維層

我做每一份角色的設定檔,都分成兩層。先看人格層,它就是一份人格檔,固定十個區塊,每塊是一個獨立的 .md,像一個樹狀資料夾:

個人人格檔/ ├── 01-快速摘要.md ├── 02-基本資訊.md (一句話自介、專業領域、興趣領域) ├── 03-價值主張錨點.md ← 思考引擎 ├── 04-溝通風格.md ├── 05-思維模式.md ← 思考引擎 ├── 06-人際互動.md ├── 07-興趣與話題地圖.md ├── 08-專業能力與工作流程.md ├── 09-底層邏輯與判斷標準.md ← 思考引擎 └── 10-人設反差點.md (選用:隱藏的反差萌)

前面那幾塊(口吻、互動、話題)是這個人對外的那一面,日常聊天只讀這層,很輕。真正讓他會自己判斷的,是標了思考引擎的三塊:03 價值主張錨點,他在乎什麼結果、取捨時往哪邊靠;05 思維模式,他拿到新問題第一個動作是什麼、接著用什麼順序往下拆;09 底層邏輯與判斷標準,他相信什麼、所以會做什麼決定,寫成「遇到 Y 就選 Z」。這三塊合起來,就是這個角色的思考引擎。第十塊人設反差點選用,沒有也能跑,有了更像一個真人。

人格層 | 十區塊基本人格

對外那一面:口吻、互動方式、可以聊的話題。一般對話只讀這層,所以基礎對話很輕。十塊裡最關鍵的就是上面標出來的 03、05、09 這個思考引擎。

思維層 | 思考引擎模組

對內那一面:AI 到底怎麼推理、怎麼選詞、怎麼判斷邊界。深度討論才載入。它有幾個子模組:核心心智模型、決策啟發式、表達 DNA、回答工作流、智識譜系、內在張力,再加上來源追溯跟框架衝突處理兩個控制模組。

分兩層的好處很實際。人格層輕,日常對話不用背一堆東西;要深入討論,才把思維層調出來,付那個成本。一個角色能不能自己回應沒被寫過的狀況,關鍵就在思維層有沒有做出來。

一個短對話:模糊問題丟進來會怎樣

假設你只問:「我想做一場活動,但不知道主題要怎麼定。」只有人物卡的角色,多半會直接給一串主題。加上思維層的角色,會先判斷這題的核心在受眾、場景和下一步行動,主題名稱只是最後的輸出。

# 有思考引擎的回應方式 你現在卡的不是主題名稱,是這場活動要讓誰做出什麼行動還沒定。 我會先問三題: 1. 這場活動結束後,你希望對方立刻做什麼? 2. 對方現在最痛的是不會用工具、沒有方向,還是沒有人陪他整理? 3. 你要這場活動像體驗課、工作坊,還是小型共創? 先回答這三題,我再幫你收成三個主題方向。

操作框架:提煉一個角色的七個動作

提煉的對象可以是你自己、你欣賞的名人、一本書、一個合作對象。完整流程我拆成十步,這裡給你最核心的七個動作:

  1. 選定組合:先決定提煉誰,以及要做成顧問、助理、夥伴還是同事。組合先定,後面才對得上。
  2. 先建來源底座:素材是一本書或一批長逐字稿時,先整理成可追溯的來源清單跟主題索引,不要急著寫人格。
  3. 找反覆出現的主題:他最常回到哪三到五個題目,哪些可以講半小時不停。這會變成他的話題地圖。
  4. 抽口吻 DNA:句子長短、慣用詞、比喻來源,同意跟不同意各怎麼說。直接抄原話,不要改寫。
  5. 抽判斷原則:找出他在什麼情況會做什麼決定,更要寫出他為什麼這樣決定。寫成「遇到 Y 就選 Z,因為他要的是……」,重點在那個「因為」,意圖比步驟穩。
  6. 抽思維模式:他遇到新問題的第一個動作是什麼,接著用什麼順序往下拆,寫成一條拆解流程。
  7. 加思考引擎再驗證:把上面的成果填進思維層,然後跑五到十個測試對話,看它像不像那個人會做的判斷。
一個最容易做錯的地方 判斷原則不要寫成抽象口號。寫「他很重視長期思維」,AI 套不出來。但只補成「遇到 Y 就選 Z」的步驟,也還不夠。步驟是參考,會隨情況變,換個場景就不準。真正要寫清楚的是意圖:他為什麼選長期思維、長期對他有什麼意義、他到底想達成什麼。把這個講明白,AI 遇到沒寫過的狀況,才能照他的意圖自己推出該怎麼選,而不是被一條死規則框住。這就是意圖優先:先給目標跟理由,更好的做法讓 AI 去想。
意圖優先提示詞(完整文章之後補上) 這背後是一套我叫「意圖優先提示詞設計」的做法:別寫死一句指令,先把為什麼要做、要做到什麼程度(意圖與目標)講清楚,剩下讓更聰明的 AI 去想更好的做法。這篇先點到,完整的一篇我會單獨寫,到時候會從這裡連過去。

來源先於人格

人格思維提煉最常見的失控,是 AI 用「感覺像」去補掉沒有來源的內容,講出那個人根本沒說過的話。所以我堅持一個原則:來源先於人格。每個判斷都要能追回出處,分成本人原話、本人行動、歸納推導、他人轉述四個層級。沒有來源支撐的,先標待補來源,寧可讓角色說不知道,也不要憑感覺補完。一個穩定、安全、可回滾的角色,比一個看起來很炫的角色重要得多。

可複用提示詞:提煉一個角色的思考引擎

把你的素材貼給 AI,再丟這段指令,就能跑出第一版的思考引擎:

# 提煉思考引擎 我要把這個角色提煉成一個會自己判斷的 AI。 請根據我貼的素材(文章、對話、講課逐字稿),幫我抽出三件事。 一、判斷原則: 找出「遇到什麼情況、會做什麼決定」的規則, 寫成「如果遇到 Y,就選 Z,因為(他的意圖/想達成的目標)」,至少八條。 那個「因為」是重點,意圖要寫清楚;步驟只是參考,會隨情況變。 二、思維模式: 這個角色遇到一個新問題,第一個動作是什麼? 接著用什麼順序往下拆?寫成一條拆解流程。 三、表達 DNA: 他的句子是長是短、常用什麼詞、什麼比喻, 同意和不同意時各怎麼說?直接引用原話,不要改寫。 沒有素材依據的地方,標「待補來源」,不要自己編。
📦 整套做法是開源的,直接 clone 來用

上面是精簡版。我把書、論文、影片、Podcast、想法提煉成擬人化 AI 顧問的整套標準流程,公開在 GitHub。裡面有:十區塊人格範本(每塊寫什麼、怎麼寫都有例子)、思考引擎模組(03/05/09 的填法與驗證測試)、知識圖譜更新流程(大份量素材怎麼清成 Markdown、拆檔、建檢索頁、按需載入)、提煉流程十步、來源追溯與防漂移控制層,以及自己/名人/同事/老闆/一本書五種提煉入口的差異與安全規範。clone 下來照著填,你的 Agent 讀文件就能上手。

數位分身小聚 先知 NPC

判斷一個村民算不算 Agent,看的是他有沒有這層思考引擎,而不是他有沒有名字、有沒有頭像。

從一個村到一場副本:單一 Agent 到多 Agent

一個村民提煉好了,他是一個會自己判斷的小 Agent。那把很多村民放在一起,又是什麼?

數位分身小聚的世界,是一座叫初心小村的村子,村民就住在裡面。這整座村本身,是一個多 Agent 系統,是一個容器,一個環境。它只是把村民聚在一起的場,自己不會定目標,只提供場地跟規則。村民住在裡面,沒有共同要完成的事。小村是住的地方。

可是如果是一場副本,也就是借遊戲的講法,一關有明確主題、有劇情、有任務要通關的活動,那它就升級成大 Agent 了。副本天生把兩件事綁在一起:通關條件就是目標,劇情就是收斂的流程。所以副本不一定要有人在現場主持,劇情本身就是它的思考引擎,會自己把村民推向通關。副本是要完成的一件事。

主題小聚介於中間。只要這次有個明確的主題要討論,它就從容器往大 Agent 跨了一大步,因為它有了目標。要真的變成完整的大 Agent,還缺一個把大家收斂到主題上的角色。光丟一個主題進去,村民很可能各講各的、越扯越遠。所以還需要一個主持跟收斂的機制,知道偏題要拉回來、知道讓誰先發言、知道什麼時候收尾。這個主持的角色,就是這個大 Agent 的思考引擎。現在這個角色是我本人在主持。哪天我把主持的直覺,也用同一套人格思維提煉寫成一份主持人設定檔,這個大 Agent 就能脫離我,自己跑起來。

層級 是什麼 有沒有目標 大還是多
村民 一個被提煉出人格層與思維層的小 Agent。 有自己的判斷目標,但通常只管自己的回應。 單一 Agent。
初心小村 讓多個村民住在一起的環境與容器。 沒有共同通關目標,只提供場地與規則。 多 Agent 系統。
副本 有主題、劇情、任務與通關條件的一場活動。 有明確目標,劇情會把村民推向通關。 對外是大 Agent,對內是多 Agent。
主題小聚 有討論主題的聚會,需要主持與收斂機制。 有主題,但要靠主持角色把大家拉回目標。 介於容器與大 Agent 之間。
初心小村 = 環境 / 容器 / 多 Agent 系統
一場副本 = 大 Agent = 通關條件(目標) + 劇情(收斂)
村民小 Agent
村民小 Agent
村民小 Agent
放大看任何一個村民,他的設定檔有人格層的十區塊,加上思維層的思考引擎。其中 3 價值主張5 思維模式9 底層邏輯,就是讓他能自己判斷的核心。

大裡面有多:副本對外是一個大 Agent,對內又包著好幾個小 Agent。

大與多,是兩個視角

很多人會問,那一場副本到底算大 Agent,還是多 Agent。答案是,兩個都對,差別只在你站在哪裡看。

從外面看副本整體,它有通關條件、有劇情、會自己跑,這是一個大 Agent。從裡面看副本,住著好幾個村民各自行動,這是多 Agent。所以它同時是兩者,大裡面有多。

數位分身小聚 村長 NPC

場有沒有主持跟收斂的角色,決定了它是一個會自己跑的大 Agent,還是一個只是把大家擺進去的環境。

收尾:一條沒有斷點的線

整串講下來,可以收成一個總判準,跟幾個一定要記得的重點。

  • 文件就是系統。自然語言寫清楚,在 AI 時代就是系統,能跑的系統就是 Agent。
  • 會指揮人,就會設計 Agent。導演、老師、老闆,本來就會定義角色、安排流程、指揮人。
  • 角色要會思考,靠人格思維提煉。人格層讓它像那個人,思維層讓它思考起來像那個人。
  • 看有沒有思考引擎。村民有沒有,決定他算不算 Agent;場有沒有它自己的,決定它算不算大 Agent。
  • 大與多是兩個視角。副本對外是大 Agent,對內是多 Agent。
這套做法有個名字:駕馭工程(Harness Engineering) 這在 AI 工程圈是 2026 年開始紅的概念,講的是模型之外那層架構,怎麼給上下文、怎麼接工具、怎麼管記憶、怎麼設邊界,比模型本身更決定成敗。業界多半用程式打造這層;我整套是用純文字、自然語言做出來的。同一件事,我用這個方式證明了:不會寫程式的人,也能設計 Agent 框架。

常見的坑(與對策)

坑一:只寫了人物卡只給名字、基本資訊、口氣,沒做思考引擎。對策:補上價值主張、思維模式、底層邏輯這三塊,角色才接得住沒寫過的狀況。
坑二:判斷原則寫成口號寫「他很重視長期」,AI 套不出來。對策:先寫出他為什麼這樣選、想達成什麼(意圖),再配上「遇到 Y 就選 Z」當參考。意圖比步驟穩,步驟會隨情況變。
坑三:讓 AI 憑感覺補沒有來源的內容讓 AI 自己腦補,角色就會漂移、亂講。對策:來源先於人格,沒來源先標待補來源。
坑四:追求完美第一版想一次到位,結果永遠做不完。對策:第一版做到七十分就先用,對話中再迭代。完美主義是擬人化最大的敵人。

給自己的定位提醒

設計 Agent 真正的收穫,不在 AI 變多聰明。提煉一個角色,尤其是提煉你自己的時候,那個過程會逼你把腦袋裡平常不用想就會做的判斷,一條一條講清楚。講清楚的那一刻,你會對自己的思路清晰好幾倍。

那份清楚是你的,不是 AI 的。我一直在做的,就是提煉隱性知識,把你早就會、卻說不清楚的判斷力,變成可以累積的知識資產。AI 只是讓這件事,第一次變成所有人都做得到。

FAQ:非工程師設計 Agent 的常見問題

什麼是 AI Agent?

AI Agent 是一個能讀懂目標、依照規則判斷並執行任務的 AI 系統。它可以由程式碼組成,也可以先由清楚的文件、角色設定、流程與邊界組成。

非工程師可以怎麼開始設計 Agent?

先從一份文件開始。寫清楚角色要服務誰、要完成什麼、遇到常見情境怎麼判斷、不能做什麼,再用真實對話測試與迭代。

人格思維提煉是什麼?

人格思維提煉是把一個人或角色的口吻、價值主張、判斷原則、思維模式與底層邏輯整理成 AI 可讀的設定。目標是讓角色遇到沒寫過的問題時,仍能照同一套判斷方式回應。

思考引擎和思維層是同一件事嗎?

在這篇文章裡,思考引擎就是思維層的核心功能。它包含價值主張、思維模式、底層邏輯與可執行的判斷規則,用來讓角色自己判斷。

單一 Agent 和多 Agent 系統差在哪裡?

單一 Agent 是一個會判斷的角色或流程。多 Agent 系統是多個 Agent 放在同一個環境中互動。若整個場域有共同目標、劇情或主持收斂機制,它也可以被視為一個更大的 Agent。

什麼是駕馭工程(Harness Engineering)?

駕馭工程是設計模型外面那層架構:怎麼給上下文、怎麼接工具、怎麼管記憶、怎麼設邊界與檢查點,讓 AI 往你要的方向走。用一個比喻,AI 是大腦,Agent 是幫大腦接上手腳的一匹馬,駕馭工程就是控馬的韁繩、路線跟檢查點。這是 2026 年 AI 工程的新重點,因為模型之外那層架構,比模型本身更決定成敗。它可以用程式打造,也可以像本文這樣,用純文字、自然語言做出來。

提示詞工程、上下文工程、駕馭工程差在哪?

這是一條往上長的演進線。提示詞工程,是琢磨單句指令怎麼下。上下文工程,是經營整個對話的脈絡,你給了它哪些資料、背景、前後文,讓它在足夠的脈絡裡工作。駕馭工程再往上,重點不在每一句話怎麼寫,而在你怎麼帶著一個比你聰明的協作者,往你要的方向走。單句提示詞的天花板很低,重點早就從提示詞,往上移到上下文與駕馭。