AI 工作流 · 容錯設計

與其期待不出錯的 AI 系統,不如設計能容錯的 Loop

AI 有不確定性,人也會下錯指令,設計不會犯錯的系統不可能。我把力氣改放在容錯:出錯了,能重新檢查、能回復原狀。這是我整理出的六步 Loop,一步一步拆給你看。

AI 一定會出錯,你自己下指令也一定會下錯。這篇教你設計一套出錯了也接得住的 Loop:六個步驟,每一步都有清楚的完成條件,附一個從頭到尾的示範。

適合誰
  • 開始把重要的工作交給 AI(整理檔案、批次修改、更新系統設定),但心裡毛毛的,怕它一次搞砸一堆東西的人
  • 被 AI 搞砸過,事後找不到它到底改了什麼、改壞在哪的人
  • 想放心讓 AI 做更大的事,但不知道安全網要怎麼架的人
你會得到什麼
  • 一個心態翻轉:從追求零錯誤,變成追求錯得起
  • 容錯 Loop 六步,每步都有完成條件,跟一個具體任務從頭走到尾的示範
  • 出錯之後的五個標準動作
為什麼要學這套流程 你可能已經知道要備份、要複驗這些道理,這篇要給的是一套排好順序、每步都有完成條件的具體流程,讓你下次接大任務時直接照著跑。

一、先認清一件事:零錯誤做不到

AI 有不確定性。同一個指令跑兩次,結果可能不一樣,模型再強都一樣。

人也一樣。我自己就會手滑、會下錯指令、會少想一個範圍。

所以「設計一套不會犯錯的機制」這個目標,我放棄了。至少我做不到。

我改追求另一個目標:做錯了,可以重新檢查,可以回復原狀。

這就是容錯。錯誤不可避免,但傷害可以控制。

二、三個目標,三道防線

我給容錯機制定了三個目標,按重要性排,每個目標對應一道防線:

目標防線對應步驟
1. 盡量少出錯事前防分大小、留後路、先小試
2. 出錯了,知道錯在哪事中留痕分批做、留紀錄、設停損
3. 知道錯在哪,能回復事後回得來備份、換腦驗收、收工筆記

注意這個排序的含義:第一道防線做得再好,第二、第三道還是要架。因為第一道就是會被突破,這是前提,你只是不知道哪一次。

三、容錯 Loop 六步

先看六步總覽:

步驟一句話怎樣算完成
1. 分大小大事才進 loop,小事直接做說得出這是大事還是小事、範圍多大
2. 留後路備份,加寫下怎麼回去備份打得開、還原步驟寫好了
3. 先小試先跑 1 到 2 個樣本親眼確認結果正確
4. 分批留痕分批跑、講好停損每批有紀錄可查
5. 換腦驗收執行跟驗收不同腦說得出驗收證據
6. 寫筆記記下動了什麼、備份在哪四件事都寫了

下面每一步都用同一個例子示範:你要讓 AI 把電腦裡 300 份舊檔案統一改名、加上日期。一次動幾百個檔案,這種事就是容錯 Loop 的主場。

第一步:分大小

做什麼:問自己一句,這次要動多大?改一個檔案裡的一句話是小事,直接做,不用跑 loop。一次動幾十幾百個檔案、涉及改名刪除搬移、會動到重要設定,就是大事,進完整六步。

怎樣算完成|你說得出「這是小事」或「這是大事,因為範圍是什麼」。

例子:300 份檔案要改名,大事,進 loop。

最常見的坑|不分大小。下場兩頭空,小事被流程拖死,大事裸奔。

第二步:留後路

做什麼:兩件事。一是把所有可能被動到的範圍,整個複製一份當備份。二是寫下「出錯怎麼回去」,具體到你照著做就能還原。

怎樣算完成|備份你親手打得開,還原步驟已經寫在筆記裡。缺任何一項,不准動手。

例子:整個資料夾複製一份,命名「改名前備份 0702」。筆記寫上一行:出錯就把這個備份資料夾整個複製回去覆蓋。

最常見的坑|備份範圍太小。你以為只會動到 A 資料夾就只備份 A,結果錯誤擴散到 B。備份要涵蓋「實際可能被動到的全部範圍」,別只備份「我打算改的範圍」。這兩者的差距,就是意外的藏身處。

第三步:先小試

做什麼:挑 1 到 2 個檔案,讓 AI 先跑一遍,你親眼打開看結果。

怎樣算完成|試跑結果跟你要的一模一樣,而且是你親眼確認的,才准放大。

例子:先改 2 份。打開看:新檔名格式對不對?檔案內容有沒有被動到?

最常見的坑|計畫看起來很完美,就直接全部跑。這一步擋的是「指令本身就寫錯」這種最傷的錯。同一個錯,跑 2 個檔案是小事,跑 300 個是災難,差別只在你先試了沒有。

第四步:分批做,每批留紀錄

做什麼:分批執行,不一口氣跑到底。每批做完,記下這批動了哪些檔案。開跑前先跟 AI 講好停損條件:遇到什麼狀況就停下來回報,不要硬跑。

怎樣算完成|每一批都有紀錄可查,停損條件講清楚了。

例子:300 份分 6 批,一批 50 份。每批完成留一份清單。停損講好:遇到檔名格式跟前面不一致的檔案,停下來問我。

最常見的坑|一口氣跑到底。分批的價值要到出錯才看得到:你會知道錯在哪一批,只要還原那一批,不用全部重來。

第五步:換一顆腦驗收

做什麼:執行的 AI 說完成了、都沒問題,不能當驗收。換另一個 AI,或你自己用不同的方法,再查一次:抽幾個檔案打開看實際內容,拿改完的檔案跟備份比對,確認差異只有預期中的那些。

怎樣算完成|你說得出驗收證據:我抽了哪幾個檔案、比對了什麼、結果如何。

例子:從第 1、3、6 批各抽 3 份打開看。再請另一個 AI 掃一遍全部檔名,回報有沒有漏改的、格式不一致的。

最常見的坑|把執行 AI 的回報當驗收。它可能真的做完了,也可能只是以為自己做完了。鐵則:執行跟驗收,不能是同一顆腦。

第六步:寫收工筆記

做什麼:記四件事:這次動了什麼、怎麼驗收的、備份放在哪、備份什麼時候可以刪。

怎樣算完成|四件事都寫了。備份我的習慣是留一週,確認一切正常才刪,而且刪備份這件事開一張待辦提醒自己,不靠記憶。

例子:筆記寫「7/02 改名 300 份、抽驗 9 份加全檔名掃描通過、備份在某某資料夾、7/09 確認無誤後刪」。

最常見的坑|做完就散場。等真的出事,你連自己上週動過什麼都想不起來。這份筆記就是下次出事時的地圖。

四、出錯的時候,照這五個動作走

容錯 Loop 真正的價值在出錯之後。發現不對勁,照順序做:

順序動作重點
1不要急著修
2定位翻收工筆記跟分批紀錄,找出錯在哪一批
3還原從備份把那一批復原
4修正做法找出指令哪裡寫錯,改掉
5回到第三步重新小試,通過了才再放大

第五個動作最容易被跳過:不要修完直接大規模重跑,因為你的修正本身也可能是錯的。修正過的指令,跟新指令享受同等待遇,一律重新小試。

五、真實案例:170 個檔案被改壞,然後救回來

前陣子我跑一次大規模的知識庫整理,全自動,AI 處理上百個檔案。其中一個環節的批次替換指令寫壞了,整批跑下去,170 個檔案的內容被打亂。更麻煩的是,那次備份只涵蓋了我以為會動到的資料夾,實際損壞卻擴散到備份範圍之外。

檔案救回來了,因為損壞的方式可以反推回去。完整的事情經過跟三道防線,我另外寫成一篇:AI 出錯不可怕,沒有備援才可怕:一次搞壞 170 檔案的教訓。這篇六步 Loop,就是那次事故之後,我把零散的原則整理成的一套完整流程。

錯誤發生了,救得回來,機制還因為這次錯誤變得更強這就是容錯 Loop 跟祈禱 AI 不要出錯的差別。

六、成本怎麼算:不同的步驟,用不同等級的 AI

容錯 Loop 步驟多,會不會很貴?我的做法是分級用模型。前提先講死:後路留好、小試通過、停損講好,才可以把執行交給便宜的模型。

步驟類型包含哪些用哪級模型
需要判斷的分大小、設計計畫跟還原步驟、複驗結果的判讀、出事後的分析最強的模型
純執行的複製備份、跑批次、跑驗收指令便宜快速的模型

執行交給便宜的模型沒關係,因為有整條 loop 兜著它。然後執行跟驗收永遠不同腦。

收尾

把這篇收成一句話:與其花力氣讓 AI 不出錯,把力氣花在確保出錯之後回得來。

分大小留後路先小試分批留痕換腦驗收寫筆記

趕時間的話,濃縮成三個問題,動手前問自己:後路留了嗎?小的試過了嗎?誰來驗收?

安全網夠強,你才敢把更大的事交給 AI。容錯機制看起來是煞車,實際上是油門。

常見問題

每次用 AI 都要跑六步嗎?

第一步「分大小」就是在回答這個問題。日常小事直接做,動得大、刪得掉、改得回不來的事,才進完整六步。

我沒有幾百個檔案要處理,這對我有用嗎?

有。用收尾那三個問題就好:後路留了嗎、小的試過了嗎、誰來驗收。任何要把重要東西交給 AI 的場合都適用,例如讓 AI 改你的履歷、整理你的相簿、清理你的信箱。

備份要留多久?

我的習慣是一週。確認一切正常才刪,而且刪備份開一張待辦追蹤,不靠記憶。

這跟迴圈工程是什麼關係?

容錯 Loop 是迴圈工程的一種應用。迴圈工程講怎麼把重複的工作變成會自己跑的循環;容錯 Loop 講其中風險最高的那類工作,大規模修改,要怎麼跑才安全。

想把容錯 Loop 用進自己的工作流?

我每月固定舉辦兩場免費線上講座,分享善用 AI 作為思考夥伴、把知識與經驗整理成提示詞、技能包、知識庫的實戰方法。對 AI 工作流、Loop 工程有興趣,歡迎先從社群開始。

免費線上講座

每個月兩場免費講座。

點我加入 Line 社群 ↗