AI 一定會出錯,你自己下指令也一定會下錯。這篇教你設計一套出錯了也接得住的 Loop:六個步驟,每一步都有清楚的完成條件,附一個從頭到尾的示範。
- 開始把重要的工作交給 AI(整理檔案、批次修改、更新系統設定),但心裡毛毛的,怕它一次搞砸一堆東西的人
- 被 AI 搞砸過,事後找不到它到底改了什麼、改壞在哪的人
- 想放心讓 AI 做更大的事,但不知道安全網要怎麼架的人
- 一個心態翻轉:從追求零錯誤,變成追求錯得起
- 容錯 Loop 六步,每步都有完成條件,跟一個具體任務從頭走到尾的示範
- 出錯之後的五個標準動作
一、先認清一件事:零錯誤做不到
AI 有不確定性。同一個指令跑兩次,結果可能不一樣,模型再強都一樣。
人也一樣。我自己就會手滑、會下錯指令、會少想一個範圍。
所以「設計一套不會犯錯的機制」這個目標,我放棄了。至少我做不到。
我改追求另一個目標:做錯了,可以重新檢查,可以回復原狀。
這就是容錯。錯誤不可避免,但傷害可以控制。
二、三個目標,三道防線
我給容錯機制定了三個目標,按重要性排,每個目標對應一道防線:
| 目標 | 防線 | 對應步驟 |
|---|---|---|
| 1. 盡量少出錯 | 事前防 | 分大小、留後路、先小試 |
| 2. 出錯了,知道錯在哪 | 事中留痕 | 分批做、留紀錄、設停損 |
| 3. 知道錯在哪,能回復 | 事後回得來 | 備份、換腦驗收、收工筆記 |
注意這個排序的含義:第一道防線做得再好,第二、第三道還是要架。因為第一道就是會被突破,這是前提,你只是不知道哪一次。
三、容錯 Loop 六步
先看六步總覽:
| 步驟 | 一句話 | 怎樣算完成 |
|---|---|---|
| 1. 分大小 | 大事才進 loop,小事直接做 | 說得出這是大事還是小事、範圍多大 |
| 2. 留後路 | 備份,加寫下怎麼回去 | 備份打得開、還原步驟寫好了 |
| 3. 先小試 | 先跑 1 到 2 個樣本 | 親眼確認結果正確 |
| 4. 分批留痕 | 分批跑、講好停損 | 每批有紀錄可查 |
| 5. 換腦驗收 | 執行跟驗收不同腦 | 說得出驗收證據 |
| 6. 寫筆記 | 記下動了什麼、備份在哪 | 四件事都寫了 |
下面每一步都用同一個例子示範:你要讓 AI 把電腦裡 300 份舊檔案統一改名、加上日期。一次動幾百個檔案,這種事就是容錯 Loop 的主場。
做什麼:問自己一句,這次要動多大?改一個檔案裡的一句話是小事,直接做,不用跑 loop。一次動幾十幾百個檔案、涉及改名刪除搬移、會動到重要設定,就是大事,進完整六步。
怎樣算完成|你說得出「這是小事」或「這是大事,因為範圍是什麼」。
例子:300 份檔案要改名,大事,進 loop。
最常見的坑|不分大小。下場兩頭空,小事被流程拖死,大事裸奔。
做什麼:兩件事。一是把所有可能被動到的範圍,整個複製一份當備份。二是寫下「出錯怎麼回去」,具體到你照著做就能還原。
怎樣算完成|備份你親手打得開,還原步驟已經寫在筆記裡。缺任何一項,不准動手。
例子:整個資料夾複製一份,命名「改名前備份 0702」。筆記寫上一行:出錯就把這個備份資料夾整個複製回去覆蓋。
最常見的坑|備份範圍太小。你以為只會動到 A 資料夾就只備份 A,結果錯誤擴散到 B。備份要涵蓋「實際可能被動到的全部範圍」,別只備份「我打算改的範圍」。這兩者的差距,就是意外的藏身處。
做什麼:挑 1 到 2 個檔案,讓 AI 先跑一遍,你親眼打開看結果。
怎樣算完成|試跑結果跟你要的一模一樣,而且是你親眼確認的,才准放大。
例子:先改 2 份。打開看:新檔名格式對不對?檔案內容有沒有被動到?
最常見的坑|計畫看起來很完美,就直接全部跑。這一步擋的是「指令本身就寫錯」這種最傷的錯。同一個錯,跑 2 個檔案是小事,跑 300 個是災難,差別只在你先試了沒有。
做什麼:分批執行,不一口氣跑到底。每批做完,記下這批動了哪些檔案。開跑前先跟 AI 講好停損條件:遇到什麼狀況就停下來回報,不要硬跑。
怎樣算完成|每一批都有紀錄可查,停損條件講清楚了。
例子:300 份分 6 批,一批 50 份。每批完成留一份清單。停損講好:遇到檔名格式跟前面不一致的檔案,停下來問我。
最常見的坑|一口氣跑到底。分批的價值要到出錯才看得到:你會知道錯在哪一批,只要還原那一批,不用全部重來。
做什麼:執行的 AI 說完成了、都沒問題,不能當驗收。換另一個 AI,或你自己用不同的方法,再查一次:抽幾個檔案打開看實際內容,拿改完的檔案跟備份比對,確認差異只有預期中的那些。
怎樣算完成|你說得出驗收證據:我抽了哪幾個檔案、比對了什麼、結果如何。
例子:從第 1、3、6 批各抽 3 份打開看。再請另一個 AI 掃一遍全部檔名,回報有沒有漏改的、格式不一致的。
最常見的坑|把執行 AI 的回報當驗收。它可能真的做完了,也可能只是以為自己做完了。鐵則:執行跟驗收,不能是同一顆腦。
做什麼:記四件事:這次動了什麼、怎麼驗收的、備份放在哪、備份什麼時候可以刪。
怎樣算完成|四件事都寫了。備份我的習慣是留一週,確認一切正常才刪,而且刪備份這件事開一張待辦提醒自己,不靠記憶。
例子:筆記寫「7/02 改名 300 份、抽驗 9 份加全檔名掃描通過、備份在某某資料夾、7/09 確認無誤後刪」。
最常見的坑|做完就散場。等真的出事,你連自己上週動過什麼都想不起來。這份筆記就是下次出事時的地圖。
四、出錯的時候,照這五個動作走
容錯 Loop 真正的價值在出錯之後。發現不對勁,照順序做:
| 順序 | 動作 | 重點 |
|---|---|---|
| 1 | 停 | 不要急著修 |
| 2 | 定位 | 翻收工筆記跟分批紀錄,找出錯在哪一批 |
| 3 | 還原 | 從備份把那一批復原 |
| 4 | 修正做法 | 找出指令哪裡寫錯,改掉 |
| 5 | 回到第三步 | 重新小試,通過了才再放大 |
第五個動作最容易被跳過:不要修完直接大規模重跑,因為你的修正本身也可能是錯的。修正過的指令,跟新指令享受同等待遇,一律重新小試。
五、真實案例:170 個檔案被改壞,然後救回來
前陣子我跑一次大規模的知識庫整理,全自動,AI 處理上百個檔案。其中一個環節的批次替換指令寫壞了,整批跑下去,170 個檔案的內容被打亂。更麻煩的是,那次備份只涵蓋了我以為會動到的資料夾,實際損壞卻擴散到備份範圍之外。
檔案救回來了,因為損壞的方式可以反推回去。完整的事情經過跟三道防線,我另外寫成一篇:AI 出錯不可怕,沒有備援才可怕:一次搞壞 170 檔案的教訓。這篇六步 Loop,就是那次事故之後,我把零散的原則整理成的一套完整流程。
六、成本怎麼算:不同的步驟,用不同等級的 AI
容錯 Loop 步驟多,會不會很貴?我的做法是分級用模型。前提先講死:後路留好、小試通過、停損講好,才可以把執行交給便宜的模型。
| 步驟類型 | 包含哪些 | 用哪級模型 |
|---|---|---|
| 需要判斷的 | 分大小、設計計畫跟還原步驟、複驗結果的判讀、出事後的分析 | 最強的模型 |
| 純執行的 | 複製備份、跑批次、跑驗收指令 | 便宜快速的模型 |
執行交給便宜的模型沒關係,因為有整條 loop 兜著它。然後執行跟驗收永遠不同腦。
收尾
把這篇收成一句話:與其花力氣讓 AI 不出錯,把力氣花在確保出錯之後回得來。
趕時間的話,濃縮成三個問題,動手前問自己:後路留了嗎?小的試過了嗎?誰來驗收?
安全網夠強,你才敢把更大的事交給 AI。容錯機制看起來是煞車,實際上是油門。
常見問題
每次用 AI 都要跑六步嗎?
第一步「分大小」就是在回答這個問題。日常小事直接做,動得大、刪得掉、改得回不來的事,才進完整六步。
我沒有幾百個檔案要處理,這對我有用嗎?
有。用收尾那三個問題就好:後路留了嗎、小的試過了嗎、誰來驗收。任何要把重要東西交給 AI 的場合都適用,例如讓 AI 改你的履歷、整理你的相簿、清理你的信箱。
備份要留多久?
我的習慣是一週。確認一切正常才刪,而且刪備份開一張待辦追蹤,不靠記憶。
這跟迴圈工程是什麼關係?
容錯 Loop 是迴圈工程的一種應用。迴圈工程講怎麼把重複的工作變成會自己跑的循環;容錯 Loop 講其中風險最高的那類工作,大規模修改,要怎麼跑才安全。
想把容錯 Loop 用進自己的工作流?
我每月固定舉辦兩場免費線上講座,分享善用 AI 作為思考夥伴、把知識與經驗整理成提示詞、技能包、知識庫的實戰方法。對 AI 工作流、Loop 工程有興趣,歡迎先從社群開始。
每個月兩場免費講座。
點我加入 Line 社群 ↗