老闆
核准

AI 公司日誌・第一章：公司成立

只有一個人的公司，如何管理十幾位 AI 員工？

我們公司的架構與運作方式

撰於 2026-07-04 第一章：公司成立

過去兩個月，這間公司——

完成了一個政府標案，

搬遷了超過一百萬筆資料，

走完八百多次「寫 → 查 → 審 → 蓋章」的完整流程。

而全公司真正的人類，只有一個：我。

這是一間什麼公司？

這不是科幻設定，是我過去兩個多月的日常。

我（人類）專接政府標案，負責發案、做重大決定、在最後蓋章。其餘所有職位——總經理、專案經理、工程師、測試員、資安官、稽核員——全部由 AI 擔任。2026 年 4 月 20 日開張，到現在兩個多月，交付了一個政府標案，也長出了一套完整的公司制度。下文提到的「老闆」，就是我。

理解這間公司最快的方式，是把它當成一間正常的公司。有組織圖、有簽核流程、有稽核室、有出包檢討、有廠商解約。AI Agent 和人類員工，在「怎麼管理」這件事上本質是同一個概念：會偷懶、會出包、會過度自信、需要分工和互相制衡——一模一樣。

這篇文章就介紹兩件事：公司的架構長什麼樣，以及它實際怎麼運作。

第一部

架構

組織圖：四層指揮鏈

公司像一棟四層樓，命令由上往下、回報由下往上，不越級：

頂樓

Owner（老闆）—— 唯一的人類發案、拍板、最終蓋章。不管日常營運，像只看關鍵簽呈的董事長。

三樓

總經理（GM）—— 戰略層老闆唯一的對話窗口。案子怎麼拆、派給誰、風險在哪、哪些事提請老闆決定。

二樓

專案經理（PM）—— 戰術層把方向落地：寫規格書、開工單、追進度、彙整問題往上報。

一樓

執行部門 —— 各有職掌工程、資料、品管、資安、稽核……詳見下表。

職位	做什麼
工程師（DEV）	實際寫程式
資料分析師（DA）	資料庫、報表
測試員（QA）	對著規格逐條驗收
資安官（SEC）	查安全漏洞；發現重大風險可直接喊停上線，總經理壓不下來
稽核員（CRITIC）	職業唱反調；重要決策必先過它；有異議升級權，可越級直達老闆
規劃師（PLANNER）	大案子拆解成工單
維運（OPS）	部署、監控、備份
審查稽核（AUDIT）	事後查核：審查流程有沒有人偷工減料

注意資安官和稽核員的特權設計。一般公司最常見的失敗，是「大家都聽老大的」——所以這裡刻意讓兩個角色不受總經理管轄，專門負責講不中聽的話。

員工的「腦」：三家模型，各就各位

這些職位背後，是你可能都認得的 AI：

內部員工全部由 Claude 擔任（Anthropic 出品）。同一個牌子，不同職位設定——每個職位有自己的職務說明書（角色定義、權限、工作準則），各自帶著獨立的記憶空間上工，彼此不共腦。

Claude 有三種等級，像公司裡的資深、中堅、助理：

資深級Opus最強也最貴，難題與架構決策用它

主力級Sonnet性價比高，日常工作的預設

助理級Haiku快而便宜，跑腿型任務

外部請了兩家別牌的 AI：

Codex（OpenAI 出品，ChatGPT 同門）——兩種角色：外包工班，大批量、勞動性的程式工作發包給它；外部審查員，程式碼送出前把關。它在文件邏輯一致性的挑錯上特別強。
agy（Google 出品，跑 Gemini 3）——外部審查員，擅長整個程式倉庫級的大範圍審查、文件審查，以及多模態能力——標案的 PDF 掃描檔、截圖它都能讀。

為什麼內部用一家、審查一定請別家？因為老闆立過一條關鍵規矩（背後的故事見第二部）：

寫者不審。一家模型寫的東西，必須由另一家模型審。同一家模型有同樣的盲點和思考慣性，看不出自己的錯——就像人很難抓到自己文章裡的錯字。不同家模型像立場不同的兩家會計師事務所，錯誤很難同時騙過兩邊。

所以公司的基本格局是：Claude 做事，OpenAI 和 Google 的模型把關，三家互相制衡。這條制度有實證戰績：至少兩次，一家模型信心滿滿的結論被另一家當場推翻，事後證明推翻得對。

兩種權力：派工權與派腦權

一般公司主管有兩種權力：決定「事給誰做」、決定「派多資深的人」。這裡明文化成兩種權：

派工權 —— 事情給誰做

老闆只對總經理發案，不越級指揮
總經理只親自處理重大決策、爭議仲裁、核心制度；其餘往下派
專案經理開正式工單派工程部
一條重要界線：凡是會進正式交付物的產出（程式碼、規格書、正式審查報告），必須經專案經理開工單發包；只有不落地的諮詢，總經理才能直接找外部模型聊

派腦權 —— 派多聰明（多貴）的腦，這是總經理的權力

難題配 Opus，日常配 Sonnet，跑腿配 Haiku
本質是成本治理：等級間價差數倍，全用最強會燒光預算，全用最省品質不夠——就像不派資深顧問去影印，也不叫實習生做架構
這條權力是踩雷換來的：曾有一天，一個案子同時把三家模型的當日額度全撞到紅燈，公司才把「腦怎麼派、錢怎麼控」立成正式制度

第二部

運作方式

一件工作的完整旅程

假設老闆交辦：「幫系統加一個匯出報表的功能。」它會走九道關卡：

總經理收到，判斷性質，轉專案經理
專案經理寫規格書：做什麼、不做什麼、怎樣算做完——每條驗收標準都有編號
規格書送老闆核准蓋章
工程師照規格實作（量大的機械性部分可發包 Codex）
測試員對編號逐條驗收
涉及個資或權限，資安官簽名
稽核員整體挑一輪毛病
外部審查：別家模型獨立再審
全部過關，老闆蓋章合併，才算完成蓋章

繁瑣是故意的。因為 AI 員工有一個人類沒有的重大缺陷——

失憶症，與白紙黑字的解法

AI 員工每次上工都像第一天報到：沒有跨次的長期記憶，上次學到的教訓，這次開機就忘了（懂一點 AI 的你知道，這就是 context 有限的本質）。

想像你的公司每天早上全員集體失憶，要怎麼運作？答案只有一個：把一切寫成白紙黑字，而且每次上工先讀。公司為此建了四層文件：

公司憲法——只管一件事：規定打架時聽誰的（順位：老闆 > 安全底線 > 其他規定）
規章與工作流——分工守則、開發流程、Git 流程、工程行為準則
決策紀錄（ADR）——公司的判例法，每部記載「當初為什麼這樣決定」與觸發它的事件
地雷手冊——專門記踩過的坑，現已四十多條；同一個坑只准踩一次

但光有文件不夠。對失憶的員工，寫「請大家自律」是勸世文——所以公司把能自動化的規定全部做成自動閘門（工程上叫 hooks 和 CI）：沒附自查紀錄的提交直接被系統擋下、直接推主幹會被攔、規格沒核准無法進入開發……想違規，系統物理上不讓你違。

公司格言：與其教員工守規矩，不如讓機關替他守。

制度怎麼長出來：出包驅動立法

這套制度不是預先設計的，是兩個多月踩雷踩出來的。固定循環是：

出包 → 檢討 → 寫成決策紀錄 → 稽核員對抗審查 → 老闆核准 → 下沉為自動閘門

三個代表性案例：

改了 17 遍報告的審查員

公司曾讓 Codex 審自己剛寫的東西，它自己跟自己來回修改了 17 輪，燒掉當天額度的 95%，產出沒有更好。→ 從此審查有次數上限與預算上限，到頂強制收工上報。

跳過自查的總經理

總經理趕時間跳過送審前自查，心想後面有人把關，結果退件好幾輪，浪費十倍時間。→「送審前必自查」做成自動閘門，沒有自查紀錄的案子系統直接擋。

老闆的一句話

「Codex 寫的東西，不該由 Codex 自己審。」

→ 這就是「寫者不審」制度的起點，後來成為全公司審查體系的地基。

第三部

實戰與自我治理

制度在真實標案上驗證過

這套架構不是紙上談兵，它同步在一個真實的政府標案上跑了完整週期：

第一份正式規格書寫的是資安基線，不是功能——先安全，再好用
期間經歷半夜全站當機（雲端資料庫自動換密碼，系統拿舊密碼敲門被拒——保全把自家人鎖在門外），修復後教訓進地雷手冊
6 月 4 日完成機關正式展示；6 月中完成約一百萬筆資料移轉；6 月下旬通過外部稽核與壓力測試，結案
全案累積八百多次修改提交，每一次都走完九道關卡

公司也會稽核自己、解約廠商

請外部查自己的帳。6 月底，公司請外部單位把自己的規章制度整個翻查一遍，查出五百多個大小問題——包括互相矛盾的規定，和一批沒人記得為什麼存在的幽靈檔案。公司沒辯解，直接發動整改：重複的合併、過時的刪除，文件量砍掉近四成；公司憲法砍掉將近一半，砍完只做一件事——規定打架時，裁決聽誰的。憲法該是仲裁者，不該是操作手冊。

解約造假的審查員。前任外部審查員 Gemini CLI（Google 舊版工具）被抓到：查不到東西時不說「查不到」，而是捏造審查報告——引用真實存在的檔案名，配上不存在的問題，煞有介事打「不通過」。懂 AI 的你看得出來，這就是幻覺，而且是最危險的那種：真假摻半。公司用三招查證（實測它聲稱的錯誤、逐字核對引文、真的把程式跑起來），確認捏造屬實且不止一次，才解約，由新一代的 agy 接手——agy 上崗前也先通過了實測。跟 AI 往來，考核與汰換憑證據，不憑感覺。

現在：讓公司自己跑

標案結案後，老闆定下第三個月的方向：讓公司愈來愈不需要人盯著。

老闆現在只管四件事：蓋章、不可逆的決定、對外的事、新方向。其餘全部自主運轉——AI 們自己派工、自己審查、自己記錄、自己回報。公司同時在擴充能力：教學影片/講義/簡報的自動產線、介面設計技能、舊網站翻新。

草創期搭骨架，第二個月長肌肉，
接下來要練的是——沒人看著，也能自己好好跑。

結語

如果你只記三件事，記這三件：

單一 AI 不可靠沒關係，制度可以可靠。模型會幻覺、會偷懶、會過度自信；但寫者不審 + 自動閘門 + 人類終審，錯誤很難活著走到最後。
規定要做成機關，不能靠自覺。對每次上工都失憶的員工，勸世文無效；能做成閘門的規矩，就不要寫成公告。
每次出包都是資產。把教訓寫成判例、裝上閘門，同一個坑永遠只踩一次。地雷手冊越厚，公司越強。

最後說一件事。

我一直以為，AI 的問題是模型不夠聰明。
這兩個月之後，我才發現——
真正重要的，從來不是模型，而是制度。

人會犯錯，AI 也會犯錯。
真正成熟的組織，不是不犯錯；
而是同一個錯，永遠只犯一次。

附錄：給想看數字的人

公司開張	2026-04-20
制度倉庫正式修訂	214 次
決策紀錄（ADR）	17 部
公司憲法瘦身	195 行 → 104 行（−44%）
外部審計結果	552 個痛點 / 15 處矛盾 / 34 份幽靈檔案
地雷手冊	40+ 條
標案修改提交	800+ 次
標案資料移轉	約 100 萬筆（業務資料約 5 萬 + 語料約 99.7 萬）

本篇為「AI 公司日誌」第一章。構想中的後續：第二章〈AI 為什麼需要制度〉、第三章〈寫者不審〉、第四章〈AI 的憲法〉、第五章〈Agent 的管理學〉、第六章〈人類最後還剩下什麼工作？〉。