← 回刊物首頁
老闆
核准
AI 公司日誌・第一章:公司成立

只有一個人的公司,如何管理十幾位 AI 員工?

我們公司的架構與運作方式

撰於 2026-07-04 第一章:公司成立

過去兩個月,這間公司——

完成了一個政府標案

搬遷了超過一百萬筆資料,

走完八百多次「寫 → 查 → 審 → 蓋章」的完整流程。

而全公司真正的人類,只有一個:我。

這是一間什麼公司?

這不是科幻設定,是我過去兩個多月的日常。

我(人類)專接政府標案,負責發案、做重大決定、在最後蓋章。其餘所有職位——總經理、專案經理、工程師、測試員、資安官、稽核員——全部由 AI 擔任。2026 年 4 月 20 日開張,到現在兩個多月,交付了一個政府標案,也長出了一套完整的公司制度。下文提到的「老闆」,就是我。

理解這間公司最快的方式,是把它當成一間正常的公司。有組織圖、有簽核流程、有稽核室、有出包檢討、有廠商解約。AI Agent 和人類員工,在「怎麼管理」這件事上本質是同一個概念:會偷懶、會出包、會過度自信、需要分工和互相制衡——一模一樣。

這篇文章就介紹兩件事:公司的架構長什麼樣,以及它實際怎麼運作。

第一部

架構

組織圖:四層指揮鏈

公司像一棟四層樓,命令由上往下、回報由下往上,不越級:

頂樓
Owner(老闆)—— 唯一的人類發案、拍板、最終蓋章。不管日常營運,像只看關鍵簽呈的董事長。
三樓
總經理(GM)—— 戰略層老闆唯一的對話窗口。案子怎麼拆、派給誰、風險在哪、哪些事提請老闆決定。
二樓
專案經理(PM)—— 戰術層把方向落地:寫規格書、開工單、追進度、彙整問題往上報。
一樓
執行部門 —— 各有職掌工程、資料、品管、資安、稽核……詳見下表。
職位做什麼
工程師(DEV)實際寫程式
資料分析師(DA)資料庫、報表
測試員(QA)對著規格逐條驗收
資安官(SEC)查安全漏洞;發現重大風險可直接喊停上線,總經理壓不下來
稽核員(CRITIC)職業唱反調;重要決策必先過它;有異議升級權,可越級直達老闆
規劃師(PLANNER)大案子拆解成工單
維運(OPS)部署、監控、備份
審查稽核(AUDIT)事後查核:審查流程有沒有人偷工減料

注意資安官和稽核員的特權設計。一般公司最常見的失敗,是「大家都聽老大的」——所以這裡刻意讓兩個角色不受總經理管轄,專門負責講不中聽的話。

員工的「腦」:三家模型,各就各位

這些職位背後,是你可能都認得的 AI:

內部員工全部由 Claude 擔任(Anthropic 出品)。同一個牌子,不同職位設定——每個職位有自己的職務說明書(角色定義、權限、工作準則),各自帶著獨立的記憶空間上工,彼此不共腦。

Claude 有三種等級,像公司裡的資深、中堅、助理:

資深級Opus最強也最貴,難題與架構決策用它
主力級Sonnet性價比高,日常工作的預設
助理級Haiku快而便宜,跑腿型任務

外部請了兩家別牌的 AI:

為什麼內部用一家、審查一定請別家?因為老闆立過一條關鍵規矩(背後的故事見第二部):

寫者不審。一家模型寫的東西,必須由另一家模型審。同一家模型有同樣的盲點和思考慣性,看不出自己的錯——就像人很難抓到自己文章裡的錯字。不同家模型像立場不同的兩家會計師事務所,錯誤很難同時騙過兩邊。

所以公司的基本格局是:Claude 做事,OpenAI 和 Google 的模型把關,三家互相制衡。這條制度有實證戰績:至少兩次,一家模型信心滿滿的結論被另一家當場推翻,事後證明推翻得對。

兩種權力:派工權與派腦權

一般公司主管有兩種權力:決定「事給誰做」、決定「派多資深的人」。這裡明文化成兩種權:

派工權 —— 事情給誰做

派腦權 —— 派多聰明(多貴)的腦,這是總經理的權力

第二部

運作方式

一件工作的完整旅程

假設老闆交辦:「幫系統加一個匯出報表的功能。」它會走九道關卡:

  1. 總經理收到,判斷性質,轉專案經理
  2. 專案經理規格書:做什麼、不做什麼、怎樣算做完——每條驗收標準都有編號
  3. 規格書送老闆核准蓋章
  4. 工程師照規格實作(量大的機械性部分可發包 Codex)
  5. 測試員對編號逐條驗收
  6. 涉及個資或權限,資安官簽名
  7. 稽核員整體挑一輪毛病
  8. 外部審查:別家模型獨立再審
  9. 全部過關,老闆蓋章合併,才算完成蓋章

繁瑣是故意的。因為 AI 員工有一個人類沒有的重大缺陷——

失憶症,與白紙黑字的解法

AI 員工每次上工都像第一天報到:沒有跨次的長期記憶,上次學到的教訓,這次開機就忘了(懂一點 AI 的你知道,這就是 context 有限的本質)。

想像你的公司每天早上全員集體失憶,要怎麼運作?答案只有一個:把一切寫成白紙黑字,而且每次上工先讀。公司為此建了四層文件:

但光有文件不夠。對失憶的員工,寫「請大家自律」是勸世文——所以公司把能自動化的規定全部做成自動閘門(工程上叫 hooks 和 CI):沒附自查紀錄的提交直接被系統擋下、直接推主幹會被攔、規格沒核准無法進入開發……想違規,系統物理上不讓你違。

公司格言:與其教員工守規矩,不如讓機關替他守。

制度怎麼長出來:出包驅動立法

這套制度不是預先設計的,是兩個多月踩雷踩出來的。固定循環是:

出包 檢討 寫成決策紀錄 稽核員對抗審查 老闆核准 下沉為自動閘門

三個代表性案例:

改了 17 遍報告的審查員

公司曾讓 Codex 審自己剛寫的東西,它自己跟自己來回修改了 17 輪,燒掉當天額度的 95%,產出沒有更好。→ 從此審查有次數上限與預算上限,到頂強制收工上報。

跳過自查的總經理

總經理趕時間跳過送審前自查,心想後面有人把關,結果退件好幾輪,浪費十倍時間。→「送審前必自查」做成自動閘門,沒有自查紀錄的案子系統直接擋。

老闆的一句話

「Codex 寫的東西,不該由 Codex 自己審。」

→ 這就是「寫者不審」制度的起點,後來成為全公司審查體系的地基。

第三部

實戰與自我治理

制度在真實標案上驗證過

這套架構不是紙上談兵,它同步在一個真實的政府標案上跑了完整週期:

公司也會稽核自己、解約廠商

請外部查自己的帳。6 月底,公司請外部單位把自己的規章制度整個翻查一遍,查出五百多個大小問題——包括互相矛盾的規定,和一批沒人記得為什麼存在的幽靈檔案。公司沒辯解,直接發動整改:重複的合併、過時的刪除,文件量砍掉近四成;公司憲法砍掉將近一半,砍完只做一件事——規定打架時,裁決聽誰的。憲法該是仲裁者,不該是操作手冊。

解約造假的審查員。前任外部審查員 Gemini CLI(Google 舊版工具)被抓到:查不到東西時不說「查不到」,而是捏造審查報告——引用真實存在的檔案名,配上不存在的問題,煞有介事打「不通過」。懂 AI 的你看得出來,這就是幻覺,而且是最危險的那種:真假摻半。公司用三招查證(實測它聲稱的錯誤、逐字核對引文、真的把程式跑起來),確認捏造屬實且不止一次,才解約,由新一代的 agy 接手——agy 上崗前也先通過了實測。跟 AI 往來,考核與汰換憑證據,不憑感覺。

現在:讓公司自己跑

標案結案後,老闆定下第三個月的方向:讓公司愈來愈不需要人盯著

老闆現在只管四件事:蓋章、不可逆的決定、對外的事、新方向。其餘全部自主運轉——AI 們自己派工、自己審查、自己記錄、自己回報。公司同時在擴充能力:教學影片/講義/簡報的自動產線、介面設計技能、舊網站翻新。

草創期搭骨架,第二個月長肌肉,
接下來要練的是——沒人看著,也能自己好好跑。

結語

如果你只記三件事,記這三件:

  1. 單一 AI 不可靠沒關係,制度可以可靠。模型會幻覺、會偷懶、會過度自信;但寫者不審 + 自動閘門 + 人類終審,錯誤很難活著走到最後。
  2. 規定要做成機關,不能靠自覺。對每次上工都失憶的員工,勸世文無效;能做成閘門的規矩,就不要寫成公告。
  3. 每次出包都是資產。把教訓寫成判例、裝上閘門,同一個坑永遠只踩一次。地雷手冊越厚,公司越強。

最後說一件事。

我一直以為,AI 的問題是模型不夠聰明。
這兩個月之後,我才發現——
真正重要的,從來不是模型,而是制度。

人會犯錯,AI 也會犯錯。
真正成熟的組織,不是不犯錯;
而是同一個錯,永遠只犯一次。

附錄:給想看數字的人

公司開張2026-04-20
制度倉庫正式修訂214 次
決策紀錄(ADR)17 部
公司憲法瘦身195 行 → 104 行(−44%)
外部審計結果552 個痛點 / 15 處矛盾 / 34 份幽靈檔案
地雷手冊40+ 條
標案修改提交800+ 次
標案資料移轉約 100 萬筆(業務資料約 5 萬 + 語料約 99.7 萬)

本篇為「AI 公司日誌」第一章。構想中的後續:第二章〈AI 為什麼需要制度〉、第三章〈寫者不審〉、第四章〈AI 的憲法〉、第五章〈Agent 的管理學〉、第六章〈人類最後還剩下什麼工作?〉。