gggodlin

規則寫下來了，agent 真的有收到嗎

把規範放進檔案還不夠。這篇記錄我怎麼從互相打架的量測答案追出規則送達斷在哪裡，再把內容直接送進對話。

2026年7月29日 · claude-code / memory / hook / methodology

聽話，不代表懂你：GPT 接進 Claude Code 第二週的性格觀察

接入後第二週八場對話的逐場統計對照：GPT 對寫下來的規則執行得比 Claude 徹底，卻讀不到規則之外的訊號。附一場對話壓縮吃掉關鍵結論的完整事故。

2026年7月21日 · claude-code / vendor-swap / gpt / llm / model-behavior

接得上，不代表合得來：把 GPT 接進 Claude Code 的三顆雷

把 ChatGPT 訂閱額度接進 Claude Code，協議通了只是開始。真正難搞的是內建生態錯配、設定靜默蓋值，還有三個意思完全不同的上下文視窗數字。

2026年7月20日 · claude-code / vendor-swap / gpt / llm

雲端太遠，hook 等不了：低延遲給了本地小模型就業機會

本地 LLM 當日常主力碰到天花板，縮到 hook 裡當語意判官後，反而找到雲端免費層坐不穩的窄職位。

2026年7月18日 · claude-code / local-llm / hook / llm

工作能外包給 AI，決策不能

AI 幫你挑出 spec 漏洞之後，你有沒有逼它認錯過一次？三段真實對話拆開這個常常被跳過的步驟。

2026年7月18日 · claude-code / spec-review / ai-workflow / methodology

AI 說做完不算數：拿證據來

哪些判斷交給死規則就夠、哪些規則根本寫不成——兩條監工 hook 的實測，把邊界畫出來。

2026年7月17日 · claude-code / hook / automation / methodology

一個模型不夠：五軸交叉審的 code review 工作流

四個 AI reviewer 全漏掉一顆死掉的 Save 按鈕，第五個抓到了。從這個案例拆我的 /pr-review command 三個設計哲學：視角是餵出來的、找的不准自己驗、模型不可信的部分用程式保證。

2026年7月8日 · Claude Code / code-review / multi-model / workflow

Claude Code 換第三方模型，換到的是有條件的韌性

換掉 Claude Code 的模型供應商，真正換到的是額度韌性。但這個韌性的備用方案會踩到中國模型的內容審查、靜默降級成 200K 的舊模型而爆炸——有條件的韌性。

2026年7月8日 · claude-code / vendor-swap / llm

Claude Code 換第三方模型的踩坑指南

把 CC 接到 DeepSeek、Kimi、GLM、Qwen 加第三方中轉站的踩坑清單：WebSearch 四種死法、計費校準、context 隱形縮水、同 endpoint 三條呼叫路徑結論完全相反、中介層破口跟 repo 活躍不同步。

2026年7月3日 · claude-code / vendor-swap / llm

我以為 Opus 沒遇到麻煩，後來發現是它根本沒在報

換 Opus 一個多月沒看到 agent 回報摩擦點，我以為沒問題。grep 一下才發現，是它根本沒在報。

2026年6月27日 · Claude Code / hook / model / llm-behavior

偷確定性層：否決整套 AI 工具後，還能帶走什麼

三題篩掉三個 AI 工具的本體後，把它們不靠 AI 的那一層拆回家。三案顯示這層移植成本最低、永遠帶得走。

2026年6月25日 · Claude Code / tool-adoption / code-review / methodology

嘴上說想要，但 agent 根本沒在用

量 revealed adoption 的方法：為什麼口頭意願不能當投資依據，怎麼從 session log 數出真實的自發採用率，還有量法本身踩過的坑。

2026年6月20日 · Claude Code / tool-adoption / subagent / methodology / revealed-preference

codebase 工具數據很強，到我 agent 手上剩不到一成

FFF 宣稱快、省 token、給 AI agent 用，但接進 Claude Code 後我的 agent 實際吃得到不到一成。一個套件值不值得接，要看它宣稱的能力到你 agent 手上實際用得到多少，四個專案的 session 統計算給你看。

2026年6月14日 · Claude Code / MCP / code-search / tool-adoption / FFF

你已經有的越多，新工具能給的越少

評估熱門 AI 工具的方法總綱：先列自己已有的，再把工具賣點一條一條對上去，多數工具會自己歸零，剩下的那一點才值得認真看。

2026年6月11日 · claude-code / tool-evaluation / methodology

讓額度不大的帳號，也能掛機過夜跑完大型研究 workflow

想讓一個跑上百 agent 的重型研究在我睡覺時自己跑完，連額度不大的帳號也扛得起。難點是它幾十分鐘就燒爆一段每 5 小時的額度，得靠 pause→resume 跨段續跑。而 resume 能不能省 token，卡在一個官方沒明說的前提：workflow 夠不夠確定性。

2026年6月8日 · claude-code / workflow / resume

下架八個月的惡意 extension 還躺在我硬碟，bumblebee 抓到了

一個下架八個月的 GlassWorm 惡意 extension 還躺在我硬碟上，被 bumblebee 掃出來。市集下架、編輯器自動更新、傳統掃描型工具都擋不住，只有掃磁碟實際安裝狀態才抓得到。

2026年6月7日 · security / supply-chain / vscode-extension / bumblebee

官方 deep-research workflow，我用 Opus 跑一次掛一次

拿官方 deep-research workflow 密集跑研究，75 個 verify agent 一次湧入、直接頂破 Anthropic 的 acceleration limit。撞名、撞限、自己 fork 一支批次節流版的復盤。

2026年6月3日 · claude-code / workflow / deep-research

ultracode workflow，別跑完就丟

dynamic workflow 是繼 skill 之後第三種「把成功流程固化成可復用資產」的載體。ultracode 的真正價值不在現場生一支腳本跑完，而在把編排本身存下來復用。三個實際遷移案例講怎麼選。

2026年6月2日 · claude-code / workflow / skill

省 token 工具：省不了多少，但風險不小

親手試了五個主打省 token 的工具，從命令列代理到上下文壓縮層 proxy，宣稱跟實測常差一截，真正的代價在風險。連那個「做對了透明可逆」的也不值得裝。

2026年6月1日 · claude-code / token / mcp

裝了一堆 codebase 搜尋工具，agent 幾乎都不用

兩個月在一個 codebase 上前後評估了 8 個程式碼搜尋工具，前 7 個 agent 幾乎都不主動用。工具有沒有能力，跟它會不會被 agent 用起來，是兩件不同的事。

2026年5月31日 · claude-code / mcp / code-search

MEMORY.md 只有 25KB，要當目錄用、別當倉庫塞

MEMORY.md 超出注入上限時有三類應對方向，但 A 類根本不存在，B 類有副作用，真正走得通的是 C，而且降 size ≠ 縮敘述。

2026年5月30日 · claude-code / memory / auto-memory

為什麼我不再相信 Explore Agent 說他做完了

LLM 工具鏈裡「報告成功」和「真的完成」差得很遠——subagent 捏造、安裝靜默失敗、排程一個月零進展、測試腳本自我推翻，四種場景、二十幾個案例，Anthropic 知道但選擇不修。

2026年5月24日 · claude-code / subagent / fabrication / verify

wiki 蓋好之後，讓它繼續活著才是真正的問題

Karpathy 的 LLM-wiki 範例給了結構，但結構不保證系統有用。不到一個月的密集迭代後，讓它持續活下去的是每天主動量健康度、由我手動拍板的迴圈，跟架構、演算法無關。

2026年5月19日 · claude-code / memory / knowledge-management / retrospective

我把自己裝的向量記憶砍掉了——928 次寫入換來 3 次搜尋

安裝 mempalace 跑了 2-3 週，hook 自動寫入 928 次，我主動查了 3 次，0.09% 的搜尋/drawer 比，6 個對照測試 grep 全勝——最後親手拔掉。

2026年5月18日 · claude-code / memory / vector-db / retrospective

AI 說它查過官方文件，但它沒有

2026-05-10 實測：同一個查詢，WebSearch 回傳 10 條連結，沒有一條是官方文件專頁。瀏覽器走真實 Google 第一條就是。

2026年5月18日 · claude-code / websearch / fact-check / retrospective