Anthropic 內部研究: AI 如何徹底改變他們自己的工作方式

看到 Anthropic 這篇 How AI Is Transforming Work at Anthropic，覺得非常值得一讀。他們做了一件很有意思的事: 把研究對象轉向自己，調查了 132 位 Anthropic 工程師和研究員，做了 53 場深度訪談，加上分析內部 Claude Code 的使用數據，來看 AI 到底怎麼改變了他們的工作。

雖然 Anthropic 自己研究自己，樣本有偏差是一定的，但作為 AI 最前線的使用者，他們的經驗對整個產業來說很有參考價值——現在發生在他們身上的事，可能就是其他產業接下來會面對的。

以下摘重點:

📊 生產力數據

工程師自報在 60% 的日常工作中使用 Claude，感覺生產力提升了 50%，跟一年前比大概翻了 2-3 倍。這跟他們內部觀察到採用 Claude Code 後每日 merged PR 增加 67% 的數據大致吻合。
有趣的是，生產力提升主要來自產出量大幅增加，而不是每件事花的時間少很多。也就是說，每個任務類別花的時間略減，但整體產出量明顯上升。
27% 的 Claude 輔助工作是「本來根本不會做的事」——像是做 interactive data dashboard、修一些生活品質的小 papercut、跑探索性實驗等。以前成本效益不划算的事，現在可以做了。
不過超過一半的人表示只能「完全委派」0-20% 的工作給 Claude，大部分還是需要密切協作和驗證。Claude 是持續的協作者，不是甩手掌櫃。

🧠 委派策略

工程師們發展出了一套 AI delegation 的直覺，傾向把以下類型的任務交給 Claude:

容易驗證的: 「驗證成本遠小於產出成本的任務，效果超好」
定義明確、可獨立的: 子模組夠 decouple 的就丟給 Claude
無聊重複的: 「我越不想做的任務，越可能用 Claude」——44% 的 Claude 輔助工作是工程師自己不想做的
自己不熟但複雜度不高的: Git、Linux 操作之類的

反過來，高層設計、需要品味判斷、需要組織 context 的任務，大家還是傾向自己做。不過這個邊界是「moving target」，隨著模型進步不斷重新談判中。

有個工程師用 Google Maps 的比喻很精準: 一開始只在不認識的路用、後來熟悉的路也用、現在每天通勤都用，完全信任它的判斷。Claude 的使用軌跡也是這樣。

🔀 人人都在變 Full-stack

這是我覺得最有意思的發現之一。後端工程師靠 Claude 做出複雜的 UI，設計師看了問「等等，這你做的？」，答: 「不是，Claude 做的，我只是 prompt 它。」

Security 團隊用 Claude 分析不熟的程式碼，Alignment 團隊用它做前端資料視覺化，非技術人員用它 debug 網路問題和 Git 操作。每個人的技能邊界都在擴張。

原本要排 meeting、等人、迭代好幾週的流程，現在變成「幾小時的工作坊」就搞定了。

⚠️ 技能萎縮的隱憂

但硬幣的另一面是: 當 Claude 直接帶你到答案，你就跳過了那些「附帶學習」的過程。

以前自己 debug 一個難題，你會花時間讀 docs、讀不直接相關的 code，整個過程中你在建立對系統的心智模型。現在這些都變少了，因為 Claude 可以直接帶你到問題所在。

這引出了一個「監督悖論」(paradox of supervision): 有效使用 Claude 需要監督能力，而監督能力需要的正是那些可能因為過度依賴 AI 而萎縮的 coding 技能。有些資深工程師會刻意偶爾不用 AI 來保持手感。

不過也有人挑戰這個前提: 「擔心生疏的前提是假設 coding 會回到 Claude 3.5 之前的樣子，我不認為會。」就像從低階語言到高階語言的轉變，每次抽象化都有代價，但沒人會想回去寫 assembly。

👥 社交動態的改變

Claude 現在是問問題的第一站，以前會問同事的事，80-90% 先問 Claude。有資深工程師感嘆:

比較少 junior 的人來問我問題了，雖然他們確實學得更快更有效。

有人享受減少社交摩擦（不用擔心佔同事時間），有人則覺得失落（「我其實不喜歡大家的回應都是『你問過 Claude 了嗎？』」）。mentorship 的模式正在改變。

🔮 職涯不確定性

很多工程師覺得自己的角色正在從「寫 code」變成「管理 AI agent」——有人估計 70% 以上的時間已經變成 code reviewer 而不是 writer。

對於長期前景，情緒很複雜:

「短期我很樂觀，但長期我覺得 AI 會做完所有事，讓我和很多人變得無關緊要。」

「感覺每天上班就是在讓自己失業。」

但也有人比較務實: 「沒人知道接下來會怎樣，重要的是保持適應力。」

Claude Code 使用趨勢

從實際數據來看，六個月前 Claude Code 平均做 10 個動作就需要人介入，現在可以連續做 21 個。用來做 design/planning 的比例從 1% 漲到 10%，implement new features 從 14% 漲到 37%。人類介入的次數減少了 33%。

這篇研究最有價值的地方，不只是那些生產力數字，而是它非常誠實地呈現了 AI 轉型過程中的矛盾和張力: 更高的產出 vs. 技能萎縮、更多自主 vs. 更少協作、短期樂觀 vs. 長期焦慮。

這些張力不只是 Anthropic 的問題。任何正在大量使用 AI coding 工具的團隊，大概都在經歷類似的事。怎麼在效率和學習之間找到平衡、怎麼重新定義 mentorship、怎麼面對職涯的不確定性——這些都是我們這個產業接下來要認真思考的。

原文: How AI Is Transforming Work at Anthropic