Anthropic 內部研究: AI 如何徹底改變他們自己的工作方式
看到 Anthropic 這篇 How AI Is Transforming Work at Anthropic,覺得非常值得一讀。他們做了一件很有意思的事: 把研究對象轉向自己,調查了 132 位 Anthropic 工程師和研究員,做了 53 場深度訪談,加上分析內部 Claude Code 的使用數據,來看 AI 到底怎麼改變了他們的工作。
雖然 Anthropic 自己研究自己,樣本有偏差是一定的,但作為 AI 最前線的使用者,他們的經驗對整個產業來說很有參考價值——現在發生在他們身上的事,可能就是其他產業接下來會面對的。
以下摘重點:
📊 生產力數據
-
工程師自報在 60% 的日常工作中使用 Claude,感覺生產力提升了 50%,跟一年前比大概翻了 2-3 倍。這跟他們內部觀察到採用 Claude Code 後每日 merged PR 增加 67% 的數據大致吻合。
-
有趣的是,生產力提升主要來自產出量大幅增加,而不是每件事花的時間少很多。也就是說,每個任務類別花的時間略減,但整體產出量明顯上升。
-
27% 的 Claude 輔助工作是「本來根本不會做的事」——像是做 interactive data dashboard、修一些生活品質的小 papercut、跑探索性實驗等。以前成本效益不划算的事,現在可以做了。
-
不過超過一半的人表示只能「完全委派」0-20% 的工作給 Claude,大部分還是需要密切協作和驗證。Claude 是持續的協作者,不是甩手掌櫃。
🧠 委派策略
工程師們發展出了一套 AI delegation 的直覺,傾向把以下類型的任務交給 Claude:
- 容易驗證的: 「驗證成本遠小於產出成本的任務,效果超好」
- 定義明確、可獨立的: 子模組夠 decouple 的就丟給 Claude
- 無聊重複的: 「我越不想做的任務,越可能用 Claude」——44% 的 Claude 輔助工作是工程師自己不想做的
- 自己不熟但複雜度不高的: Git、Linux 操作之類的
反過來,高層設計、需要品味判斷、需要組織 context 的任務,大家還是傾向自己做。不過這個邊界是「moving target」,隨著模型進步不斷重新談判中。
有個工程師用 Google Maps 的比喻很精準: 一開始只在不認識的路用、後來熟悉的路也用、現在每天通勤都用,完全信任它的判斷。Claude 的使用軌跡也是這樣。
🔀 人人都在變 Full-stack
這是我覺得最有意思的發現之一。後端工程師靠 Claude 做出複雜的 UI,設計師看了問「等等,這你做的?」,答: 「不是,Claude 做的,我只是 prompt 它。」
Security 團隊用 Claude 分析不熟的程式碼,Alignment 團隊用它做前端資料視覺化,非技術人員用它 debug 網路問題和 Git 操作。每個人的技能邊界都在擴張。
原本要排 meeting、等人、迭代好幾週的流程,現在變成「幾小時的工作坊」就搞定了。
⚠️ 技能萎縮的隱憂
但硬幣的另一面是: 當 Claude 直接帶你到答案,你就跳過了那些「附帶學習」的過程。
以前自己 debug 一個難題,你會花時間讀 docs、讀不直接相關的 code,整個過程中你在建立對系統的心智模型。現在這些都變少了,因為 Claude 可以直接帶你到問題所在。
這引出了一個「監督悖論」(paradox of supervision): 有效使用 Claude 需要監督能力,而監督能力需要的正是那些可能因為過度依賴 AI 而萎縮的 coding 技能。有些資深工程師會刻意偶爾不用 AI 來保持手感。
不過也有人挑戰這個前提: 「擔心生疏的前提是假設 coding 會回到 Claude 3.5 之前的樣子,我不認為會。」就像從低階語言到高階語言的轉變,每次抽象化都有代價,但沒人會想回去寫 assembly。
👥 社交動態的改變
Claude 現在是問問題的第一站,以前會問同事的事,80-90% 先問 Claude。有資深工程師感嘆:
比較少 junior 的人來問我問題了,雖然他們確實學得更快更有效。
有人享受減少社交摩擦(不用擔心佔同事時間),有人則覺得失落(「我其實不喜歡大家的回應都是『你問過 Claude 了嗎?』」)。mentorship 的模式正在改變。
🔮 職涯不確定性
很多工程師覺得自己的角色正在從「寫 code」變成「管理 AI agent」——有人估計 70% 以上的時間已經變成 code reviewer 而不是 writer。
對於長期前景,情緒很複雜:
「短期我很樂觀,但長期我覺得 AI 會做完所有事,讓我和很多人變得無關緊要。」
「感覺每天上班就是在讓自己失業。」
但也有人比較務實: 「沒人知道接下來會怎樣,重要的是保持適應力。」
Claude Code 使用趨勢
從實際數據來看,六個月前 Claude Code 平均做 10 個動作就需要人介入,現在可以連續做 21 個。用來做 design/planning 的比例從 1% 漲到 10%,implement new features 從 14% 漲到 37%。人類介入的次數減少了 33%。
這篇研究最有價值的地方,不只是那些生產力數字,而是它非常誠實地呈現了 AI 轉型過程中的矛盾和張力: 更高的產出 vs. 技能萎縮、更多自主 vs. 更少協作、短期樂觀 vs. 長期焦慮。
這些張力不只是 Anthropic 的問題。任何正在大量使用 AI coding 工具的團隊,大概都在經歷類似的事。怎麼在效率和學習之間找到平衡、怎麼重新定義 mentorship、怎麼面對職涯的不確定性——這些都是我們這個產業接下來要認真思考的。