AIネイティブなエンジニアリング組織の運営

#Tech

AIネイティブなエンジニアリング組織の運営 AI時代の開発プロセスの変革

エージェント型コーディング技術の導入により、ソフトウェア開発におけるボトルネックは「コードを書く時間」から「検証とレビュー」へと移行しています。

その結果、開発組織は従来のプロセスを根本的に見直し、長期的なロードマップではなくジャストインタイム(JIT)型のプロトタイピングに移行しました。

また、技術的な質問の回答源も人間からAIに移り、コードレビューではスタイルチェックなどをAIが担う一方、人間はドメイン専門知識に基づく「検証」に注力しています。

さらに役割境界線が曖昧になり、エンジニアやプロダクトマネージャーの職務が多様化しました。

成功指標として、オンボーディング期間短縮、PRサイクルタイムの低下、AI支援コミットメント数の増加を追跡することが推奨されています。

AIネイティブな組織運営は、従来のエンジニアリングの常識を根底から覆しています。Anthropic社のClaude Codeチームが実践しているのは、生成AI(ジェネレーティブAI)を開発プロセスの中核に据えることで、ソフトウェア開発における「時間」と「人手」というボトルネックそのものを変革する試みです。本記事では、彼らがどのようにして組織の働き方や意思決定の仕組みを再構築したのかを解説します。

計画策定からJITへの転換

従来、ソフトウェア開発は「コーディング時間」が高コストであったため、詳細な6ヶ月単位のロードマップを作成し、綿密に事前計画を行うのが常識でした。しかし、Claude CodeチームではAIがコード生成を担うことで開発速度とスループットが劇的に向上しました。その結果、従来の長期的な設計ドキュメント作成から脱却し、「ジャストインタイム(JIT)プランニング」へと移行しています。

具体的には、まずはプロトタイプを作成し、社内ユーザーに試用してもらいながらフィードバックを基に迅速に行動するというサイクルを採用しているとのことです。これにより、変化の激しい市場環境に対応しながら、無駄な事前レビューを減らしています。

情報収集とコードレビューの変化

AIが多くの作業を引き受けることで、組織内のコミュニケーションや検証プロセスも大きく変わりました。従来の「誰が書いたか」という問いは意味を持たなくなり、代わりにClaudeに直接質問し、「本当に知りたいこと」を深掘りするアプローチが主流です。

コードレビューにおいても、AI(Claude)がスタイルチェックやバグ検出、テスト生成といった定型的な作業を担当します。人間が介入するのは、法務リスクの判断やセキュリティに関わる領域など、「専門知識(ドメインエキスパート)」が必要な部分に限定されています。信頼と検証のバランスを常に評価し続けることが重要だと説明しています。

役割の流動化と人材要件

AIネイティブな環境では、職務上の役割が従来の境界線を越えて融合(ブレンド)しています。プロダクトマネージャー(PM)がプロトタイピングを行うなど、非伝統的なコーディングをこなすケースが増えています。

このチームは、単なる「生産性」ではなく、「創造的なビルダー」(問題解決に情熱を持つ人)と「深いシステム知識を持つエンジニア」という二つの特性を持つ人材に重点を置いて採用を行っているとのことです。AIが処理するタスクの量を追うのではなく、人間ならではの専門的知見が必要な箇所にリソースを集中させているのが特徴です。

まとめ

Claude Codeチームの事例は、生成AIが単なるツールではなく、組織構造そのものを変革する「触媒」となり得ることを示しています。開発プロセスにおけるボトルネックが人手から知識や判断へとシフトする中で、企業はいかにして新しい働き方と人材戦略を構築していくかが問われています。

原文の冒頭を表示(英語・3段落のみ)

For years, engineering bandwidth was the expensive part of building applications. Every process we used to have around software planning and shipping, first waterfall and then agile, was built around that cost. I started my career in the early 2000s working on Visual Studio. In those days we shipped software on CD-ROMs with hard manufacturing deadlines. Once we could distribute software online, we began increasing to shipping updates continuously. Now we’re changing the way we work again, this time around the time and people it takes to write software. On the Claude Code team, writing code, writing tests, and refactoring rarely slows us down anymore. But the bottlenecks didn’t go away when agentic coding took away the actual need to type code. Verification, code review, and security took their place.We can all generate a lot of code really fast now, but this also brings up new questions: Is this code correct? How is it maintained? And one of the top questions I get from fellow engineering leaders: “How are humans keeping up with how you’re doing code reviews?” The processes that quietly stopped workingWe all put processes in place for a reason, to close a gap or make something work better. But when that gap no longer exists and those processes become obsolete, they rarely go away on their own. When the Claude Code team began using agentic coding as our default way of working, a lot of our existing processes stopped working. Here are the norms we rewrote, and why. Planning: shift roadmaps to just in timeThe old norm was to spend a lot more time pre-planning because coding time was expensive. When I first joined the Claude Code team, we wrote a pretty good six month roadmap, and then because of Claude Code, so many things changed that it was out of date by month three. Engineering speed and throughput is different now, so the way we plan sprints has changed. I call it just-in-time (JIT) planning, almost like JIT compiling: how do you do just the right amount at the right time? Our planning ritual shifted away from design docs toward discussions in PRs or prototypes. The space moves fast so we don’t do a lot of product reviews. Our process now is let's prototype, get a lot of internal users on it, and start acting on their feedback.Context gathering: ask Claude, not the authorWhen engineers wrote code, the first step to getting an answer to most questions was to find the person who wrote the code. Now, since all our PRs are assisted by Claude, "Who made this change?" is no longer sufficient. Our new norm is to go a level deeper: what do you actually need to know? For instance: Are you looking for who caused a regression? An expert to answer a customer question? Or context on a decision? You ask Claude that question, and consider whether Claude can answer it directly, also with more data and context.On the Claude Code team, no matter what that question is, our process is to also ask “Is there a way to automate it?” For example, having Claude summarize customer feedback channels every morning went from a ritual I did manually with my coffee to something I just have running automatically in the background.Code review: trust but verifyWe use Code Review heavily. Claude handles all the style and linting, PR feedback requests, catching bugs and fixing them before a full commit, and adding tests. Where we still definitely want a human is expertise. The new norm is human review where it matters: for legal review, I always want my legal partner involved in risk tolerance. For trust boundaries and security-sensitive code, I want the domain experts. Product managers and designers also need to be involved with product sense and taste. It’s important to continually evaluate, though, because the right balance of trust vs. verify will keep changing as the models improve. What you need humans for today might look different with the next model.Team makeup: blurring rolesClaude and AI have reshaped roles across the team. Our PMs code a lot now, which is fun to see. With Claude, you have nontraditional coders now being able to do more engineering, and you have engineers who take on things like content and design, work that were traditionally not on the technical side. On the Claude Code engineering team, I’ve indexed heavily on two profiles. One is creative builders with product sense: the dreamers who are deeply curious and passionate about shipping products that solve problems. The other one is engineers with deep systems expertise. For example, when I joined the team, I noticed we were missing experts with systems backgrounds and we needed that when building Claude Code on the Web, to ensure we can run Claude everywhere. What I index on less, on the other hand, is raw throughput; the models handle that. The more important question is where you still need human expertise, and that’s where I’d focus.

Before

After

※ 著作権に配慮し、引用は冒頭3段落までです。続きは元記事をご覧ください。

元記事を読む ↗