AI開発の​差は​「速い​モデル」より​「速く​“安全に​”働ける​職場」で​決まる

2026年6月29日、Claude Opus 4.8 の fast mode が GitHub Copilot でプレビューに。賢さを落とさず出力だけ速くする——反復の速いAI開発では効く。でも毎日AIにコードを書かせていると分かる:優秀で速いモデルでも、ブランチが混ざり・repoのルールを知らず・過去の判断を忘れ・危険なsetupを実行し・UIのブランド文脈も無ければ、速く迷い・速く壊し・速くレビュー漏れするだけ。速さは方向を持たない。前回「作業環境へ移った」の続編として、速いモデルが“安全に”働ける職場をAIから見た5階層で整理する:①速度(fast mode/低遅延を使い分け)②分離(worktreeで机を分ける・GitHub Desktop 3.6)③記憶(AGENTS.md+codebase-memory-mcpで社内Wiki・地図/MIT・約21,660★)④安全(SkillSpectorで入館ゲート=README主張で調査スキルの26.1%に脆弱性/5.2%に悪意の可能性・Apache-2.0・約11,482★/Copilotレビュー深度・MCP最小権限)⑤文脈(DESIGN.mdでUIをtoken+根拠で渡す・約23,268★)。CAGが受託で標準化する職場パッケージも一次情報で紹介。結論は足し算でなく掛け算=速いモデル×安全に働ける職場。これからのAI開発者はモデル選定者でなくAI workplace designerになる。数値は公式/GitHub上の主張でCAG非検証。

甲斐ショウジ甲斐ショウジ
CAG主宰/合同会社ATK CAIO(最高AI責任者)
技術11分で読めます
技術AI開発の差は「速いモデル」より「速く“安全に”働ける職場」で決まる

技術ノート | AI駆動開発の現場から

AIにコードを書かせる話になると、つい「どのモデルが一番速いか・賢いか」に目が行く。実際、2026年6月29日には Claude Opus 4.8 の fast mode が GitHub Copilot でプレビュー提供された。[1] 賢さを落とさずに応答だけ速くする——反復の速いAI開発では、たしかに効く。けれど毎日AIにコードを書かせていると、もう一つの現実が見えてくる。

優秀で速いモデルを入れても、作業ブランチが混ざり、repoのルールを知らず、過去の判断を忘れ、危険なsetupスクリプトをそのまま実行し、UIのブランド文脈も持っていなければ、成果は安定しない。速いモデルは、散らかった職場では速く迷い、速く壊し、速くレビュー漏れするだけになる。

これは前回の続きの話だ。前回は「AI開発の主戦場はモデル比較から作業環境へ移った」という全体像を書いた。今回はそのサブテーマ——速いモデルが"安全に"働ける職場をどう作るかに絞る。私たち電脳技巧集団(AI職人ギルド)が受託開発でCodexやClaude Codeを毎日回している現場から、モデルを社員、職場を作業環境に見立てて整理する。なお外部ツールの数値・スター数は確認時点(2026-06-30)のGitHub・公式情報に基づくもので、CAGが独自に検証したものではない。

作業環境論の前回記事のサムネイル 関連記事 | 前回(全体像)AI開発の主戦場は、モデル比較から「作業環境」へ移った ──モデルは脳、harnessは職場
ダークな近未来オフィスの入口。手前にセキュリティの入館ゲート(バッジ認証)、その奥に整理された作業デスク、worktreeの画面、社内Wikiのパネル、ブランドガイドのボード。速いAIが安全に入って働ける整った職場の様子。シアンとゴールドのアクセント
速いモデル(社員)を、速く"安全に"働ける職場へ。入館ゲート・机・社内Wiki・ブランドガイドが揃って初めて、速さが成果になる

01速い​モデルは​諸刃 ──散らかった​職場では​速く​間違える

まず速度から。Claude Opus 4.8 fast mode は、モデルを小さいものに落とさず同じ賢さのまま出力を速くするプレビュー機能だ。[1] Copilotでは Pro+ / Max / Business / Enterprise 向けに提供され、Business / Enterprise では管理者ポリシーでの有効化が要る。速さは反復量を増やす——同じ時間でより多く試せる。ここまでは良い話だ。

同じ「速いモデル」でも、職場で結果が反転する 散らかった職場 速いモデル 速く迷う 速く壊す 速くレビュー漏れ 整った職場 速いモデル 速く試す 速く直す 速く積み上げる
速さは中立だ。整った職場では「速く試す・速く直す」になり、散らかった職場では「速く迷う・速く壊す」になる。差は職場のほうにある

問題は、速さが方向を持たないことだ。職場が整っていれば「速く試して速く直す」になり、散らかっていれば「速く間違える」になる。だから速いモデルを入れるほど、その速さを受け止める職場の設計が効いてくる。職場を、AIから見た5つの要素——速度・分離・記憶・安全・文脈——で順に見ていく。

02分離と​記憶 ──机を​分け、​社内Wikiを​持たせる

速さの次は分離だ。複数のAIセッションを並列で動かすと、いちばん最初に起きるのが「作業が混ざる」事故になる。GitHub Desktop 3.6 が worktree をGit作業面に入れたのは象徴的で、作業ブランチを物理的に分けて、AIの机を1人1台にする発想だ。[2] 1つの机に複数の仕事を広げさせない。

次が記憶。AIは毎回repoを総当たりで読むと、遅く・高コストで・見落とす。ここを担うのが2層ある。ひとつは AGENTS.md のようなrepo固有の指示ファイル——GitHubも repository custom instructions として正式に扱い、AIの作業文脈になる。[3] もうひとつが codebase-memory-mcp のような記憶層で、repoをナレッジグラフにして総当たりでなく構造検索させる。READMEは「トークン約10分の1・ツール呼び出し約2.1分の1」をうたう(確認時点で約21,660★・MIT。数値はREADME上の主張で第三者再現は未確認)。[4]

分離(机)と 記憶(社内Wiki・地図) worktree = 机を分ける branch / feature-a branch / fix-b branch / review-c AGENTS.md + repo記憶 = 地図 AGENTS.md module api db auth ui
左=worktreeで机を分け、並列作業が混ざらないようにする。右=AGENTS.mdと記憶層でrepoの地図を持たせ、総当たりでなく構造検索に寄せる

03安全 ──道具は​"入館ゲート"で​点検してから​渡す

速くて記憶もあるAIに、新しいスキルやMCPをどんどん渡したくなる。ここが今回いちばん強調したい点だ。スキルやMCPを増やすほど、便利さと一緒に"攻撃面"も増える。AIの手元に置く道具は、渡す前に点検したい。

ダークなセキュリティスキャナーのUIモック。AIエージェントのスキルとMCPの一覧が並び、各項目に安全・脆弱性あり・悪意の可能性のフラグが付き、入館ゲートで点検されている様子。一部に控えめな赤の警告。シアンとゴールド
スキルやMCPは、増やすほど攻撃面が広がる。導入前にスキャンする"入館ゲート"を職場に置く

これを担うのが SkillSpector(NVIDIA)のようなスキャナーだ。AIエージェントのスキルやMCPの脆弱性・悪意あるパターンを導入前に検出する。[5] READMEは問題提起として「調べたスキルの26.1%に脆弱性、5.2%に悪意の可能性」という数字を挙げている(確認時点で約11,482★・Apache-2.0。この数値はREADMEの主張で、元研究・母集団はCAG未検証)。[5] 数字の精度はさておき、「スキルは無条件に安全ではない」という前提に立たせてくれる。

安全は1つの道具で完結しない。Copilotのコードレビューが「深さ(review depth)」を設定でき、重要変更を深く読むようになったのも、[6] MCPの権限を最小に絞るのも、同じ「職場の安全設備」だ。スキャナーは入館ゲート、レビュー深度は重要書類のダブルチェック、権限の絞り込みは鍵の管理——どれか一つでなく、束で効く。

MCPは権限レイヤーだ、の記事サムネイル 関連記事 | "鍵の管理"をもっと詳しくMCPは便利な拡張機能ではなく、権限レイヤーだ

04文脈 ──UI・ブランドも​職場に​持ち込む

最後の要素が文脈、とくにデザインだ。AIにUIを作らせると、毎回「それっぽいけど自社らしくない」画面が出てくる。原因は、AIに渡しているのが「雰囲気」だけで、判断の根拠(design tokensと理由)が無いからだ。

ここを埋めようとするのが DESIGN.md(google-labs-code)という仕様で、ビジュアルアイデンティティやデザインシステムを、コーディングエージェントへtokenと根拠(rationale)として渡す[7] 確認時点で約23,268★・Apache-2.0。色やフォントの値だけでなく「なぜそうするか」を持たせることで、UI生成の当たり外れを減らそうという発想だ。

UIは「雰囲気」でなく「token+根拠」で渡す 雰囲気だけ渡す 毎回ばらつく DESIGN.md(token+根拠) ブランドが揃う
左=雰囲気だけ渡すとUIが毎回ばらつく。右=design tokenと「なぜ」を渡すと、AIが作っても自社らしさが揃いやすい

ただし注意も要る。DESIGN.mdはブランド文脈の入口であって、完成品質の保証ではない。実務では既存コンポーネント、実画面のスクリーンショット検証、Playwrightでの見た目チェックも要る。それでも「UIもAIの職場に持ち込む対象だ」という視点は効く。

05CAGの​AI職場パッケージ ──速度・分離・記憶・安全・​文脈の​5階層

ここからは現場の一次情報だ。私たちは受託開発でCodexやClaude Codeを毎日使うが、案件の品質を決めているのは「どのモデルか」より、どのrepoでも同じ"職場"を最初に組むことだと感じている。AIから見た職場を、次の5階層で標準化している。

ダークなUIモック。AIの職場を、速度・分離・記憶・安全・文脈の5階層スタックとして可視化した図。各層に道具のラベル(fast mode/worktree/AGENTS.md・memory/scanner・権限/DESIGN.md)。シアンとゴールド
速度・分離・記憶・安全・文脈。AIの職場を5階層で標準化すると、どのrepoでも同じ土台で速く安全に回せる
階層職場のたとえ道具・標準化していること
速度社員の脚力fast modeや低遅延モデルを、タスクの重さで使い分ける
分離机を分けるworktree / branch / PR / preview で並行作業を混ぜない
記憶社内Wiki・地図AGENTS.md・docs/TASKS・記憶層で構造検索に寄せる
安全入館ゲート・鍵スキャン・MCP権限の最小化・削除/デプロイの承認ゲート
文脈ブランドガイドdesign token+根拠・実画面のスクショ/Playwright検証

※ 道具名は一例。重要なのは「5階層を最初に組む」こと自体で、特定の製品に依存しない(モデルが新しくなっても作り直さなくてよい)。

この5階層はどれも特定のモデルに縛られない。だから速いモデルが来たら、整った職場で旧モデルと並べて走らせ、自分たちの作法を守れるかを確かめてから乗り換える。速い社員を雇う前に、職場が整っているか。これがCAGの順番だ。

06とは​いえ ──「職場さえ​あれば」も​「速ければ」も​誇張

反対側も正直に書く。「速いモデルは要らない」も「職場を整えれば全部解決」も、どちらも言い過ぎだ。差がつく軸が増えただけで、答えは足し算ではなく掛け算になる。

  • 速いモデルは重要。反復量を増やすのは速さだ。設計・抽象化・セキュリティ判断・未知のバグ調査では、強く速いモデルがはっきり効く。
  • でも速さは方向を持たない。職場設計が弱いと、速いモデルは高速に間違える。速さは、整った職場で初めて成果になる。
  • worktreeは外部状態を分離しない。机は分けられても、DB・外部API・Vercel/Supabase・本番データは共有されたまま。ここは別の注意が要る。
  • 記憶は古くなる。古いindexや誤ったグラフはAIを自信たっぷりに誤誘導する。更新・再index・出典確認をセットにする。
  • スキャナーは最後の保証ではない。導入前スキャンに加えて、サンドボックス・人間レビュー・権限最小化・秘密値管理が要る。
  • DESIGN.mdは入口。ブランド文脈は渡せても、完成品質は実画面の検証で確かめる。

だから結論はシンプルだ。速いモデル × 速く安全に働ける職場。どちらかがゼロなら成果もゼロに近づく。これからのAI開発者は、最強・最速モデルを当てる人ではなく、速いAIが安全に働ける職場を設計する人になる。モデルを雇う時代から、AIの職場を設計する時代へ。次の差分は、社員の銘柄ではなく職場のほうにある。

AI開発の見方速いモデルだけ速いモデル × 安全に働ける職場
速度速く回す=正義速さを受け止める職場とセット
並行作業ブランチが混ざるworktreeで机を分ける
repo理解毎回総当たりAGENTS.md+記憶層で構造検索
道具の追加便利だから即導入スキャン+最小権限で点検
UI生成雰囲気で出すtoken+根拠+実画面検証
新モデル対応来るたび振り回される同じ職場で差分検証して乗り換え

※ 上表は「見方」の対比であり、モデル速度を軽視するものではない。差がつくのは「速いモデル + 安全に働ける職場」の掛け算。外部ツールの数値・スター数は公式/GitHub上の主張でCAG非検証。

出典・脚注

  1. GitHub Changelog「Claude Opus 4.8 fast mode is now in preview for GitHub Copilot」(2026-06-29)。Pro+ / Max / Business / Enterprise 向けプレビュー、Business / Enterprise は管理者ポリシーが必要。fast modeはモデルを小型化せず出力を速くするもの。
    https://github.blog/changelog/2026-06-29-claude-opus-4-8-fast-mode-is-now-in-preview-for-github-copilot/
  2. GitHub Changelog「GitHub Desktop 3.6 — worktrees and deeper Copilot integration」(2026-06-26)。worktree対応、commit authoring、merge conflict支援、model picker、BYOK、AGENTS.md / copilot-instructions 参照。
    https://github.blog/changelog/2026-06-26-github-desktop-3-6-worktrees-and-deeper-copilot-integration/
  3. GitHub Docs「repository custom instructions(AGENTS.md 等)」。repo固有の指示ファイルがAIの作業文脈として参照される。
    https://docs.github.com/en/copilot/how-tos/configure-custom-instructions/add-repository-instructions
  4. codebase-memory-mcp(DeusData・GitHub)。repoをpersistent knowledge graph化し構造検索できるMCPサーバー。MIT・確認時点(2026-06-30)約21,660★。「トークン約10分の1・ツール呼び出し約2.1分の1」等の性能値はREADME上の主張で第三者再現は未確認。
    https://github.com/DeusData/codebase-memory-mcp
  5. SkillSpector(NVIDIA・GitHub)。AI agent skills / MCP の脆弱性・悪意あるパターンを検出するスキャナー。Apache-2.0・確認時点 約11,482★。READMEの「26.1%に脆弱性/5.2%に悪意の可能性」は問題提起としての数値で、元研究・母集団はCAG未検証。
    https://github.com/NVIDIA/SkillSpector
  6. GitHub Changelog「Copilot code review: analysis depth and efficiency updates」(2026-06-25)/「Shape Copilot code review around your team」(2026-06-02)。review depth(深さ)の設定、MCP servers、agent skills、grep/rg/glob/view 等のfile探索ツール。
    https://github.blog/changelog/2026-06-25-copilot-code-review-analysis-depth-and-efficiency-updates/
  7. design.md(google-labs-code・GitHub)。ビジュアルアイデンティティ/デザインシステムを design token と根拠としてコーディングエージェントへ渡す仕様。Apache-2.0・確認時点 約23,268★。
    https://github.com/google-labs-code/design.md

AIが​速く​"安全に​"働ける​職場を、​一緒に​設計しませんか

速度・分離・記憶・安全・文脈の5階層(fast model運用・worktree・AGENTS.md・記憶層・MCP権限・DESIGN.md)まで、AI駆動開発の土台づくりをご相談いただけます。気軽にどうぞ。

CAGに相談する

言語化できるものは、全て作る。

あなたの「作りたい」を、定価とスピードで形に。まずは無料の相談から。

制作事例を見る