考え方と、実践のログ。

脱・人月商売、フルAI駆動の開発、透明な料金。私たちが何を考え、どう手を動かしているか。誇張のない記録として綴ります。

技術「最強モデル」より「強いharness」──frontier AIが“政策で止まる”時代のエージェント設計
Latest · 最新記事

「最強モデル」より「強いharness」──frontier AIが“政策で止まる”時代のエージェント設計

2026年6月12日、Anthropic は Claude Fable 5 / Mythos 5 を一夜で止めた。サーバー障害ではなく、米政府の輸出管理ディレクティブによる供給の遮断だ。これは Anthropic 固有の事故ではなく、各社が高能力モデルを“配信ゲート”に寄せる業界全体の流れの一コマ。frontier model はもう SaaS ではなく、供給が政策に引かれる“準インフラ”になった。ベンダーロックインの本丸は API でなく「能力アクセス/政策アクセス」へ移った──だからこそ、エージェントは「最強モデル」依存ではなく「強い harness(土台)」中心に設計する。公式声明・公開文書に基づく解説・論評。

技術「最強モデル」より「強いharness」──frontier AIが“政策で止まる”時代のエージェント設計

「最強モデル」より「強いharness」──frontier AIが“政策で止まる”時代のエージェント設計

2026年6月12日、Anthropic は Claude Fable 5 / Mythos 5 を一夜で止めた。サーバー障害ではなく、米政府の輸出管理ディレクティブによる供給の遮断だ。これは Anthropic 固有の事故ではなく、各社が高能力モデルを“配信ゲート”に寄せる業界全体の流れの一コマ。frontier model はもう SaaS ではなく、供給が政策に引かれる“準インフラ”になった。ベンダーロックインの本丸は API でなく「能力アクセス/政策アクセス」へ移った──だからこそ、エージェントは「最強モデル」依存ではなく「強い harness(土台)」中心に設計する。公式声明・公開文書に基づく解説・論評。

甲斐ショウジ10分で読めます
技術LLMチャットを守る4層 ──レート制限・Turnstile・WAF・LLMスパム判定

LLMチャットを守る4層 ──レート制限・Turnstile・WAF・LLMスパム判定

AIエージェントを公開すると、従来のWebフォームには無かった攻撃面が増える──「リクエストを1回叩くたびにLLMの請求が発生する」。御用聞きAIをローンチ前に守るために実装した、レート制限(AIコスト防衛)・Turnstile・エッジWAF・LLMによるスパム判定の4層防御を、実装ベースで解説する。鍵は、層を重ねること(defense in depth)と、安全側の“向き”を層ごとに使い分けること──コストは迷ったら止め、見込み客は迷ったら通す。

甲斐ショウジ10分で読めます
技術OpenAIが認めた、企業AIの本当のボトルネック ──「どのモデルか」より「どう業務に組み込むか」

OpenAIが認めた、企業AIの本当のボトルネック ──「どのモデルか」より「どう業務に組み込むか」

2026年6月14日、OpenAI自身が Partner Network の発表で言い切った——企業がAIから価値を出せない原因は、もうモデルの性能ではない。足りないのは、ユースケースの見極め・ワークフローの再設計・既存システム統合・人の定着だ。1.5億ドル投資と30万人の認定計画、Frontier/Academyとの一本の線、AgilentとeBayの証拠強度の違いを整理し、AI導入支援の売り物が「モデル選定」から「導入の設計」へ移ったことを、現場目線で読み解く。

甲斐ショウジ13分で読めます
技術「良いプロンプト」の次は、「良いループ」だった ──Codex・Claude Code・GitHub・Grokが向かう、AI開発の新しい主戦場

「良いプロンプト」の次は、「良いループ」だった ──Codex・Claude Code・GitHub・Grokが向かう、AI開発の新しい主戦場

2026年6月のほんの数日で、AI開発の前提が静かにずれた。Addy Osmaniが「ループ・エンジニアリング」を言語化し、GitHub・Anthropic・xAI・OpenAI Codexが揃って同じ部品——並列サブエージェント・検証・外部状態・定時実行——を押し出した。勝負軸は「うまく頼む」から「うまく回す」へ。maker/checker/stateという補助線で各社の製品を読み解き、私たちCAG自身がすでにこのループで記事も製品も作っているという一次情報まで、現場目線で整理する。

甲斐ショウジ12分で読めます
制作事例技術このサイトのAIは、自分たちで作った ──HITL・顧客別メモリ・メール⇄チャット双方向を実装した顧客対応AIの中身

このサイトのAIは、自分たちで作った ──HITL・顧客別メモリ・メール⇄チャット双方向を実装した顧客対応AIの中身

CAGサイトの問い合わせに一次対応しているAIは、自分たちで実装した。マルチテナント基盤、RAGと顧客別メモリを持つエージェント、見積もりは人間に渡すHITL設計、メールへの返信がそのままチャットになる双方向統合、そして「全部実機で確かめた」自動検証42項目——本番品質の顧客対応AIを、AI駆動開発で1日で本番稼働に乗せた制作記録。何を作り・どう守り・何をAIに任せないかの設計判断が、速さの主役だ。

甲斐ショウジ10分で読めます
制作事例技術Markdownは、もう卒業。AIが作る"見栄えするHTML"を、安全に共有できるようにした話

Markdownは、もう卒業。AIが作る"見栄えするHTML"を、安全に共有できるようにした話

AIに資料を作らせるとmdで返るが、記号が残り表は崩れ、見せるには不向き。今のAIはHTMLが得意で、整った資料を一瞬で書ける。でもHTMLは共有が難しい——DLの手間・見た目崩れ・流出不安。そこで、アップロードすると専用URLが出て、DLなしでセキュアに閲覧できるツールを作った。推測困難URL+認証+直リンク遮断+閲覧ログ。テキストからAIがHTML生成も。作れると届けられるは別問題。

甲斐ショウジ10分で読めます
技術制作事例「LINE WORKSに流れて消える知識」を、AIで取り戻す——社内ナレッジBotを数日で本番投入した話

「LINE WORKSに流れて消える知識」を、AIで取り戻す——社内ナレッジBotを数日で本番投入した話

46万社が使うLINE WORKS。便利すぎるチャットは、同時に"知識が流れて消える川"でもある。会話を勝手にナレッジ化し、根拠つきで答える社内Botを、人月ではなくAI駆動で——数日で本番稼働まで持っていった実装記録。

甲斐ショウジ10分で読めます
制作事例経営 "〇〇市" の政策への声 速報 4 SNS 合算 ・ 24時間ごと更新 すべてXInstagramFacebookThreads 総投稿数1,240 感情スコア+0.43 ポジティブ率58% エンゲージ2,980 投稿数の時系列推移 過去7日間・日次 プラットフォーム別 1,240 総投稿数 CASE STUDY · 制作事例 × 経営 数ヶ月の人力を、 AIで1日に畳む。 自治体向けSNS分析ダッシュボードを、実働1日で本番投入した話 電脳技巧集団(AI職人ギルド)

『これ、数ヶ月かかりますよね』を、1日でひっくり返した話

「これ、数ヶ月かかりますよね」——その見積もりの“常識”を、フルAI駆動で覆した制作事例。自治体向けSNS分析ダッシュボードを、実働1日・8コミットでログイン付き本番まで。チャート7種を外部ライブラリ0で実装し、設計判断ごと開示する。

甲斐ショウジ10分で読めます