考え方と、実践のログ。

脱・人月商売、フルAI駆動の開発、透明な料金。私たちが何を考え、どう手を動かしているか。誇張のない記録として綴ります。

技術便利なAIスキル、入れる前に中身を見ていますか ──Agent Skillは「プロンプト集」ではなく、実行権限を持つ部品だった
Latest · 最新記事

便利なAIスキル、入れる前に中身を見ていますか ──Agent Skillは「プロンプト集」ではなく、実行権限を持つ部品だった

Claude CodeやCodexで「スキル(skill)」を増やすのは便利だ。でもスキルはプロンプトではなく、命令・参照・スクリプト・外部ツール接続をまとめた小さな実行可能パッケージ=新しい攻撃面でもある。リスクは3層(悪意ある指示/scripts依存の供給網/MCP tool poisoning=ツールを呼ぶ前に説明文が効く)。NVIDIA SkillSpectorやSnyk Agent ScanはAI版npm auditだが「通せば安全」は誤り。npmを入れる時に依存を見るように、AIスキルも read→scan→sandbox→権限最小化→project-local→log の6段ゲートで入れる。分かりやすく整理した最新動向解説(数値は公式/GitHub/研究ベース・CAG非検証)。

技術便利なAIスキル、入れる前に中身を見ていますか ──Agent Skillは「プロンプト集」ではなく、実行権限を持つ部品だった

便利なAIスキル、入れる前に中身を見ていますか ──Agent Skillは「プロンプト集」ではなく、実行権限を持つ部品だった

Claude CodeやCodexで「スキル(skill)」を増やすのは便利だ。でもスキルはプロンプトではなく、命令・参照・スクリプト・外部ツール接続をまとめた小さな実行可能パッケージ=新しい攻撃面でもある。リスクは3層(悪意ある指示/scripts依存の供給網/MCP tool poisoning=ツールを呼ぶ前に説明文が効く)。NVIDIA SkillSpectorやSnyk Agent ScanはAI版npm auditだが「通せば安全」は誤り。npmを入れる時に依存を見るように、AIスキルも read→scan→sandbox→権限最小化→project-local→log の6段ゲートで入れる。分かりやすく整理した最新動向解説(数値は公式/GitHub/研究ベース・CAG非検証)。

甲斐ショウジ13分で読めます
技術「ChatGPT使えます」では、もう差がつかない ──AI活用力の証明が"画面共有"へ移った話

「ChatGPT使えます」では、もう差がつかない ──AI活用力の証明が"画面共有"へ移った話

「AI使えます」と言う人は増えた。でも画面共有してもらうと、差はすぐ出る。単発の質問を投げる人と、過去のメモ・業務ルール・検証手順・再利用可能な指示まで含めて"一つの仕事の流れ"としてAIを動かす人。採用の現場では、AI利用を禁止する面接から、あえて許可して使い方を観察する面接へ移り始めた(Canva・Google・Zapier・Recruo)。評価軸が「AIを使えるか」から「AIを組み込んだ仕事の流れを見せられるか」へ動いている。何が変わったのか、そして自分の仕事で"見せられるAIワークフロー"を作る5ステップを、外部動向をもとに解説する。

甲斐ショウジ13分で読めます
技術消えた「最強AI」が、戻ってきた ──Fable 5再展開でわかった、AIモデルの新しい"戻り方"

消えた「最強AI」が、戻ってきた ──Fable 5再展開でわかった、AIモデルの新しい"戻り方"

6月に米政府の指令で全停止したClaude Fable 5が、7月1日に再展開された。でも「元通り」ではない。安全分類器で止めたリクエストを拒否せずOpus 4.8へ回す"能力の降格"、政府(CAISI)によるテスト、業界共通のjailbreak評価基準。戻り方そのものが、AIモデルは「リリースして終わり」から「運用し続けるもの」に変わったことを示している。何が止まり、どう戻り、何が変わったのかを、AIを業務に使う側の目線で分かりやすく整理する。

甲斐ショウジ14分で読めます
技術Claude Sonnet 5を、分かりやすく ──"Opusに迫る力"を半額以下で回すエージェント向けモデル

Claude Sonnet 5を、分かりやすく ──"Opusに迫る力"を半額以下で回すエージェント向けモデル

Anthropicが新モデル Claude Sonnet 5 を発表。ひとことで言えば「最上位のOpus 4.8に肉薄する力を、半額以下で回せる中位モデル」だ。公式は「最も自律的なSonnet」と位置づけ、無料・Proの標準モデルに。計画→ブラウザ/ターミナル操作→自律で完走のエージェント性能、100万トークンの文脈、$2/$10の導入価格(〜8/31)、Opus 4.8との差、使いどころと使う前の注意まで——毎日Claudeで開発する現場目線で分かりやすく整理する。

甲斐ショウジ12分で読めます
制作事例技術「あの資料、見てもらえたかな」を終わらせる ──提案資料をURL一つで安全に届け、閲覧まで見える共有ツールを作った

「あの資料、見てもらえたかな」を終わらせる ──提案資料をURL一つで安全に届け、閲覧まで見える共有ツールを作った

メールに添付した提案資料は、相手が開いたのか、どこまで読んだのか分からない。PDFは重くて開かれず、共有リンクは転送し放題で機密には使えない——資料を「送って終わり」にした瞬間、その先は暗闇になる。私たちは提案資料を多く扱う支援企業向けに、資料をURL一つで安全に届け、閲覧の状況まで見えるセキュアな共有ツール(DocSend的)を設計・実装した。①クライアント閲覧者を“会員”にしない二系統認証(Web暗号+署名付き一時通行証)、②直リンクを塞ぎ隔離枠で映す“見えるけど抜けない”配信、③資料をAIで生成し必要箇所だけ差分編集・同一URLで改訂・自動分類、④現場の要望を1日7リリースで即日反映・大容量50MB対応。技術判断を主役に、安全性とAI活用と改善速度の作り方を書く。クライアント名・ドメイン・認証情報は伏せ、数値は自社実装の事実に基づく匿名例。

甲斐ショウジ10分で読めます
制作事例技術Google口コミを、店舗運営の「次の一手」に変える ──分析して終わらせない、多店舗対応の改善ツールを作った

Google口コミを、店舗運営の「次の一手」に変える ──分析して終わらせない、多店舗対応の改善ツールを作った

「星4.2、口コミ186件」——その看板を上げるために、明日から何をするか。多くの現場でここが曖昧なまま放置されている。私たちは店舗集客を支援する事業者向けに、Google等の口コミを店舗運営の“打ち手”に変える分析ツールを設計・実装した。①あと★5が何件で評価4.0に届くかを決定論的に正確計算する目標シミュレーション、②業種特性を踏まえてAIが強み・不満を言語化、③低評価×未返信の「要返信の口コミ」抽出、④一覧APIで546店舗を数秒発見し口コミは店舗ごとに取得、⑤毎月の自動同期、⑥A4日本語PDFで客先納品——「分析して終わり」でなく「次に何をするか」まで出す仕組みを、技術判断を主役に書く。クライアント・店舗名は伏せ、数値は自社実装の実データに基づく匿名例。

甲斐ショウジ11分で読めます
制作事例技術このサイトのAIは、自分たちで作った ──HITL・顧客別メモリ・メール⇄チャット双方向を実装した顧客対応AIの中身

このサイトのAIは、自分たちで作った ──HITL・顧客別メモリ・メール⇄チャット双方向を実装した顧客対応AIの中身

CAGサイトの問い合わせに一次対応しているAIは、自分たちで実装した。マルチテナント基盤、RAGと顧客別メモリを持つエージェント、見積もりは人間に渡すHITL設計、メールへの返信がそのままチャットになる双方向統合、そして「全部実機で確かめた」自動検証42項目——本番品質の顧客対応AIを、AI駆動開発で1日で本番稼働に乗せた制作記録。何を作り・どう守り・何をAIに任せないかの設計判断が、速さの主役だ。

甲斐ショウジ10分で読めます
制作事例技術Markdownは、もう卒業。AIが作る"見栄えするHTML"を、安全に共有できるようにした話

Markdownは、もう卒業。AIが作る"見栄えするHTML"を、安全に共有できるようにした話

AIに資料を作らせるとmdで返るが、記号が残り表は崩れ、見せるには不向き。今のAIはHTMLが得意で、整った資料を一瞬で書ける。でもHTMLは共有が難しい——DLの手間・見た目崩れ・流出不安。そこで、アップロードすると専用URLが出て、DLなしでセキュアに閲覧できるツールを作った。推測困難URL+認証+直リンク遮断+閲覧ログ。テキストからAIがHTML生成も。作れると届けられるは別問題。

甲斐ショウジ10分で読めます
制作事例経営 "〇〇市" の政策への声 速報 4 SNS 合算 ・ 24時間ごと更新 すべてXInstagramFacebookThreads 総投稿数1,240 感情スコア+0.43 ポジティブ率58% エンゲージ2,980 投稿数の時系列推移 過去7日間・日次 プラットフォーム別 1,240 総投稿数 CASE STUDY · 制作事例 × 経営 数ヶ月の人力を、 AIで1日に畳む。 自治体向けSNS分析ダッシュボードを、実働1日で本番投入した話 電脳技巧集団(AI職人ギルド)

『これ、数ヶ月かかりますよね』を、1日でひっくり返した話

「これ、数ヶ月かかりますよね」——その見積もりの“常識”を、フルAI駆動で覆した制作事例。自治体向けSNS分析ダッシュボードを、実働1日・8コミットでログイン付き本番まで。チャート7種を外部ライブラリ0で実装し、設計判断ごと開示する。

甲斐ショウジ10分で読めます