制作事例 | AI駆動開発の現場から
「星4.2、口コミ186件」──Googleでお店を探すと、まず目に入るのがこの数字だ。お店を運営する側からすれば、この数字は売上に直結する看板でもある。では、その看板を上げるために、明日から具体的に何をすればいいのか。多くの現場で、ここがぼんやりしている。
私たち電脳技巧集団(AI職人ギルド)は、店舗集客を支援するある事業者のために、Google等の口コミを店舗運営の"打ち手"に変える分析ツールを設計・実装した。店舗を選ぶだけで、口コミを全件集め、評価を上げる現実的な目標を計算し、業種に合わせた強みと不満を言語化し、クライアントに出せるレポートにする。「分析して終わり」ではなく、「次に何をするか」までを出す道具だ。
この記事は、その店舗運営を改善するサイクルを、どう設計したかの記録である。口コミという生の声を、どうやって店長が動ける指示に変えるか。そして直近では、500を超える店舗を一括で扱い、毎月自動で回すところまで来た。その作り方を、技術判断を主役に書く。なお本稿はクライアント・店舗名を伏せた匿名ケーススタディで、数値はすべて自社実装による実データに基づく。

01口コミは見ているのに、運営の打ち手に変わらない
現場の課題は、口コミを「見ていない」ことではない。むしろ多くの店舗オーナーや支援担当者は、評価が下がれば気づくし、低評価のコメントには胃が痛くなる。問題は、その先だ。大量の声を、明日の運営の一手に翻訳する作業が、属人的で重い。
このプロジェクトを始める前、支援担当者は口コミデータをCSVに書き出し、それを汎用のAIチャットに貼り付けて、手作業で分析していた。やり方は人によってバラバラ。出てくる集計はAIが数え間違える。1店舗ぶん分析するだけで時間がかかり、何十店舗も抱えると現実的に回らない。「再現性がなく、計算が当てにならず、スケールしない」──ここを丸ごと作り替えるのが、このツールの出発点だった。
狙いはシンプルだ。店舗を選ぶだけで、誰がやっても同じ品質の、運営に使えるレポートが出る。 そのために、口コミの取得・数値の計算・言葉の分析・改善アクションまでを一本の自動化にまとめた。
02評価を上げる目標を、"気合い"でなく数字で出す
店舗運営の会話で、いちばん曖昧になりやすいのが目標設定だ。「もっと評価を上げよう」では、現場は動けない。そこでこのツールの中心に据えたのが、目標評価シミュレーション──いまの平均から、目標評価に届くには、あと★5の口コミが何件必要かを、正確に計算して出す機能だ。
これは気合いの話ではなく、算数の話である。現在の合計スコアと総件数から、目標到達に必要な追加★5件数は一意に決まる。私たちはこれをTypeScriptの決定論的な計算として実装し、AIには一切計算させていない。なぜそこまで徹底するかは、相方の技術記事に詳しいが、要は「数字を一度でも間違えるツールは、運営の意思決定には使えない」からだ。
関連記事 | 設計の核を深掘りした相方LLMに、計算をさせない。──口コミ分析SaaSで「数値はコードで、言葉はAIで」を貫いた話
→
この一覧が出るだけで、運営会議の質が変わる。「4.5を目指す」が、「4.5には★5があと114件。半年では非現実的。まず4.0(あと15件)を3か月で」という、地に足のついた計画に着地する。曖昧な精神論が、達成可能なマイルストーンになる瞬間だ。
03業種を分かったAIに、強みと不満を言葉にさせる
数字が「どれだけ」を示すなら、口コミの本文は「なぜ」を抱えている。ここはコードでは無理で、言葉の機微を読む仕事だ。だからこの層はAI(Claude)に任せる。ただし、丸投げはしない。AIが的を射た分析をするように、入力を設計する。
鍵は業種特性をAIに教えることだ。ゴルフ場と動物病院と美容室では、「良い口コミ」「悪い口コミ」の意味がまるで違う。コースの戦略性が褒められる業種もあれば、待ち時間や接客の丁寧さが命の業種もある。そこで、各店舗の業種カテゴリ(Googleビジネスプロフィール由来・日本語)をAIへ必ず渡し、その業種の文脈で強みと不満を言語化させる。さらに、高評価(★4以上)由来の口コミからは強みを、低評価(★3以下)由来からは不満点をテーマ別に束ね、代表的な声を引用として添える。
もう一つ地味だが効くのが、取得と分析を分けたこと。口コミを集める処理(外部APIから取得)と、AIで分析する処理は、別々の工程にしてある。分析結果はキャッシュし、再分析は人が明示的に押したときだけ走る。AIの呼び出しは無料ではないから、店舗を開くたびに毎回AIを叩くような富豪設計にはしない。安く・速く・安定して運営に使えるよう、ここはきっちり線を引いた。
041店舗の分析から、500店舗を回す仕組みへ
運営改善は、続けて初めて意味がある。1回きれいなレポートが出ても、翌月にまた手作業に戻るなら道具とは言えない。そしてこの支援事業者が抱える店舗は、1つや2つではない。数百店舗だ。ここで、ツールは「便利なレポート生成器」から「多店舗の運営を回す基盤」へと進化する必要があった。
直近の実装で、私たちは口コミ管理プラットフォームのAPIから配下の全店舗を一括で発見する導線を作った。実データでは、ボタン一つで546店舗がメタ情報(店舗名・業種)つきで一覧に登録された。発見にかかった時間は数秒だ。ここで一つ技術的な判断がある。全店舗の口コミは合計で7万件超あり、これを一度に取りに行くと時間制限に引っかかって失敗する。そこで「店舗の発見は安価な一覧APIでまとめて、口コミ本文は店舗ごとに個別に取得する」という二段構えにした。発見と取得を分けることで、巨大なデータでも破綻しない。
そのうえで、毎月1回、全店舗の口コミを自動で取り直す定期同期を仕込んだ。ここでも設計判断がある。自動で回すのは「取得」だけにして、AI分析は人が必要なときに明示的に動かす。月次で全店舗をAI分析まで自動実行すれば、コストは膨らみ、誰も読まないレポートを量産することになる。だから「鮮度はデータで自動的に、解釈は人の意思で」と切り分けた。実データでは、ある店舗ネットワーク全体で7万件超・個別のゴルフ場で772件・動物病院で数百件といった規模の口コミを、こうして安定して扱えている。
05現場で殴られて強くなった:"静かにゼロ件"という罠
こうした仕組みは、机上の設計だけでは完成しない。実データに当てて、何度も殴られて、ようやく運営に出せる品質になる。象徴的だったのが「静かにゼロ件」問題だ。
ある店舗の口コミを取りに行くと、外部APIは「成功(エラーなし)」を返すのに、中身は0件だった。エラーが出れば原因を追えるが、これは"成功したふりをして、何も返さない"という最悪の失敗だった。観測ログを仕込んで一段ずつ切り分けた結果、原因は「店舗を指定するIDの種類が違っていた」こと。正しいIDで叩けば、同じ店舗から問題なく口コミが取れた。さらに別の店舗では、指定IDに一文字のタイポ("i"が抜けていた)があり、これも無言で弾かれていた。
ここで私たちが取った対策が、運営ツールとして大事な部分だ。「0件」を一律で成功(緑)として表示しない。本当にまだ口コミが無いのか、ID指定を間違えて取れていないのかを区別し、後者は警告として出し、「店舗単位で取り直す」ボタンまで添える。沈黙する失敗を、画面の上で"見える失敗"に変えたのだ。道具を使うのは多忙な現場の人間で、エンジニアではない。「なぜか0件」で詰まらせないことが、そのまま実用性になる。
06クライアントに出せる品質:PDF納品・要返信・安全
分析が画面で見えるだけでは、支援の現場では足りない。クライアント(店舗オーナー)に渡せる形と、毎日の運営に効く具体機能、そして安心して任せられる安全性。この三つが揃って、初めて「納品できる道具」になる。
まずレポートのPDF出力。A4の日本語レポートとして、KPI・星分布・評価トレンド・目標シミュレーション・強み・不満点・改善アクションまでを1つのファイルにまとめ、複数ページに自動で割り付ける。日本語フォントを埋め込み、グラフも描画して、そのまま定例会議や提案資料に出せる体裁にした。次に「要返信の口コミ」の抽出。低評価(★3以下)なのに事業者からの返信が付いていない口コミだけを、新しい順で拾い出す。Googleの口コミ返信は評価改善の基本動作で、「まず今日返すべきはこの3件」がすぐ分かる。

そして安全性。店舗の口コミや評価は、クライアントの機微なデータだ。設計の最初からテナント分離(行レベルのアクセス制御)を有効にし、ログインしたユーザーが自分の権限を超えてレポートを覗けないよう作ってある。PDF出力のような「URLを直接叩けば取れそう」な経路も、本人の権限でしかアクセスできないよう塞いだ。さらに公開前は、検索エンジンやAIクローラーに拾われないよう、単一のフラグで多層的にブロックしておき、正式公開のときに一行で解除できるようにしてある。
| 運営に効く機能 | 何を解決するか | 設計上のこだわり |
|---|---|---|
| 目標シミュレーション | 「評価を上げよう」が曖昧 | あと★5何件で到達か、決定論的に正確計算 |
| 強み・不満の言語化 | 大量の声を読み切れない | 業種特性を踏まえてAIがテーマ化+代表引用 |
| 要返信の口コミ | 返すべき低評価が埋もれる | 低評価×未返信だけを新しい順で抽出 |
| 多店舗の一括発見 | 数百店舗を手で登録できない | 一覧APIで数秒・口コミは店舗ごとに取得 |
| 毎月の自動同期 | 手作業に逆戻りする | 取得だけ自動・解釈は人(コスト管理) |
| PDFレポート | 画面では客先に出せない | A4日本語・グラフ描画・複数ページ自動 |
07締め:作ったのは"運営の意思決定"だ
このプロジェクトで作ったものを、改めて一言でまとめる。それは口コミ分析ツールというより、店舗運営の意思決定を支える仕組みだ。口コミという生の声を入り口に、「いまどこにいて(統計)」「どこを目指し(目標シミュレーション)」「何が効いていて何が問題で(強み・不満)」「次に何をするか(改善アクション)」までを、一貫して、再現性をもって、多店舗ぶん回せる。
AI駆動開発というと、何でもAIに任せる魔法のように聞こえがちだ。だが本当の腕は、その逆にある。数字は決定論的なコードで正確に、言葉は業種を分かったAIで深く、解釈と最終判断は人が握る──この線引きこそが、現場で壊れない道具を作る設計力だ。AIに任せる範囲と、絶対に任せない範囲を見極めること。それが、私たちがこのツールに込めた一番の技術である。

電脳技巧集団(AI職人ギルド)は、こうした「業務に効くAIの道具」を、設計から実装・実データ検証・納品までフルAI駆動で速く形にする。口コミに限らず、現場に眠っているデータを意思決定が変わるレポートに変えたい——そんなテーマがあれば、お気軽に相談してほしい。
「分析して終わり」から「次の一手まで」へ。この違いを、一枚に。
| 観点 | 従来(CSV→汎用AIで手作業) | このツール(運営改善の仕組み) |
|---|---|---|
| 分析のばらつき | 担当者ごとに品質が違う | 店舗を選ぶだけで同じ品質 |
| 数値の正確さ | AIが集計を数え間違える | コードで決定論的に正確計算 |
| 目標設定 | 「もっと上げよう」で止まる | あと★5何件で到達かを提示 |
| 言葉の分析 | 業種を無視した一般論 | 業種特性を踏まえた強み・不満 |
| 多店舗対応 | 手作業では数店舗が限界 | 数百店舗を発見し毎月自動更新 |
| 納品 | 画面のコピペ・体裁バラバラ | A4日本語PDFでそのまま提出 |
※ 本記事は自社(電脳技巧集団)が受託・実装した制作事例の一次情報。クライアント名・店舗名・利用プラットフォーム名は機密保護のため伏せ、数値は自社実装による実データに基づく匿名化済みの例。目標評価シミュレーションは自社実装の計算式によるもの。仕様・数値は開発時点(2026-06-19)のv0であり、継続的に改善している。
脚注・出典
- 目標評価シミュレーションは自社実装の決定論的計算(必要な追加★5件数 = 現在の合計スコア・総件数・目標値から一意に算出)。本文の「84件・現平均3.82」以下の数値は計算例。回帰テストで固定し、AIには計算させない設計([[関連記事]]参照)。
- 店舗の発見・口コミ取得は、店舗の口コミを一元管理するレビュー管理プラットフォームのAPIを利用(プラットフォーム名は機密保護のため非開示)。「546店舗を数秒で発見」「全体で7万件超」「個別店舗で772件・平均3.92」等は自社実装による実データの匿名化例。
- 定性分析は Anthropic の Claude を利用。入力には決定論的に算出済みの統計値と、店舗の業種カテゴリ(Googleビジネスプロフィール由来・日本語)、評価帯で仕分けた口コミ本文を渡す。感情比率などの件数はコードで確定してからAIに渡す。
- 「数値はコードで、言葉はAIで」という設計の核と、「静かにゼロ件」のデバッグ詳細は、本プロジェクトの相方記事「LLMに、計算をさせない。」に詳しい。
口コミも、売上も、現場のデータは「次の一手」に変えられる。
分析して終わりの道具ではなく、店舗運営の意思決定が変わる仕組みを設計します。数字はコードで正確に、言葉はAIで深く、判断は人が握る——その線引きごと、お作りします。まずは相談から。
無料で相談する →








