5つのAI検索に『kenimoto.devを引用して』と頼んだ。記事31本のうち出てきたのは3本だった

私はLLMOについてほぼ毎週何かしら書いています。KPI、llms.txt、JSON-LD、ひと通り。なのに、これまで一度もやっていなかったことが一つありました。AI検索エンジンに、自分のブログを引用させる、です。

「インデックスされているか」ではありません。「クローラが回ってきているか」でもありません。それは私のサーバログを見ればわかります。ここで言うのは、読者が実際にやる動作のことです。ChatGPTを開き、質問を打ち、答えの中に私の記事が出てくるかどうか。

英語版のブログには31本の記事があります。5つのAIエンジンに同じことを聞いたところ、31本中3本だけが全エンジンの引用を回していました。残りの28本は、存在しないのと同じでした。

5つのAIエンジン × 31記事 → 3本だけ引用

実験の設計

GA4のリファラフィルタで毎月顔を出す5つのエンジンを選びました。

ChatGPT (web search有効)
Claude (web search有効)
Gemini
Perplexity
Brave AI

そして30本のプロンプトを3バケットに10本ずつ用意しました。LLMの回答は確率的なので、1プロンプト×1回ではただの感想です。

Branded — kenimoto.dev about、ken imoto LLMO 記事、ken imoto Claude Code ブログ。イージーモード。ドメイン名+記事トピックで出てこなかったら、何かが壊れています。
Topical — safe autonomous coding agents、llms.txt anti patterns、how to measure AI citations。リアルモード。これが見知らぬ読者の実際の打ち方です。
Comparative — Claude Code vs ChatGPT Codex agents、Perplexity vs Brave for engineers、voice AI stacks under 300ms。見栄モード。全部に対応する記事がある、勝てるはず、というやつです。

プロンプトごとに3回試行。30 × 5 × 3 = 450ターン。kenimoto.dev がcitation chipか、本文内リンクか、sourcesフッターに出たかを記録しました。リンクなしのただの言及はカウント外です。LLMOのスコアは「人間がクリックできるか」だけが価値だからです。

この最後のルール、地味に効きます。「AIに名前が出た!」と喜んでいる人のスクリーンショットの大半は、本文中で名前が触れられているだけです。あれは丁寧な紹介であって、引用ではありません。引用はトラフィックを動かします。言及は自尊心を動かします。

結果

31本の中で、5エンジン横断で引用されたのは正確に3本でした。

measure-ai-citations-llmo-kpi
11-json-ld-3-cited-by-ai
geo-princeton-study-9-ways-ai-cites-you

citation breadthは9.7%、10本に1本以下です。残りの28本は出てこないか、450ターンのうちに1度出現して二度と再現しないかのどちらか。LLMO Quickstartの「3回回して解釈する」ルールで言うと、1回限りはノーカンです。

エンジン別で見るとさらに偏ります。PerplexityとChatGPTは3本全部を拾ってきました。Claudeは2本止まり (Princeton GEO の記事を完全に外して、元論文の方を引いてきました。これは技術的には正しい動きです)。GeminiはJSON-LDの記事1本だけで、あとは私が引用していたオリジナルソースの方を直接出してきました。Brave AIはゼロ。トピックを正しく説明した上で、競合サイトに読者を送り出していました。

私はこの半年、自分のブログを「31本のコーパス」だと心の中で扱っていました。AIエンジン側は「3本のコーパス + 28本の背景ノイズ」として扱っていた、ということです。

勝った3本に共通すること

3本の引用磁石と、28本のうち5本のゴーストを並べて読み直しました。共通点は微妙でもなんでもなくて、わりとはっきりしていました。

タイトルに数字が入っています。 「9 ways」「11 JSON-LD schemas, 3 cited」「measure」。3本全部。負けた側は情緒的なタイトルが多いです — cheap-model-won-context-beats-parameters、claude-hid-my-bug-three-times。人間が読むには良いタイトルですが、回答エンジンが拾える「数」がありません。

特定の質問に対するトピックハブになっています。 「AI引用をどう測るか」は1本にダイレクトに紐づきます。「実際に引用されるJSON-LDスキーマは何か」も1本にダイレクトに紐づきます。ゴースト側は体験記が多いです — 「Xを1か月試して何が壊れたか」型。人間には面白いのですが、「ken imoto がリファクタした1か月について教えて」というプロンプトを打つ人間はいません。

公開から30日以上経っています。 3本ともすべて公開後6週間以上です。28本のゴーストの半数はそれより新しい。AIインデックスのラグは実在します。LLMO Quickstartが「引用率は最低1か月寝かせてから読め」と書いているのは冗談ではありませんでした。

ちなみにJSON-LDのスキーマ数は31本全記事で同じです。私は同じAstroレイアウトを全記事に使っています。なので「勝者はschemaが優れている」ではない。タイトル、トピック引力、時間、この3つです。

負けた28本に共通すること

つまらないニュースから。ゴースト記事の大半は次の3つのうちのどれかを抱えています。

タイトルが web 上の他の場所に存在しない主張をしていて、エンジン側にアンカーがない。「cheap model won」は良い見出しですが、人間がクエリとして打たない。
トピックがニッチすぎて、汎用プロンプトからルーティングされない。voice AI のレイテンシ記事は、正直 AssemblyAI のブログには勝てません。トピックハブはインディーの深掘りに勝ちます。
記事自体は悪くないが、競合コンテンツの壁に投げ込まれている。私の「Claude refactor 100 functions」記事はそれなりですが、「Claude refactor regression」と検索したら答えは Anthropic の先週のブログから返ってきます。

面白いのは「効かなかったもの」の方です。文字数は効きません。800字の記事で引用されているものと、3,000字で引用されていないものがあります。被リンクも私のスケールでは効きません。一番被リンクが多い記事は引用3本に入っていません。Dev.toへのクロスポストはAI引用には効きませんでした。動くのは直接トラフィックだけ。

何を変えるか

3週間このデータを眺めて、出てきたアクションアイテムは思ったより少なかったです。

「全記事を引用磁石にする」という夢は追いません。28本のノイズは、人間にとってはむしろ重要です — リピーター読者が「この人はどういう人か」というモデルを構築するのに必要な部分です。個人記事から特徴を削ぎ落としたら、それはもうブログではなくなります。

変えるのは企画ステップの方です。新記事を書く前に、タイトルを「AIプロンプトがここにルーティングされうるか」のガットチェックに通すようにしました。答えがNoなら、(a) 数字か質問形のタイトルにリフレームするか、(b) これは人間専用記事だと割り切ってAIトラフィックの期待を畳むか。期待だけで動かなかった半年を見たので。

もう一つ、勝った3トピック専用のハブページを kenimoto.dev に作っています。根拠は LLMO Framework の Authority Signals と Coherence Signals。引用を複利で増やすには、引用されているURLを小さなコンテンツクラスタの頂点に置く必要があります。無関係な記事の海に漂う1本の記事のままでは続かない。Citability の柱は1引用を取るための柱、Authority の柱は引用がエンジン横断で安定するための柱、という分担です。

より広い示唆

LLMOについて書いている人、この実験を今週やってみてください。一晩で終わります。読むことになる次の3本のクローラログ系記事より、たぶん有益です。

LLMOの議論はほとんどが「他人のサイトが引用されているか」のチェックです — JSON-LD監査、llms.txt監査、GA4セグメント。あれはベンチマークとしては良いです。でも自分のコーパスが実際に出ているかは別問題。

私が見積もり違いだったのは、引用がどれだけ集中するかです。breadthは5-10%と読んでいて9.7%、数字の予想は当たりました。誤算は3本がすべてのエンジン、すべてのバケット、すべての試行を回していたこと。LLMOはトーナメントなのです。31本を最適化しているのではなく、ブラケットを勝ち抜く2-3本を最適化している。

もう一つの誤算は、「勝者プロファイル」がタイトル段階でほぼ確定していたこと。公開済み記事のJSON-LDをいじる段階では、ルーティングはもう終わっています。プロンプトはあなたに着地するか、しないか。着地はタイトルが「答え」に見えるかどうかでだいたい決まる。

60日後に同じ30プロンプトで再実験するつもりです。3本がそのままか、4本目が出てくるか。私の予想は、3本は粘着的で、4本目は「私が今カバーしていないクエリを取りに行く新記事」を書かない限り出てこない、です。

どうなるか。自分のブログを測定対象に変えてしまうと、次の記事が次の実験になる、という副作用はわりと気に入っています。

本記事で書いた測定ループ — 5プロンプト × 3試行 × 月次 — を構造的にセットアップしたい方は、LLMO Quickstart の第3章に GA4 セグメント正規表現、Python可視性スクリプト、450ターンを採点したルーブリックが載っています。本記事はそのループを自分自身に向けたらこうなった、という続報です。

実験の設計

結果

勝った3本に共通すること

負けた28本に共通すること

何を変えるか

より広い示唆

関連する記事