← ブログに戻る

LLMに「引用したい」と思わせるコンテンツ設計 — Microsoftが明かした3原則

llmoai-searchseocontent-designmicrosoft

私はSEOを10年やってきたエンジニアです。検索順位を上げる方法なら寝ながらでも語れます。でも2025年の秋、Microsoftが公式ブログに出したたった1行で、目が覚めました。

「可視性がすべて。AI検索の世界では、見つけられることではなく、 選ばれること が重要。」

「見つけられる」から「選ばれる」へ。ゲームが変わっていたのに、私は古いルールブックを握りしめていたわけです。

この記事では、Microsoft公式ガイド(2025年10月公開)、Adobe LLM Optimizer、SurferSEOの定量データに基づいて、LLMに引用されるコンテンツの書き方を解説します。「SEO頑張ってるのに、ChatGPTに自分のサイトが出てこない」と思っている方に向けて書きました。

SEOとLLMOは何が違うのか

まず、根っこから違う部分を整理します。

SEO vs LLMO: 根本的な違い

項目SEOLLMO
単位ページ全体のランキング断片(パッセージ)の引用
権威性の源泉被リンク数ブランドへの言及
JS対応レンダリング対応クライアントサイドJS非対応
鮮度の評価リアルタイムインデックスRAGで新鮮さを確保
重要なシグナル被リンク第三者からのメンション・引用

一番大きな違いは「単位」です。SEOではページ全体が検索結果の1位か2位かを競っていました。LLMOでは違います。あなたの記事の中の 一つの段落、一つの文 が、AIの回答に抜き出されるかどうかが勝負です。

ビュッフェで考えてみてください。SEOはテーブル全体の評価でした。「あのレストランは良い」。LLMOは一皿ずつの評価です。AIは気に入った一皿だけ取っていく。テーブルの残りは無視されます。

Microsoftが明かした3原則

2025年10月、MicrosoftのBingチームのKrishna Madhavan氏が公式ブログで「AI検索回答にコンテンツを含めるための最適化ガイド」を公開しました。Copilot、Microsoft Start、Bingを運用するMicrosoft自身の内部知見です。推測ではありません。

原則1: 構造(Structure)

AIはコンテンツをパーシング(解析)して小さな構造化された断片に分解します。それらの断片を権威性と関連性で評価し、複数ソースから1つの回答を組み立てます。

つまり、あなたのページ全体が評価されるのではなく、 各セクションが独立した候補 として評価されます。

具体的にどうすればいいか。

<!-- NG: 曖昧な見出し -->
<h2>詳細はこちら</h2>
<h2>Learn More</h2>

<!-- OK: 質問形式で具体的な見出し -->
<h2>JSON-LDの実装に必要な3つのステップ</h2>
<h2>LLMOとSEOの違いは何か?</h2>

見出しが曖昧だと、AIは「このセクションが何の回答なのか」を判定できません。見出しをそのままAIへの質問文にしてしまう感覚が正解です。

原則2: 明確さ(Clarity)

セマンティックに一義的な言語を使います。Microsoft公式が挙げた具体的な注意点をまとめます。

  • キーワードではなくインテント(意図)に合わせて書く: ユーザーが何を知りたいのかを考える
  • 曖昧な修飾語を避ける: 「最新の」「画期的な」ではなく、具体的な事実を書く
  • コンテキストを追加する: 「静かな食洗機」ではなく「42dBでオープンキッチンに最適な食洗機」
  • 装飾記号を避ける: ★★★や!!!はAIの文構造理解を妨げる

人間には「行間を読む」能力がありますが、AIは行間を読みません。書いてあることだけが情報です。「いい感じのやつ」では通じない相手にどう伝えるか、そういう問題です。

原則3: スニッパビリティ(Snippability)

これが3原則の中で最も重要です。回答として そのまま抜き出し可能な自己完結的フレーズ を含めます。

## JSON-LDとMicrodataの違いは?

JSON-LDはHTMLから独立した<script>タグ内にメタデータを記述する形式です。
MicrodataはHTMLの属性(itemprop等)にメタデータを埋め込む形式です。
GoogleはJSON-LDを公式に推奨しており、AI検索ではJSON-LDが
優先的に抽出されるため、新規実装はJSON-LD一択です。

このような回答を、AIは そのままリフト(抜き出し) してユーザーへの回答に使えます。「前述の通り」「上で説明した方法」のような文脈依存の表現を使うと、抜き出した先で意味が通じなくなるため、引用候補から外されます。

各セクションを「そこだけ切り取っても意味が通る」ように書く。これがスニッパビリティです。

データが裏付ける「鮮度」の重要性

Microsoftの3原則に加えて、鮮度がAI引用に与える影響が定量的に明らかになっています。

SurferSEOの調査データ(2025-2026年)によると:

  • AIが引用するコンテンツは、Google検索結果より 平均25.7%新しい
  • 65% のAIボットアクセスは、過去1年以内に公開されたコンテンツに集中
  • 3ヶ月以上更新されていないページは、更新されているページと比べて 3倍以上 AI引用を失う

Adobe LLM Optimizerも「ページコンテンツの 10-15% を定期的に更新せよ」と推奨しています。

ただし、 日付だけ変えて中身を変えないのは逆効果 です。SurferSEOの調査では、テキスト未変更でdateModifiedだけ更新した場合、AIがそれを検出し「stale(古い)」として扱うことが確認されています。最終更新日を1月1日にしておけば永遠に新鮮、というライフハックは通用しません。

更新時に確認すること

  • 統計データを最新値に差し替えたか
  • 新しい事例や引用を追加したか
  • 古い情報を削除または修正したか
  • 全体の10-15%以上のテキストを実際に変更したか

オフサイトの存在感がオンサイトと同等以上に効く

SEOでは「被リンクが王様」でした。LLMOでは「ブランドへの言及」が王様です。

LLMが信頼するプラットフォームでの存在感を構築することが、サイト内の最適化と同じくらい重要です。

プラットフォーム効くクエリタイプやるべきこと
Wikipedia事実確認・定義正確で中立的な記述を維持
Reddit主観的・評価的真摯なコミュニティ参加
YouTube説明的(how/why)トランスクリプトがAI引用対象になる
GitHub技術的な権威性OSSプロジェクト、技術ドキュメント
Stack Overflow技術Q&A回答の質と正確性

SurferSEOのデータでは、G2にプロフィールがある企業はChatGPTで引用される確率が 3倍 になるという結果も出ています。自分のサイトだけ磨いて外に出ない戦略では、AIの目に留まりにくくなっています。

実践: スニッパブルなコンテンツの書き方

ここまでの知見を、すぐに使える形にまとめます。

パターン: 質問 → 回答 → 根拠

LLMに引用されやすい構造を1つだけ覚えるなら、これです。

## Next.jsとNuxtはどちらを選ぶべきか?

Reactエコシステムに慣れているならNext.js、Vueが好みならNuxtが適しています。
2026年4月時点でNext.jsはnpm週間ダウンロード数720万、Nuxtは95万です。
企業採用数ではNext.jsが圧倒的ですが、学習コストはNuxtの方が低いという
調査結果があります(State of JS 2025)。

冒頭1-2文がそのまま回答になり、後続の数値が信頼性を裏付けます。AIは「この段落をリフトすればユーザーに回答できる」と判断しやすくなります。

数値データの配置

統計データの追加は、GEO論文で +115.1% の引用効果が実証されています。数値を入れるときのポイント:

  1. 数値を 太字 にする(視覚的に際立たせる)
  2. 出典を明記する(「SurferSEO 2026年調査」など)
  3. リスト形式で並べる(AIが個別の事実として抽出しやすい)
  4. 文脈を添える(何の数値かを明確に)

「数字を入れろ」ではなく「出典付きの数字を、リスト形式で、太字にして入れろ」です。細かいですが、この差がAIに拾われるかどうかを分けます。

ページ速度も引用に影響する

意外な発見ですが、ページの読み込み速度もAI引用率に影響します。SurferSEOの調査では:

  • FCP(First Contentful Paint)が 0.4秒以下 のページ: 平均 6.7件 のAI引用
  • FCPが 1.13秒以上 のページ: 平均 2.1件 のAI引用

速いページは遅いページの 3倍 引用されます。コンテンツの中身だけでなく、技術的なパフォーマンスもLLMOの要素です。エンジニアとしてはむしろ得意分野ではないでしょうか。

避けるべき6つのアンチパターン

Microsoft公式ガイドとSurferSEOのデータから、やってはいけないことをまとめます。

  1. 長い文章の壁: 1段落は3-4文以内。AIがチャンクに分離できません
  2. 情報をタブ/アコーディオンに隠す: AIクローラーが隠しコンテンツをレンダリングしない場合があります。Microsoftも「Showボタンの裏の情報は見えない」と明言しています
  3. PDFに重要情報を格納: HTMLの構造化シグナル(見出し、JSON-LD)が欠落します
  4. 画像のみの情報提示: 比較表を画像だけで提供するとAIが読めません
  5. 文脈依存の表現: 「前述の通り」「上で説明した方法」はパッセージ抽出時に意味不明になります
  6. 日付だけの更新: テキスト未変更ならAIが検出し、staleとして扱います

6番は本当にやりがちです。私も「最終更新日を今日にしておけばOKでしょ」と思っていた時期がありました。AIは日付ではなくテキストの差分を見ています。手抜きがバレる時代になりました。

まとめ

SEOが「ページを上位に表示する」ゲームだったのに対し、LLMOは「一つの段落をAIの回答に選ばせる」ゲームです。

Microsoftの3原則をもう一度:

  1. 構造: 各セクションを独立した回答候補として設計する
  2. 明確さ: 曖昧な修飾語を捨て、具体的な事実を書く
  3. スニッパビリティ: そのまま抜き出しても意味が通る自己完結的な文を書く

加えて、 鮮度(10-15%の定期更新)と オフサイトの存在感(第三者プラットフォームでの言及)がAI引用を左右します。

私がこの記事で実践していることを数えてみてください。質問形式の見出し、出典付きの統計データ、太字の数値、比較表、自己完結的なセクション。全部、ここで書いた原則に従っています。メタですが、LLMOの記事をLLMOに最適化して書いているわけです。

自分のサイトがAIに無視されていると感じたら、まずコンテンツの構造を見直してみてください。書いてある中身は良いのに、AIに「一皿」として取り出せない盛り付けになっているだけかもしれません。


さらに深掘りしたい方へ

LLMO の全体像 — llms.txt 設計、JSON-LD 実装、AI引用率 KPI、ChatGPT / Perplexity / Brave の引用ロジック比較 — を1冊で扱う なぜあなたのサイトはChatGPTに無視されるのか — LLMO実践ガイド を参考にしてください。