← ブログに戻る

新規ドメインの最初の1週間、GA4は嘘をつく: kaoriq.com立ち上げ4日間の生データ

ga4analyticsllmobuild-in-publicbot-traffic

新規ドメインを取って4日後、GA4を開いたら 65 PV / 34 ユーザー / 9カ国 と表示されました。

Build-in-publicの民として一瞬「来てる!」と思いかけたのですが、よく見ると指標が全部おかしい。米国17セッションの平均滞在時間が 4.9秒、フランス・ポーランド・韓国・インド・シンガポールはそれぞれ 0〜1.4秒。日本だけが 751秒(12分超) という異様な数字でした。

ドメインは2026-05-02に取得した kaoriq.com(性格診断×香水のECサイト)。今日(5/5)時点でまだ20記事もない。冷静に計算するとPV単価は人間1人あたり数十秒の集中力を要求するはずで、4日でこの分布が出るのは物理的におかしい。

この記事では、新規ドメインの初週GA4データを 「ken本人 + クローラーの軍団」 と読み解いた手順を、実数を晒しながら共有します。GA4を新規プロジェクトで動かしている人、この週末にドメイン取った人、向けです。

晒す: 過去14日(実質4日稼働)の生データ

まずは数字をそのまま置きます。

全体サマリー

指標
Sessions37
Page Views65
Total Users34
New Users34
平均滞在時間104.1秒
直帰率80%

国別

SessionsPV平均滞在(秒)
🇯🇵 Japan533751.0
🇺🇸 United States17174.9
🇨🇦 Canada441.3
🇫🇷 France441.4
🇵🇱 Poland220.0
🇰🇷 South Korea220.0
(not set)110.1
🇮🇳 India110.0
🇸🇬 Singapore110.0

日別

日付SessionsPVUsers
2026-05-02 (取得日)174014
2026-05-036116
2026-05-04121212
2026-05-05222

ぱっと見の印象は「初週としては悪くない」かもしれません。でもこのデータには 滞在時間751秒の日本人滞在時間0秒の世界9カ国 が同居しています。中間値が存在しない。これが今回の手がかりです。

5つのシグナルで殴る

ボット判定は1つの指標では絶対にやりません。誤判定を避けるため、私はいつも5つの軸を並べてクロスチェックします。

シグナルボットの典型値人間の典型値kaoriq実値判定
滞在時間0〜5秒30秒〜数分US 4.9s, FR 1.4s, KR 0s🤖
直帰率90〜100%40〜70%80%🤖
PV/Session1.0(1ページで離脱)1.5〜3.0US: 17/17 = 1.0🤖
国分布の異常性コンテンツ無関係な国が散るターゲット国に集中EN/JAのみなのにPL/IN/SG🤖
時系列の異常スパイク新規ドメインで初日にドカン徐々に増加5/2に40PV(取得日)🤖

単独シグナルだと騙される

「直帰率80%なら全部ボットでしょ」と即断したくなりますが、現実はそんなに優しくない。

  • 滞在時間だけ見る: 記事をタブで放置されると数十分の滞在になる。人間の「真剣な読者」とも、ただの「タブ放置勢」とも区別がつかない
  • 直帰率だけ見る: ランディングページが完璧に答えを返した場合、満足した人間も100%直帰する。優秀さとボットが見分けられない
  • 国分布だけ見る: 海外SNSでバズれば普通に多国籍流入は起きる。これだけでは弱い

5軸が 同時に ボット側に倒れているとき、初めて確信を持って「これはbotだ」と言えます。

二極化が決定打になった

今回のkaoriqで判定が揺るがなかった本当の理由は、滞在時間の 分布の形 です。

  • 日本: 5セッション / 平均滞在 751秒
  • 他国全部: 滞在 0〜5秒

人間トラフィックが本物なら、滞在時間は 20〜120秒帯にもう少しなだらかに散らばる はずです。「タイトルだけ見て離脱(10秒)」「冒頭読んで離脱(40秒)」「最後まで読んだ(180秒)」がグラデーションで存在します。

ところがkaoriqの分布は 二峰 で、中間がスポッと抜けています。これは「kenさん本人(=長時間滞在のテストアクセス)」と「クローラー(=瞬間離脱)」しかいない、と読むのが自然です。

逆に、もし「日本100sess / 滞在60秒、US 50sess / 滞在45秒、CA 20sess / 滞在30秒」のように 正規分布的に滞在時間が散る データだったら、本物の人間トラフィックの可能性が高い。

推定: 純粋な人間流入は何件だったか

ここまで殴ったうえで、私の見立てはこうです。

区分推定セッション数内訳
ken自身のテストアクセス4〜5日本5sessの大半、滞在751秒の主因
クローラー(Googlebot / Bingbot / GPTBot / ClaudeBot / AhrefsBot等)27〜30US 17 + 欧州・アジア各国の0秒滞在勢
純粋な人間の自然流入2〜5日本の残り、米国の数件

37セッションのうち 本物の人間は良くて5件 。これが新規ドメイン取得4日後の「現実」です。

なぜGA4はこれを除外してくれないのか

GA4には 「Known bots and spiders を自動除外」 機能がありますが、これは IAB/ABCのSpiders & Botsリスト に基づいた古典的なクローラー除外で、以下を取り逃がします。

  • JavaScript実行型クローラー: GPTBot、ClaudeBot、PerplexityBotといった生成AI系の新興クローラーはJSを実行するため、GA4のtagが発火する
  • SEOツール系クローラー: AhrefsBot、SemrushBot、MozBotなどは実行頻度が高く、新規ドメインを発見すると一斉にクロールしに来る
  • ヘッドレスブラウザ経由のスクレイパー: Puppeteer / Playwrightベースのカスタムbotは見分けがつかない

新規ドメイン取得直後は、このクローラー群が「IPアドレスの空き地」を発見しに来るフェーズ にあります。1週間〜10日でDNSが各社に伝播しきると落ち着きますが、初週のGA4を真に受けると判断を誤ります。

教訓: 新規プロジェクトの初週ダッシュボードに書くべき3つの注釈

  1. 「Engaged Sessions」を主指標にする: GA4の「エンゲージメントセッション」は10秒以上滞在 or 2PV以上 or コンバージョン発生のいずれかを満たすセッション。ボットの大半はここで弾かれる
  2. 国別の滞在時間分布を必ず見る: 1指標(セッション数や PV)を国別フィルタなしで見ると、ボット軍団が成果に化ける
  3. 取得後30日は「ノイズフェーズ」と割り切る: 真っ当な数字が出てくるのは、SNS導線・SEO・コンテンツ拡充が揃ってからです

まとめ: 自分のGA4も同じ目で見直してみてください

新規ドメインのGA4は、最初の1〜2週間は ほぼ嘘つきです。 米国・東欧・東南アジアからの「滞在0秒セッション」が並んでいたら、それはクローラーの大行進であって、あなたのコンテンツに惚れた人間ではありません。

判定の順番はシンプル: 5軸で殴る → 二峰分布を疑う → Engaged Sessionsを基準に置き換える 。これだけで、初期データに振り回されずに済みます。

GA4を疑う技術は、判断ミスを避ける技術でもあります。データに殴られる前に、データを殴り返しましょう。


この記事は実データに基づきます

  • 対象サイト: kaoriq.com (2026-05-02ドメイン取得、Astro v6 + Tailwind v4で構築中)
  • 計測期間: 2026-04-22 〜 2026-05-05 (実質4日稼働)
  • データ取得: GA4 Data API v1beta、Service Account経由
  • 分析ツール: 自作の harness-ops/tools/ga4/analyze.py (公開準備中)