新規ドメインの最初の1週間、GA4は嘘をつく: kaoriq.com立ち上げ4日間の生データ
新規ドメインを取って4日後、GA4を開いたら 65 PV / 34 ユーザー / 9カ国 と表示されました。
Build-in-publicの民として一瞬「来てる!」と思いかけたのですが、よく見ると指標が全部おかしい。米国17セッションの平均滞在時間が 4.9秒、フランス・ポーランド・韓国・インド・シンガポールはそれぞれ 0〜1.4秒。日本だけが 751秒(12分超) という異様な数字でした。
ドメインは2026-05-02に取得した kaoriq.com(性格診断×香水のECサイト)。今日(5/5)時点でまだ20記事もない。冷静に計算するとPV単価は人間1人あたり数十秒の集中力を要求するはずで、4日でこの分布が出るのは物理的におかしい。
この記事では、新規ドメインの初週GA4データを 「ken本人 + クローラーの軍団」 と読み解いた手順を、実数を晒しながら共有します。GA4を新規プロジェクトで動かしている人、この週末にドメイン取った人、向けです。
晒す: 過去14日(実質4日稼働)の生データ
まずは数字をそのまま置きます。
全体サマリー
| 指標 | 値 |
|---|---|
| Sessions | 37 |
| Page Views | 65 |
| Total Users | 34 |
| New Users | 34 |
| 平均滞在時間 | 104.1秒 |
| 直帰率 | 80% |
国別
| 国 | Sessions | PV | 平均滞在(秒) |
|---|---|---|---|
| 🇯🇵 Japan | 5 | 33 | 751.0 |
| 🇺🇸 United States | 17 | 17 | 4.9 |
| 🇨🇦 Canada | 4 | 4 | 1.3 |
| 🇫🇷 France | 4 | 4 | 1.4 |
| 🇵🇱 Poland | 2 | 2 | 0.0 |
| 🇰🇷 South Korea | 2 | 2 | 0.0 |
| (not set) | 1 | 1 | 0.1 |
| 🇮🇳 India | 1 | 1 | 0.0 |
| 🇸🇬 Singapore | 1 | 1 | 0.0 |
日別
| 日付 | Sessions | PV | Users |
|---|---|---|---|
| 2026-05-02 (取得日) | 17 | 40 | 14 |
| 2026-05-03 | 6 | 11 | 6 |
| 2026-05-04 | 12 | 12 | 12 |
| 2026-05-05 | 2 | 2 | 2 |
ぱっと見の印象は「初週としては悪くない」かもしれません。でもこのデータには 滞在時間751秒の日本人 と 滞在時間0秒の世界9カ国 が同居しています。中間値が存在しない。これが今回の手がかりです。
5つのシグナルで殴る
ボット判定は1つの指標では絶対にやりません。誤判定を避けるため、私はいつも5つの軸を並べてクロスチェックします。
| シグナル | ボットの典型値 | 人間の典型値 | kaoriq実値 | 判定 |
|---|---|---|---|---|
| 滞在時間 | 0〜5秒 | 30秒〜数分 | US 4.9s, FR 1.4s, KR 0s | 🤖 |
| 直帰率 | 90〜100% | 40〜70% | 80% | 🤖 |
| PV/Session | 1.0(1ページで離脱) | 1.5〜3.0 | US: 17/17 = 1.0 | 🤖 |
| 国分布の異常性 | コンテンツ無関係な国が散る | ターゲット国に集中 | EN/JAのみなのにPL/IN/SG | 🤖 |
| 時系列の異常スパイク | 新規ドメインで初日にドカン | 徐々に増加 | 5/2に40PV(取得日) | 🤖 |
単独シグナルだと騙される
「直帰率80%なら全部ボットでしょ」と即断したくなりますが、現実はそんなに優しくない。
- 滞在時間だけ見る: 記事をタブで放置されると数十分の滞在になる。人間の「真剣な読者」とも、ただの「タブ放置勢」とも区別がつかない
- 直帰率だけ見る: ランディングページが完璧に答えを返した場合、満足した人間も100%直帰する。優秀さとボットが見分けられない
- 国分布だけ見る: 海外SNSでバズれば普通に多国籍流入は起きる。これだけでは弱い
5軸が 同時に ボット側に倒れているとき、初めて確信を持って「これはbotだ」と言えます。
二極化が決定打になった
今回のkaoriqで判定が揺るがなかった本当の理由は、滞在時間の 分布の形 です。
- 日本: 5セッション / 平均滞在 751秒
- 他国全部: 滞在 0〜5秒
人間トラフィックが本物なら、滞在時間は 20〜120秒帯にもう少しなだらかに散らばる はずです。「タイトルだけ見て離脱(10秒)」「冒頭読んで離脱(40秒)」「最後まで読んだ(180秒)」がグラデーションで存在します。
ところがkaoriqの分布は 二峰 で、中間がスポッと抜けています。これは「kenさん本人(=長時間滞在のテストアクセス)」と「クローラー(=瞬間離脱)」しかいない、と読むのが自然です。
逆に、もし「日本100sess / 滞在60秒、US 50sess / 滞在45秒、CA 20sess / 滞在30秒」のように 正規分布的に滞在時間が散る データだったら、本物の人間トラフィックの可能性が高い。
推定: 純粋な人間流入は何件だったか
ここまで殴ったうえで、私の見立てはこうです。
| 区分 | 推定セッション数 | 内訳 |
|---|---|---|
| ken自身のテストアクセス | 4〜5 | 日本5sessの大半、滞在751秒の主因 |
| クローラー(Googlebot / Bingbot / GPTBot / ClaudeBot / AhrefsBot等) | 27〜30 | US 17 + 欧州・アジア各国の0秒滞在勢 |
| 純粋な人間の自然流入 | 2〜5 | 日本の残り、米国の数件 |
37セッションのうち 本物の人間は良くて5件 。これが新規ドメイン取得4日後の「現実」です。
なぜGA4はこれを除外してくれないのか
GA4には 「Known bots and spiders を自動除外」 機能がありますが、これは IAB/ABCのSpiders & Botsリスト に基づいた古典的なクローラー除外で、以下を取り逃がします。
- JavaScript実行型クローラー: GPTBot、ClaudeBot、PerplexityBotといった生成AI系の新興クローラーはJSを実行するため、GA4のtagが発火する
- SEOツール系クローラー: AhrefsBot、SemrushBot、MozBotなどは実行頻度が高く、新規ドメインを発見すると一斉にクロールしに来る
- ヘッドレスブラウザ経由のスクレイパー: Puppeteer / Playwrightベースのカスタムbotは見分けがつかない
新規ドメイン取得直後は、このクローラー群が「IPアドレスの空き地」を発見しに来るフェーズ にあります。1週間〜10日でDNSが各社に伝播しきると落ち着きますが、初週のGA4を真に受けると判断を誤ります。
教訓: 新規プロジェクトの初週ダッシュボードに書くべき3つの注釈
- 「Engaged Sessions」を主指標にする: GA4の「エンゲージメントセッション」は10秒以上滞在 or 2PV以上 or コンバージョン発生のいずれかを満たすセッション。ボットの大半はここで弾かれる
- 国別の滞在時間分布を必ず見る: 1指標(セッション数や PV)を国別フィルタなしで見ると、ボット軍団が成果に化ける
- 取得後30日は「ノイズフェーズ」と割り切る: 真っ当な数字が出てくるのは、SNS導線・SEO・コンテンツ拡充が揃ってからです
まとめ: 自分のGA4も同じ目で見直してみてください
新規ドメインのGA4は、最初の1〜2週間は ほぼ嘘つきです。 米国・東欧・東南アジアからの「滞在0秒セッション」が並んでいたら、それはクローラーの大行進であって、あなたのコンテンツに惚れた人間ではありません。
判定の順番はシンプル: 5軸で殴る → 二峰分布を疑う → Engaged Sessionsを基準に置き換える 。これだけで、初期データに振り回されずに済みます。
GA4を疑う技術は、判断ミスを避ける技術でもあります。データに殴られる前に、データを殴り返しましょう。
この記事は実データに基づきます
- 対象サイト: kaoriq.com (2026-05-02ドメイン取得、Astro v6 + Tailwind v4で構築中)
- 計測期間: 2026-04-22 〜 2026-05-05 (実質4日稼働)
- データ取得: GA4 Data API v1beta、Service Account経由
- 分析ツール: 自作の
harness-ops/tools/ga4/analyze.py(公開準備中)
この記事は役に立ちましたか?