GA4のサンプリングとは? 発生する状況と回避する方法を解説
GA4のレポート画面で「赤い△」が表示された場合、「サンプリング」された数値が表示されています(あるいは「しきい値」が適用されている)。
GA4のサンプリングとは、大量のデータから一部のデータのみを使用して全体を予測して数値を集計している状態です。
すべてのデータを元にした結果ではないので、数値の精度が低下します。
サンプリングが発生する状況
無料で利用できるGA4の場合、イベントの割り当て上限(クエリごとに1,000件)を超えるとデータのサンプリングが発生します。
有料(アナリティクス360)の場合、上限が増えます(クエリごとに10億件)。
サンプリングを回避する方法
GA4のサンプリングを回避する方法はいくつかありますが、サイトやビジネスの規模に合わせた選択が必要です。
1.レポートの期間を短くする
データを集計する対象期間が短くなれば、当然、対象となるイベント数が少なくなります。しかし、見たい期間の数値が見られないのは使い勝手が悪いですね。
2.BigQueryに連携する
GA4をBigQueryに連携すると、すべての(一応)データがBigQueryに格納されますので、集計時にデータを使用する上限が適用されることはありません。
導入のしやすさやコストを考慮すると、これが一番、現実的な回避方法だと思われます。
3.有料版のGA4を利用する
有料版のGA4ではクエリごとの上限が増えるのでサンプリングが発生するケースが低減できます。
また「非サンプリングデータの結果をリクエスト」というオプションを利用して、サンプリングされていないデータを入手することも可能です。
ただし、導入コストが高いため、サイトのビジネス規模によってはあまり現実的ではないかもしれません。
以上、GA4のサンプリングについて発生する状況と回避する方法の解説でした。