GA4のデータをChat GPTのAdvanced Data Analysis(旧Code interpreter)で分析してみましょう。
今回はデバイスや性別、年齢とエンゲージメント関連の指標のデータをChatGPTのCode interpreterに読ませてデータの特徴を分析してもらいます。
手順は下記のようになります。
- GA4でデータ探索を作成する
- CSVファイルを加工する
- ChatGPTで分析する
1.GA4でデータ探索を作成する
まずGA4のデータ探索で下記のようなレポートを作成します。
今回はディメンション、指標、フィルタの設定はこのようにしています。
ディメンション
- 日付
- デバイスカテゴリ
- 性別
- 年齢
指標
- エンゲージメントのあったセッション数
- エンゲージメント率
フィルタ
- 性別 unknown除外、(not set)除外
- 年齢 unknown除外、(not set)除外
このようなグラフができたら、CSVファイルでダウンロードします。
CCSVファイルがダウンロードできたら、ChatGPTのCode interpreterで読み込めるように加工します。
2.CSVファイルを加工する
ダウンロードした状態のCSVファイルには不要な行が含まれるのと、文字コードが文字化けするので修正します。
- ダウンロードしたCSVファイルをテキストで開く
- Excelにコピー&ペーストする
- 不要な行を削除する
- CSV UTF-8で保存する
このようなCSVファイルに加工できました。
このファイルをChatGPTのCode interpreterに読み込んでみましょう。
3.ChatGPTで分析する
まずはGA4のデータであることを明示して、CSVファイルをChatAdvanced Data Analysis(旧Code interpreter)に読み込ませて内容を確認します。
このようにちゃんとGA4のデータであることを理解して、簡単なサマリを返してきました。
続いて、デバイスや性別、年齢とエンゲージメントのあったセッション、エンゲージメント率をグラフにしてもらいます。
ざっくりですがグラフができました。
なお、日本語の部分は文字化けします(2023年8月時点)。
以下、ChatGPTによるコメントです。
- デバイスカテゴリによるエンゲージメント:
- mobile および desktop は、エンゲージのあったセッション数が高い傾向にあります。
- エンゲージメント率はデバイスカテゴリに大きな差が見られないようです。
- 性別によるエンゲージメント:
- 男性と女性のエンゲージのあったセッション数にはあまり差が見られません。
- エンゲージメント率も、男性と女性の間に大きな差は見られません。
- 年齢によるエンゲージメント:
- 35-44歳の層がエンゲージのあったセッション数が最も高い傾向にあります。
- エンゲージメント率については、特定の年齢層で著しく高いまたは低いという明確なパターンは見られませんが、65+の層が少し高めになっているようです。
ChatGPTのCode interpreterでグラフを生成するとデフォルトはこの色味(グリーン〜パープルのグラデーション)になるようです(2023年8月現在)。
もちろんグラフの色も指示をすれば変更できます。ブルー系にしてもらいました。落ち着いた色でいい感じですね。
以上、デバイスや性別、年齢とエンゲージメント関連の指標のデータをChatGPTのAdvanced Data Analysis(旧Code interpreter)に読ませてデータの特徴を分析してもらうテストでした。