データを分析する際、データそのものの設計に「縦持ち」「横持ち」という表現があります。
この2つは構造的にまったく異なる設計で、ヒトが目で見て内容を判断するぶんには問題ありませんが、特にBIツールを用いて可視化する場合には大きな障壁になり得ます。
今回はBIツールで分析・可視化する前提でデータの「縦持ち」「横持ち」のについて解説します。
データの「横持ち」とは?
まずデータの「横持ち」とは下のような例です。
列に「月」を配置し、行に「ユーザー数」「セッション数」「売上」「販売個数」「平均単価」が配置されています。
よくExcelやGoogleスプレッドシートで数値をまとめる際に、この「横持ち」形式を見かけるのではないでしょうか。
ヒトが目で見るぶんにはまったく問題ありませんね。
データの「縦持ち」とは?
一方、データの「縦持ち」は下のようなかたちになります。
「横持ち」とは異なるのがデータの項目(青いセル)に対して、各データ(白いセル)が縦に並んでいる(縦に積み上がっている)のがわかると思います。
「横持ち」「縦持ち」でもデータの中身は同じですが、構造が異なりますね。
※便宜的に表の中に単位(円)などを入れていますが、通常は単位は入れません
Looker StudioやBIツールで扱い易いのは?
Looker StudioやTableauなどBIツールで「最終的に表やグラフにする」のであれば、データは「縦持ち」ほうが断然、使い易いです。
「横持ち」のデータはBIツールで扱うことができないというわけではありませんが、ちょっとしたグラフの表現で行き詰まる可能性が高いです。
最終的にBIツールで可視化する前提であれば、各項目(Looker Studioでは「ディメンション」と呼ぶ)ごとの数値(「指標」と呼ぶ)を「縦持ち」にしたデータ構造でもとデータを準備しましょう。
もちろんTableauのように「横持ち」のデータを変換する機能があるBIツールも存在するので、 BIツール側で対処することも可能ですが、やはり「ひと手間」かかってしまいます。
もし、もとデータを用意する担当者がほかにいる場合、「縦持ち」設計でデータを準備するよう依頼しましょう(もとデータを準備する段階で「縦持ち」にしておくほうがラクです)。
以上、データの「縦持ち」「横持ち」についての解説でした。