オープンデータをLooker Studioで可視化してみよう【港区の国籍別外国人住民数】|Looker Studio
自治体などから公開されているオープンデータをLooker Studioで可視化してみましょう。
今回は東京都港区が公開している「港区オープンデータカタログサイト」から「国籍別外国人住民数」を利用します。
公開されているオープンデータはこちらになります。
https://opendata.city.minato.tokyo.jp/dataset/kokusekibetsu_jinko
出典:港区オープンデータカタログサイト「国籍別外国人住民数」
CSVデータを下処理する
このデータはCSV形式で提供されているので、ダウンロードしてGoogleスプレッドシートに読み込みます。
年月ごとの国籍別の住民数のデータがありますが、このままだとLooker Studioに読み込んだ際にデータが扱いづらいので「年月」「国籍」「住民数」のかたちに処理します。
こんな感じに「年月」「国籍」「住民数」が縦に並んだデータが用意できました。
Looker Studioに読み込む
このデータをLooker Studioに読み込みましょう。
スプレッドシートなのでLooker Studioから簡単に接続できます。読み込みたいシートを選択して接続します。
このようにスプレッドシートのデータがLooker Studioに接続できましたが、「年月」のデータが「数値」として認識されているので、これを修正します。
元のデータの「年月」は「202305」のように6ケタで記載されています。このままだとLooker Studio上で期間を表すデータとして利用できません。
「202305」のように数値として認識されているフィールドを日付にするには「フィールドを追加」から計算フィールドで日付に変更します。
PARSE_DATe("%Y%m", CAST(年月 AS TEXT))
※今回はdateの情報がないので、Y(Year)とm(month)だけにします。
これで「年月」が日付(期間)のデータとして扱えるようになりました。
Looker Studioで可視化する
まずはデータを読み込んでシンプルな横棒グラフにしてみました。
※このデータは2012年7月から2023年7月までのデータです。
国籍別で見ると「中国(人)」「韓国及び朝鮮(人)」「米国(人)」の順に多いことがわかります。
時系列で推移を見てみましょう。
新型コロナウイルスの流行が始まった時期から減り始め、2023年7月の時点では流行の前と同じくらいの水準まで戻っているのがわかります。
積み上げ縦棒グラフだと国籍ごとの住民数の推移が見づらいので、国別に見られるように折れ線グラフにしてみましょう。
中国(人)の住民数が急速に増加していますが、それ以外の国は横ばい、微減といったところでしょうか。
今回はオープンデータを利用してLooker Studioで可視化してみましたが、元のデータの行列の組み合わせや日付の表記方法によってはLooker Studioに読み込む前の下処理や、Looker Studioの計算フィールドでのデータの加工が必要になります。
以上、オープンデータをLooker Studioで可視化してみる、でした。