【Power BI】Power Query を使ってみよう!①

BI技術者の雑記
本コラムでは、Excelと相性の良いBIツールであるPower BIについて、3回にわたってご紹介します。
1.はじめに
日常的にWindowsパソコンを起動し、業務に従事されている方に質問です。
あなたが1日のうち、最も多く使用しているアプリケーションは何でしょうか?
OutlookやThunderbirdといったメーラーでしょうか。
秀丸やサクラエディターに代表されるテキストエディターでしょうか。
ZoomやTeamsのようなコミュニケーションツール?
違いますよね。そうです、それは…
Excelです!
インターネットブラウザでは…?
といった至極まっとうな意見は一旦心の中にしまっていただいて、Excelがなければ仕事が立ち行かなくなる、ということに異論のある方は少ないのではないかと思います。
Excelは表計算ソフトウェアですが、いまやその枠組みを飛び越え、幅広い用途で使われています。
各種ドキュメントの作成に使われているのはもとより、データベースとして利用している、VBで独自の業務アプリケーションを構築している、というケースもあるでしょう。
私たちの仕事に限って言えば、Excel以外のソフトで作成された設計書やテスト仕様書を見る機会は、本当に、本当に少なくなりました。
ここではそんなExcelと相性抜群のBIツール──
Power BIのある機能について、ご紹介します。
「相性抜群」なのは当然で、一言で説明するなら、ExcelとPower BIは同じMicrosoft社製品になります。
2014年、現Microsoft社CEOのサティア・ナデラ氏が就任して、最初にリリースした製品が「Power BI」だった。(※1)
2.「データの準備に80%」
Excelで作られたこのような表をよく目にします。
いかがでしょうか。
多くの方にとって、既視感のある資料ではないでしょうか。
今回のブログではある程度の情報量でとどめていますが、実際には月々の稼働時間や労働単価など、多種多様な情報を肉付けして利用されていると思います。
さて…実は、この表、このままではBIツールでビジュアル化(ビジュアライゼーション)することに適していません。
「何が適していないのだろう?」と思われた方、ここでは単に「適していない」ということを認識していただくだけで大丈夫です。
ということを踏まえつつ、前段の資料をインプットに、理想形として下の形に編集していきます。
その目的を達成するため、今回は“Power BIのある機能” を使ってみたいと思います。
なお、データアナリストはデータの準備に8割の時間を費やし、残りの2割で分析と意思決定を行う、と言われています。(※2)
今回のブログは、こうした矛盾を出発点の一つとしています。
3.Power Query ~Power BIに内包されるデータ・プレパレーションツール~
Power BIにはPower Queryというデータ・プレパレーション(Data Preparation)ツールが内包されています。
データ・プレパレーションとは何でしょうか。
日本語に直訳すると、まさしく「データの準備」となります。
データ・プレップと言ったりもします。
それでは、データ・プレパレーションとETLツールでは何が違うのでしょうか?
ETLは下記3つの英単語の頭文字をつなげたものを語源とします。
・抽出(Extract)
・変換(Transform)
・格納(Load)
ETLもデータ分析における前段階の処理で、データを分析しやすいよう整えるために使用されます。
しかし、巷ではどうも、ETLとデータ・プレパレーションは異なるものとして扱われているようです。
特に顕著な違いとして、ETLはいわゆる「システム開発者」が使うもの。
データ・プレパレーションは「データアナリスト」や「データサイエンティスト」が自身で使うもの。
と定義されているようです。
なお、Power QueryはPower BIだけに搭載された機能ではありません。
実はExcelに実装されていますし、その他いくつかのMicrosoft社製品でも動作します。
また、データ・プレパレーションは、Microsoft社以外の製品も販売されています。
その時の用途・目的(もちろん予算も!)に合わせて、導入を検討する必要がありますね。
今回はここまでとなります。
「【Power BI】Power Query を使ってみよう!②」「【Power BI】Power Query を使ってみよう!③」で、前出の帳票をビジュアライゼーションに適したフォーマットに実際に“加工“していきたいと思います。
<出典>
※1 BUSINESS INSIDER「マイクロソフトでメール以上に使われているツール『Power BI』とは」
※2 Forbes「Cleaning Big Data: Most Time-Consuming, Least Enjoyable Data Science Task, Survey Says」
「【Power BI】Power Query を使ってみよう!」シリーズ(全3回)
第2回:【Power BI】Power Query を使ってみよう!②
第3回:【Power BI】Power Query を使ってみよう!③