はじめに

前回の従来型BIと「セルフサービスBI」のアプローチの違いではセルフサービスBIの特徴の説明や用語の整理を行いました。では、セルフサービスBIではどのような型式のデータが分析の対象となるのが一般的でしょうか?事前に整備された高品質なデータウェアハウス(DWH)のデータや、1個のExcelファイルにまとめられたシンプルな表にとどまるでしょうか?

データ分析の手前の「データ準備」が重要

セルフサービスBIで扱うデータが整理されたシンプルなものであることが理想的ですが、現実には業務で扱うデータ種類は多岐に渡り、またデータ構造も複雑であることが多く、その活用に際しては必然的に事前のデータ準備が必要となることが一般的です。このデータ準備の必要性を認識していないと、ユーザーが手前のデータ準備の時点でつまずいて実際に分析するところまで辿り着かないということが起きてしまいます。

data_prep_diff_easy2

では、データ準備で求めらる要件や作業はどのようなものが考えられるでしょうか?それらの典型的な例としては、以下のようなものが挙げられます:

  • 取り込む売上データの対象年月がExcelファイル名に含まれており(例: 売上データ_201701.xslx)、データを取り込む際にファイル名から年月を取得してレコードに付加する必要がある。
  • データ取り込みの際に、不正なコード値を含んだレコードは取り込まずに別のCSVファイルに保存し、検証・レコード修正に利用したい。
  • 売上実績は日単位、売上予算は月単位でデータを保持しており、予実比較のためにこれらのデータを紐づける必要がある
  • 営業担当は定期的に変更されるため、レコードの有効期間の開始日付と終了日付を列に保持して履歴管理している。このようなマスタデータを明細データに紐づけたい。

当然、扱うデータや分析の内容によっては単純にデータを取り込むだけで済むものもあると思いますが、そのような簡単なデータ・分析に限定した利用だけではなく幅広いユーザーによる多様なニーズに対応することを考えると、こういったデータ準備の必要性は多くの場合に生じてきます。

それに対してセルフサービスBIツールの評価や検討に当たっては、ITに精通していないビジネスユーザーによる利用も想定されるため、「如何に簡単にデータを変換して取り込んで、思い通りのチャートが作れるか」といった見た目やユーザビリティーのみに目が行きがちです。もちろん、ツールの利用方法が難し過ぎるとなると技術力の高いユーザーのみしか使いこなせないということになってしまいますので、それらを考慮することは必要です。しかし、こういった視点のみに偏ってセルフサービスBIを展開しようとすると、以下のような状況に陥ってしまう可能性があります:

  • ユーザーが簡単に操作できる程度の範囲に利用がとどまり、本来行いたい分析まで行えない。
  • ユーザーが複雑な変換要求に対応できず、結果的に新たなETLツールやデータベースを導入してデータを事前に変換・整理する必要が生じ、想定外の手間やコストが発生する。
  • 他部門でも利用したいという声が上がったり、新たな分析ニーズが発生したりした時に、それらの要件には対応できず、利用範囲に制限が発生する。

ですので、ユーザービリティーとデータ準備への対応の両方をバランスよく考慮し、データ準備の最適な仕組みも含めてセルフサービスBIのあり方を検討することが重要になると考えられます。

複数データソースを統合に対応できる順応性の確保

また、「DHW上でデータの整備を行うので、セルフサービスBIでは大したデータ準備は不要でビジュアライズさえできれば良い」と考えるのはどうでしょうか?そのような形で目の前にあるニーズを満たせることもあるかもしれませんが、そのような場合においても将来に渡って分析の対象とする全てのデータをDWHに格納して整備するとの前提で考えることで、データ活用の柔軟性を損なうリスクを伴う可能性があります。前回の従来型BIと「セルフサービスBI」のアプローチの違いで以下の図のご説明をさせて頂きましたが、従来型BIの「ダッシュボード・レポーティング」といった一番上のレイヤーがセルフサービスBIツールに置き換わってビジュアライゼーションは改善されたものの、従来型BIの「ビジネスのスピードにシステムがついてくることが出来ない」という課題に対応するといったセルフサービスBIの特徴が生かされないこととなってしまうというこです。

dwh_vs_qlik_v2

データ活用の現場では、以下の様なデータを上手く組み合わせて利用するニーズが想定されます:

  • 既存のデータウェアハウス(DWH)のデータ
  • 業務システム(営業管理、生産管理、人事管理、財務管理など)のデータ
  • クラウドサービス・SNS・外部ウェブサービスのデータ
  • ユーザーPC上の個人データ
  • 外部提供データ(市場データ、統計情報など)

一例として、DWHに格納された実店舗での登録会員やサービス利用実績を管理している小売業の企業でのデータ活用を想定してみましょう。もし、実店舗の売上や顧客分析を行うのであれば、DWHに格納されたデータのみを分析するだけで対応ができます。ただ、例えば実店舗に加えてオンラインも含めたオムニチャネル(Omni-Channel)での分析ニーズが生じた場合はどうなるでしょうか?オンラインのデータはDWHとは別のサーバー上にアクセスログや顧客行動データとして保存されており、これらのデータもDWHに統合しようとするコストも時間もかかる作業となってしまいます。

data_integration2

そのような場合、セルフサービスBIツールでこれらのデータを統合できる柔軟性を確保できると、これらの複数データソースのデータをセルフサービスBIツールの枠組みの中で統合し、実店舗とオンラインの顧客を横串で利用実績、顧客ポートフォリオ分析、チャネル別分析できるということになります。

この例のように、実店舗とオンラインの複数チャネルでの顧客のシングルビューを得るなど、複数システムからデータを活用することでより価値の高い分析を行えるケースが多くあります。また、複数データをDWHに一旦纏めたり、新たなETL(Extract/Transform/Load)ツールやデータベースを導入したりする必要がなく、ワンツールでの複数データソース統合への対応や、将来新たに発生しうる複数データソースの活用ニーズへの対応を確保できることは、「ビジネスのスピードにシステムがついてくることができる」といったセルフサービスBIツール活用における大きなメリットを享受することが出来ると言えます。

ビジネス・アナリストとデータ・アーキテクトの役割分担の考え方

ここまで、複数データソースのデータ統合への対応を含めたデータ準備の重要性についてご説明してきました。これらについて、あらゆる複雑なデータ変換に始まってチャート作成からデータ分析までを一人のユーザーで全て完結できることが理想的ですが、現実的には分析を行う業務ユーザーにとってはデータ分析から洞察を得てアクションに繋げることが重要であって、データ整備・準備するといった自体は時間を掛けたくない付随作業にあたりますし、またある程度のITスキルが要求されるような作業については対応が難しいケースが多くあります。

このような状況に対処するアプローチの一つとしては、必要に応じてそれぞれの作業を適切なスキルを持った担当者で分割することが有効であると考えられます。Qlik社では「ビジネス・アナリスト」と、「データ・アーキテクト」という2つの役割を定義しており、特に組織的な展開を図る場合にはこういった定義に従った役割分担や人員の教育・育成をおこなってセルフサービスBIの推進を図ることがより効率的であると考えられます。

business_analyst_data_architect

まず、データ・アーキテクトは複数のテーブルやデータソースからデータを統合や必要な変換処理を施し、データモデルの構築や分析アプリの基本構成の作成を行う役割を担います。このデータ・アーキテクトは、IT担当者である場合もありますし、業務部門で業務効率化や業務改善といったIT寄りの業務を担当されている方がその役割を果たす場合もあり、基本的にはビジネス・アナリストとコミュニケーションを取って要件を把握しながらビジネス・アナリストでは対応が難しいような作業を進めていくという形になります。

ビジネス・アナリストは対応できる範囲については自分たちでデータを取り込んでデータ準備や分析を行うことはできますが、それに加えてあらかじめデータ・アーキテクトによって作成されたデータモデルや分析アプリを活用し、必要に応じてチャートを作成したり、データ分析・探索をセルフサービスでおこなったりすることができます。このような役割分担を行うことでビジネス・アナリストのより広範囲な分析ニーズに応えることができ、組織としてもより効率的に対応することができます。

簡単な操作でデータ準備&複雑なデータ変換両方へのワンツールでの対応

では次に、「ビジネス・アナリスト」や「データ・アーキテクト」それぞれが行う作業をセルフサービスBIのツールはどのように支えることができるかを見てみたいと思います。Qlik社で提供しているQlik Senseでは、技術に精通しないユーザーでも簡単にデータ準備を行えるUI画面と、より高度な変換処理を実装でするスクリプト画面の2つを提供しており、ワンツールで簡単な操作でのデータ準備と、複雑なデータ変換の両方に対応できるというコンセプトで成り立っています。

あらゆる難易度の全ての要件にクリック操作で対応できることが理想的で、今後も製品の機能強化で対応可能な範囲も広がっていくと考えられますが、現実的には難易度の高い要件については変換ロジック実装などの作業が必要となってしまいます。そのため、ビジネス・アナリストの守備範囲であるそれほど難易度が高くない要件についてはユーザビリティーを重視した環境を、データ・アーキテクトが対応するより難易度の高い要件については幅広い複雑な変換処理に対応できる環境をそれぞれ提供しています。

diff_easy_matrix

まず、Qlik Senseではユーザー・インターフェース(UI)上でデータ準備を行える環境が提供されており、ビジネス・アナリストは簡単な操作でデータ統合や変換の処理などを行うことが出来ます。以下の図のように画面上のドラッグ&ドロップの操作でファイルを取り込んだり、「バブル」で表現されるテーブルを操作して複数テーブルを紐付けたり、専門的なデータモデリングに関する知識不要で直観的な操作でデータモデルを作成することが出来ます。また、その際にはデータプロファイリングによりデータの中身を自動的に分析し、複数のテーブルを関連付けるキーの推奨を表示するといったインテリジェントな機能も提供しています。

demo_flow

他方、ETL(Extract/Transform/Load)処理に相当するような高度な変換処理を組み込むことができるスクリプティング環境も提供されています。この環境上で、より高いITスキルを持ったデータ・アーキテクトはより複雑なデータ準備要件に対応することができます。

gui_script2

このように、ビジネス・アナリストは「使い易さ」を重視した操作が簡単なUI画面で、データ・アーキテクトはあらゆる複雑な実装を行えるスクリプト画面で、という形で一貫したワンツールで幅広いニーズに対応しています。

ここでは、データ準備や複数データソース統合の重要性、ビジネス・アナリストとデータ・アーキテクトの役割分担、そしてそれぞれのユーザーのニーズへのセルフサービスBIツールでのワンツールでの対応についてご説明してきました。次のエントリでは、これらの要素を包括した仕組みやプロセスといった観点からセルフサービスBIの展開の取り組みにおけるガバナンスについてご説明したいと思います。