はじめに

ビッグデータ活用に対する取り組みや、現場主導で柔軟かつ迅速にデータ分析を行いたいという業務ユーザーが高まるニーズを反映する形で、昨今ビジネス・インテリジェンス(BI)の「セルフサービス化」が注目されています。ただ、この「セルフサービスBI」を展開しようという取組みは、企業に属する特定の社員やグループがExcelを利用する延長線で好みのツールを利用するといった「ユーザーに全てお任せ」のセルフサービスBIでは、個々人の分析力向上は見込めるものの「局所的」な動きに留まってしまいます。セルフサービスBIを展開することよって、ユーザーが多種多様なデータを効率的に扱える環境を最適化し、データに基づいた判断を行うといったデータドリブンな企業文化を醸成する、また価値創造やイノベーションを起こすための武器として活用していくといった「組織レベル」での働きかけがより重要になります。

「セルフサービスBI」は従来型BIとどのように異なるのか?

今日、ほとんどの企業ではレポーティングやデータ分析を行う仕組みとしてBIシステムが既に導入され、長年利用されてきています。そういった形で従来型BIのシステムが広く使われている中、なぜ新たな「セルフサービスBI」のツールやソリューションが求められているのか?という点についてのご説明することろから始めさせて頂きたいと思います。

dwh_vs_qlik_v2

従来型BIは図の左側にあるように、基幹システムからETL(Extract/Transform/Load)ツールでデータを抽出・変換してデータウェアハウス(DWH)に統合し、そこから多次元キューブを構成してダッシュボードやレポーティングツールで可視化するといった複数スタック(層)の構成が一般的にとられています。そして、そのようなシステムの構築はIT担当者が要件定義から始めて延々と可視化に至るまで、長期的なプロジェクトを通じてそれらのスタックを一つ一つ積み上げていく形で進められてきました。このような大規模なシステムではなくAccessやExcelを利用してデータ分析を行っている場合もありますが、いずれの場合も要件を纏めてからデータを可視化して分析できるようにするまでに非常に長期の時間と労力を要しました。また一旦構築が完了した後は、見たいデータの追加や分析の切り口を変更するといった変更作業も同様の理由で迅速に行えないといった「ビジネスのスピードにシステムがついてくることが出来ない」という課題が多くの企業で慢性的に存在しました。

そのような課題に対して一つの解決策を提示したのが上記図の右側に位置する「セルフサービスBI」になります。セルフサービスBIでは、業務系システム、DWH、クラウド、ユーザーデータなどの様々なソースシステムからデータを抽出してデータ準備を行った後にデータモデルを作成し、インメモリエンジンで高速集計を行いながらビジュアル化するといった一気通貫の作業を1つのツールの中で、かつユーザー主導によって完結させることが出来るといったことが大きなメリットになります。そして、その作業を従来型BIの様に長期間かけて行うのではなく、スピードや柔軟性を重視し、まずはプロトタイプを作成してユーザーレビューを行い、そのフィードバックに基づいて洗練化するといったサイクルを繰り返すこともできます。

さらに昨今、データ探索やデータ・サイエンティストという言葉が頻繁に使われるようになっている状況が示す通り、レポーティングによる受動的な情報入手から、個人による能動的なデータの活用の流れが強まってきました。また、デジタル化やビッグデータ活用の高まりによるデータの種類やデータ量の増大し、その反面コンピューティング能力の向上によりコストを掛けずにデータ分析を支える環境を用意できるようにもなってきました。これらの流れが、多くの企業において以上でご説明したようなユーザー主導かつスピードを重視するセルフサービスBIへの傾斜を強めることに繋がってきたと言えます。

「セルフサービスBI」によりスモールスタートで効果を評価し、リスクを低減

従来型BIのシステム構築においての作業は、数十ページにわたるソースデータのテーブル定義書を眺めつつ、サンプルデータの中身を確認して延々と確認を行いながらデータモデルの設計を行ったり、Excelに絵を書きながら画面設計を行ったりすることが一般的です。そうすると、以下の様な形で検討を開始してから実際にユーザーの目に見える画面が出来上がるのは長いプロセスで数か月を要します。そういった形でプロジェクトを進めるに当たっては「この設計通りに技術的に実現可能なのか?」、「実際に画面の利用感にユーザーは満足するのか?後で色々と変更のリクエストが出ないか?」といったリスクを低減させるのは非常に大変なことになります。

sib_flow_v2

この状況を改善することができるのがセルフサービス型のBIツールになります。サンプルデータを取り込むとそのままチャートで可視化することができ、以下の図の様な形で事前検討段階において既に利用ユーザーのレビューを受けながら詳細を詰めていける進め方が可能となります。従来とは大きく異なったアプローチで実物を作り込みつつ、実際の画面をレビュー頂いて洗練化しながら話を進めることができます。

sib_flow2_v2

実際にQlik社では、多くのお客様でSiB(Seeing is Believing)というものを製品の検討段階や導入前に実施頂いています。SiBとは「百聞は一見に如かず」ということを意味し、一般的にPOC(Proof of Concept)と呼ばれるものに近いものになりますが、POCと異なるのは技術的な実現可能性だけではなく、多くの場合お客様の実際のデータを利用して分析アプリケーションを作成し、ユーザーがアプリを触ってみて利用感や試して使ってみたうえでの実際の効果も評価を行える点です。これにより、プロジェクトを進めるに当たってのリスクを大きくコントロールすることが出来ますが、こういったアプローチはこれまでの従来型BIでは難しいものでした。お客様によってはこのSiB段階で実際に運用において利用できるレベルに近い完成度のものが出来上がるケースもあります。セルフサービス型BIツールの特性を生かすアプローチとして、この様な進め方が推奨されます。

「アジャイルBI」、「データ・ディスカバリ」、「セルフサービスBI」?

ここでは、ユーザー主導でデータ分析やチャート作成を行うこと全般を指して「セルフサービスBI」という形で呼んできました。ただ、他に「アジャイルBI」や「データ・ディスカバリ」といった言葉も異なるポイントに力点を置いて同様なツール群を指すものとして世の中では使われており、ここで少し用語の整理を行ってみたいと思います。

self-service-define

まず、「アジャイルBI」ですが、これはいわゆるソフトウェア開発におけるアジャイル開発の手法を意識しており、従来型BIにおけるウォーターフォール型開発の進め方に対する開発やプロジェクトの進め方に焦点を置いた考え方として位置づけられます。先ほどのご説明ではスモールスタートで効果評価やリスクを低減するメリットについて触れましたが、この説明は「アジャイルBI」の側面に焦点を置いたご説明になったということになります。

次に、「データ・ディスカバリ(Data Discovery)」は「データ探索」と訳われますが、この言葉は「何が起きたか」の記述的(Descriptive)なレポーティングを主に目的としたIT主導の従来型BIに対し、「なぜ起きたか」といった診断的(Prescriptive)なデータの探索をユーザー主導型で行えるというデータ活用手法やその活用を支援するツール、及びこの2つのアプローチの対立軸に焦点を置いたものです。この時、「データ探索」という能動的な行為を行うのは「データ分析を行いたい、もしくは業務上行う必要性があるビジネス・アナリスト」が中心となりますので、主にこれらのユーザーにとって従来型BIやExcelでは満たせないユーザー主導の分析、柔軟なビジュアライゼーションへの対応といったギャップを満たすツールや分析手法として認知が高まってきました。ただここでは、必ずしも自分でチャートやレポートを「セルフ」で作成・開発ということは必須条件ではなく、他のユーザーが作成して公開されたアプリやそこに含まれる明細データを利用して分析するといったデータ探索の手法全般を含んでいました。

そのような中で昨今セルフサービスBIという言葉が使われている背景には、「市民データ・サイエンティスト」や「情報アクティビスト」といったユーザー層の存在が叫ばれるようになっている状況が示すように、利用主体がデータ分析者や情報生産者として位置づけられるビジネス・アナリストだけでなく、ITに精通していないビジネスユーザーや今までExcelなどを利用していたユーザー層への展開が求められていることにあります。つまり、セルフサービスBIではより広いユーザー層での利用、そしてそれらのユーザー層に受け入れられ得る高いユーザビリティーといった点がフォーカスされてきているということになります。

くのツールはこれらの3つの視点から求められるニーズをカバーしていますのでこれらの用語を厳密に使い分けることはそれほど重要ではありません。ただ、これらの3つの異なる視点でツールの活用が議論されうることを理解したうえで、セルフサービスBIに焦点を置いた場合には、これまでデータ分析に触れていなかったユーザーを含めた広いユーザー層への組織レベルで社内展開が重要な要素になるということになります。

セルフサービスBIでは「いかに簡単にチャートを作成できるか」といったユーザビリティーが重要視されますが、組織レベルでの利用促進の側面から見た場合、例えばデータ分析に至るまでの裏側のデータの準備といったことも重要になってきます。次のエントリでは、それに関連して「データ準備」や「複数データ統合」の重要性についてご説明したいと思います。