CIO_ウルトラバナー

ウルトラバナー横テキストバナー

イベント紹介用テキストバナー

IT投資/ROI

データ統合で今、企業が見据えるべき課題

ROIの明確化、データ・ガバナンスの確立、データ品質の確保――今日の企業が突き当たる主な課題と、とりうるアプローチ

2010/10/05

多くの企業にとって、社内に散在するデータを統合し、ビジネスでいかに活用していくかは積年の課題であろう。特に近年は、グループ経営の強化やグローバル化対応などに向け、社内/グループ内におけるデータの統合/管理に注力する企業が増えてきた。では、これに取り組むにあたり、今日の企業はどのような課題に直面するのだろうか。ここでは、想定される主な課題を概観したうえで、それに対するアプローチの例を紹介する。

大久保将也/安間千晃 日本IBM ビジネス・アナリティクス&オプティマイゼーション

 

データ統合を巡り、今日の企業が抱える課題

 近年、業界をまたいだボーダーレスな競争が激化し、M&Aによる業界再編の動きも加速している。それに伴い、グループ企業を含めた経営情報の見える化や、グローバル視点による経営最適化の目的から、経営層がCIO/IT部門に対して売上情報や在庫情報をリアルタイムで提供するよう求めるケースが増えてきた。

 また、各種法規制など外部要因に対応するために、AML(Anti Money Laundering)やIFRS(International Financial Reporting Standards:国際会計基準)の対応パッケージに対して、必要なデータを的確なタイミングで提供することが要求されることも多くなっている。

 さらに、企業としての対応スピードを上げるために、現場レベルで顧客や市場の動向を多面的に把握し、高度な分析を実施して、自律的に意思決定を行いたいという要望も強くなってきている。
 

●データ統合の不備/不足が正確な意思決定を阻害する
 一方で現在、企業が扱うデータそのものが爆発的に多様化/増大している。インターネットや携帯電話の普及により顧客のライフスタイルや嗜好が多彩化し、データが発生する場所や種類が従来とは変わってきたのだ。これまで扱ってきたテキスト・データに加えて、動画や音楽データ、RFIDなどのセンサ・データを扱うケースも増加している。

 だが、これら日々発生するおびただしい量のデータに対し、多くの企業は正確な情報に基づく迅速な意思決定を行えずにいる。これは、「企業内に散在するデータの中から必要なデータを最適なタイミングで収集し、意味のある情報として不整合なく提供する」という活動、すなわちデータ統合が十分に実践できていないことが原因である。年々進歩するIT(情報技術)を駆使しても、データ統合の実現はいまだ容易なことではないのだ。それはなぜか?

 理由は、統合対象となるデータの特性が及ぼす影響が大きいからである。多くの企業はこれまで、各社のIT戦略に基づき、社内の各種業務の優先課題を解決すべくシステムを構築してきた。その中で、IT部門はITの視点で全体最適化を考えてきたわけだが、経営上の判断から個別最適な対応をとらざるをえず、その結果、少なからぬシステムがサイロ化している企業が多いのが実情である。

 つまり、多くのデータ統合プロジェクトでは、サイロ化したシステムに散在する個別に管理されたデータを、整合性のとれた意味のある情報に変換しなければならない(図1)。そして、サイロ化したデータの統合は、非常に複雑で困難を極める。これこそ、データ統合が多くの企業で積年の課題となっている最大の理由なのだ。

 こうした状況の中でデータ統合に取り組む際には、常に3つの課題が付きまとう。それは、「投資対効果の明確化」、「データ・ガバナンスの確立」、そして「データ品質の確保」である。以下に、それぞれの課題の詳細を述べる。

 

投資対効果の明確化

 「何のためにデータを統合するのか」――データ統合に際しては、これが最初に明確にしなければならない課題となる。
 データ統合の実現にはいくつかのパターンがある(図2)。例えば、一時的な統合であればスナップショットを作成する方法(パターン1)があるし、恒常的にデータを統合する場合なら、データ・ウェアハウスを構築して分析データとして統合する方法(パターン2)や、対象データを一元管理するシステムを構築する方法(パターン3)などがとれる。

 また、実現コストは統合パターンによって大きく異なるが、データ統合という部分だけを切り出して見た場合、いずれの統合パターンを採用した場合でもROI(投資対効果)が不明瞭なことが多い。これは、データ統合の結果として手に入るのは、あくまでも統合されたデータのみであり、それだけでROIを測るのは難しいからだ。そのため、統合されたデータを、だれがどのように使うのか、それによってどのような経営上の効果が生まれるのかを最初に明確にする必要がある。そして、データ統合によって業務プロセスの改善/効率化が果たされることで、初めてROIを評価できるようになる。

 流通業における商品マスタ・データの統合を例にとってみよう。全社で商品マスタ・データが統合されていないと、企画部門から販売店まで最新情報の伝達を徹底しづらい状況が起きる。販売店が最新だと思っている情報が古いものである可能性があり、最新情報と古い情報の重複が発生しうるため、多数の部門/関係者へのメールでの伝達、内容確認、問い合わせへの対応など煩雑なコミュニケーションが発生し、情報確認が非効率的になりやすい。

 こうした問題を解決するために、各システムで個別に管理されている商品マスタ・データを統合することを考える。マスタ・データの一元管理が可能になれば、各商品に関連する販促品も併せて管理できるようになる。販売店の担当者が個別に電話で確認する手間や、古い情報に基づく誤発注の取り消しといった手戻りが減れば、それが残業時間の減少につながり、具体的なコスト削減を果たせるだろう。

 このように、データ統合の成果を、それに基づく業務プロセス改善で実現される定量効果を含めて評価すれば、投資に見合った効果があるかどうかも明確になるだろう。

 

データ・ガバナンスの確立

 データ・ガバナンスの課題とは、データ統合がシステムの統合だけでは済まないことを意味する。データは、それを直接的に扱うシステムだけで管理されるのではなく、そのデータの責任者(オーナー)がだれで、どのような承認プロセスで管理されるのか、どのようなデータ品質基準を定めているかといった、データを取り巻くガバナンスによって管理されているのである。

 データ・ガバナンスの具体的な項目としては、データの変更管理、運用/ライフサイクル管理、オーナーシップと管理プロセスなどが挙げられる。データ統合に際しては、これらのデータ・ガバナンスも含めて考慮しなければならない。例えば、全社規模のデータ統合に臨む際には、統合したデータのガバナンスに関しても部門横断的に取り組むことになる。一般に、企業全体でデータ・ガバナンスを確立するには、関連する多くのステークホルダー(利害関係者)を巻き込む必要があり、難易度が高くなる傾向にある。

 ここで、社内に散在する顧客情報を統合する際の名寄せを例にとってみよう。

 この場合は、まず統合対象となる顧客情報がどのシステムに、どう格納されているのかを把握する必要がある。

 次に、各システムに散在する顧客情報を統合するために、複数の顧客情報の統合可否を判断する名寄せ機能を用意しなければならない。統合されたデータの精度を高くするには、名寄せ機能のすべてをシステム化するのではなく、必要に応じて人が目視で判断する仕組みを併せて導入するのが望ましい。これは、名寄せツールを使うことで各顧客情報の類似度をスコア化できるが、システムでは判断がつかない中間的なスコアが出たときには、人が判断したほうが統合後のデータ精度を高められるからだ(図3)。

 では、ある顧客情報と別の顧客情報を統合できるかどうかを、一体だれが判断するのか。各部署が管轄する複数のシステムで発生した顧客データが同一人物のものかどうかを判断するには、部署横断的に判断する役割/プロセスが必要になる。こうした役割をどの組織が担当し、どのようなプロセスで回していくのかも含めて改革を行うことで、初めて全社的な顧客情報の統合が実現できるのである。

 

データ品質の確保

 統合対象となるサイロ化されたデータ・ソースの数が増えると、それに応じて統合対象データの種類が増えることになり、一般的には統合の難易度が高まる。

 その理由の1つは、統合対象のデータの信頼性が低いことが多いためだ。データ品質の劣化が最も起こりやすいのは、データ入力時である。例えば、各データ・ソースにおいて、単純な誤字脱字から始まり、住所と郵便番号の不整合、「株式会社」と「(株)」といった表記の揺れなどが生じるケースが多い。また、入力時は正しい情報であっても、引っ越しで住所が変わったといった情報をきちんと把握してシステムに反映できていないと、結果的には整合性の取れていない情報になってしまう。

 2つ目の理由は、個別最適化されたシステムの間では、データ・フォーマットやコードのケタ数が異なっていたりすることが多いためである。これがデータ統合パターンの増加/複雑化につながり、レコードの重複や項目定義の差異を完全に統合するのが難しくなる。

 以上の結果、「顧客マスタに同一人物のレコードが複数存在する」、「同じコード値が違う意味を持つ」といった具合に、統合後のデータ精度の低下を招きやすい。これでは「金はかかったが使われないシステム」になる可能性が高いだろうし、そもそもデータ統合がうまくいったとは言い難い。

 加えて、たとえデータ統合の完了当初は要求品質を確保できたとしても、運用を重ねる中で統合対象のデータの量や種類が増えていき、次第に統合後のデータの品質が低下していくケースが多い。これらの品質低下に対し、人手でカバーしなければならない範囲が広くなると、運用コストが高くなり、ユーザーの使い勝手も悪くなる。データ統合では、継続してデータ品質を担保し続けられる仕組みも必要なのだ。

 

データ統合の課題解決へのアプローチ

 ここまで、データ統合を巡る課題を概観してきたが、続いては、それらの課題への取り組み方の例を、具体的な事例も踏まえて紹介したい。取り上げるのは、次の3つのテーマだ。

●データ・ガバナンスの観点でのステークホルダー・マネジメント
●データ品質基準の設定/アセスメントの実施
●エンタープライズ・データ・ウェアハウスの構築

 以下に、それぞれの詳細を述べよう。

 

データ・ガバナンスの観点でのステークホルダー・マネジメント

 データ・ガバナンスを機能させるためには、ガバナンスの一端を担うデータ・ソース管理部門がデータ統合の意義を理解し、プロジェクトに深くコミットすることが不可欠となる。とは言え、データ統合プロジェクトは、業務との直接的なかかわりが少ないこともあり、それらの部門のプロジェクトへの参加度合いは薄くなりがちだ。そのハードルを乗り越えるためのポイントの1つは、ステークホルダーに対し、なるべく短いサイクルで効果/メリットを提供していくことである。

 ある企業がデータ・ウェアハウスの構築(図2の統合パターン2)をスコープとしたプロジェクトに取り組んだ事例を例にとって説明しよう。

 一般的なデータ・ウェアハウスでは、情報はデータ・ソースからデータ・ウェアハウスに向けて一方通行で流れるだけであり、データ・ウェアハウス側からデータ・ソースに情報を戻す機能は持たない。つまり、データ・ウェアハウスを構築するだけでは、元のデータを提供するステークホルダーには何のメリットも生まれないのだ。これでは、そのステークホルダーにデータ統合の意義を納得してもらい、積極的な協力を引き出すのは難しいだろう。

 そこで、このプロジェクトでは、図2に示す統合パターン3の一部機能を先取りするかたちで、データ・ウェアハウス・システム側にデータ・ソースの品質改善用のデータを作り、それを提供するという簡易な仕組みを追加した。このステークホルダーに少しでもメリットを提供しようという配慮により、ステークホルダーのプロジェクトへの関与不足を防ぐことに成功したのである(図4)。

 

データ品質基準の設定/アセスメントの実施

 データ統合プロジェクトでは、プロジェクトの終盤になって、ようやく実際の業務データを使ったテストを実施するケースが多い。そして、そのときになって初めて、当初の処理設計ではデータの不整合が多発することが判明したり、想定していたデータ重複の削減効果が得られないことが判明したりするといったケースが散見される。

 こうした問題の発生を防ぐには、プロジェクトの計画段階でデータ・ソースのデータ品質調査を行うのが有効である。データ・ガバナンスが機能し、データ品質管理が的確に行われている企業であれば、データ品質調査はさほど難易度の高い作業ではない。だが現実には、すべてのデータ・ソースのデータを含めた品質管理を実践している企業は少なく、データ品質調査のために実データを使ったアセスメントが必要になることが多い。早い段階でデータ項目の充足率や主要なデータ項目値の特性を把握しておくことで、プロジェクトのROIを的確に判断し、プロジェクトの実施可否やスコープを確定することができる。これにより、フタを開けてみたら莫大なコストがかかることわかってプロジェクトが頓挫してしまうといったリスクを減らせるのである。

 

エンタープライズ・データ・ウェアハウスの構築

 今日のように、ビジネス要件やIT環境が激しく変化する時代に対応していくために、データ・ウェアハウスを構築している企業は多いだろう。だが残念ながら、データ・ウェアハウスやデータ統合プログラムが乱立しただけで、当初期待していた効果を十分に得られていないという悩みを聞くことが少なくない。

 また、ある時点では企業内システムの全体最適化が図られていたとしても、企業の統合や再編が生じて統合先のシステムが管理対象に加わり、結局はシステムがサイロ化した状態になってしまうこともあるようだ。

 これらのケースからわかることは、データ統合は一度実施したら終わりというものではないことである。必要に応じて何度も継続して行わなければならないものであり、それを踏まえて拡張性と柔軟性を考慮する必要がある。

 この問題に対する解決策の1つは、業界標準のデータ・モデルを採用して全社的なエンタープライズ・データ・ウェアハウスを構築することだ。各社がデータ統合に必要なデータ・モデルを一から設計するのではなく、業界標準データ・モデルとのフィット&ギャップ分析からスタートすることにより、プロジェクトにおけるデータ・モデルの設計負担を軽減することができる。また、業界標準モデルを取り込むことで、自社が将来的に直面する可能性のあるビジネス環境の変化への対応力を織り込むことも可能になる。

 さらに、業界標準データ・モデルへのデータの取り込みに、ETL(Extract/Transform/Load)ツールを付随パッケージ群も含めて活用すれば、開発/保守コストのさらなる低減が図れる。加えて、データの精度を高めるためのベスト・プラクティスの取り入れも容易になるだろう。

 現実に、こうしたエンタープライズ・データ・ウェアハウスの構築にあたり、標準データ・モデルとデータ統合プログラムのパッケージを適用するというアプローチで大きな成果を上げた事例が出てきている。米国のある企業では、複数のデータ・ウェアハウス・システムを、業界標準データ・モデルとそれに対応したETLツール/付随パッケージ群を全面的に適用して再構築することで、テーブル数/ETLプログラム数を従来の約10分の1に削減した。また国内でも、エンタープライズ・データ・ウェアハウスの導入/運用が一般的となり、各業界で標準のデータ・モデルが策定されつつある。特に金融/通信/小売など、早くからデータ・ウェアハウスの導入が進んでいる業界では、その動きが早い。今後は、さまざまな業界にこの取り組みが広まっていくことだろう。
 

*  *  *

 以上、本稿では、今日の企業が直面するであろうデータ統合にまつわる課題と、それに対するアプローチの例を紹介した。データ統合への取り組みは一筋縄ではいかないが、現在では有効な手段が確立されつつある。必要なタイミングで必要な情報を入手すること――現代企業が置かれたビジネス環境では、これが喫緊の課題であり、それに挑むうえでデータ統合は不可欠な取り組みだ。CIO/IT部門がこの取り組みをいかにうまくリードできるかが、企業が生き残っていくうえでの鍵となる。

go_to_top

ページの先頭へ戻る