CIO_ウルトラバナー

ウルトラバナー横テキストバナー

イベント紹介用テキストバナー

海外事例

監視ツールでパフォーマンスの穴を掘り当てる

基幹アプリケーションの質を向上させたドール

2011/02/28

頻繁に発生する物流システム障害により、商品の配送に支障をきたしていたドールは、問題解決のために新たな監視ツールを導入することにした。

ステファニー・オーバビー ● text by Stephanie Overby

システムの不具合がIT部門の信頼を失墜させる

 新しい基幹業務アプリケーションが、スロー映像のごとく崩壊する様子ほど、ITとビジネスの脆弱な関係に損害を与えるものはない。ITはこうした状況に無力とも言える。

 トレバー・スコット氏が直面した苦境とは、まさにこれだった。食品大手、米国ドール・フード・カンパニー生鮮フルーツ部門北米地域担当ITディレクターであるスコット氏のチームは4年前、TranSHIPと呼ばれる新しく有望だったはずの物流管理アプリケーションの安定化に奔走していた。

 障害はアプリケーション導入直後に発生し、その後も継続した。ピーク時間帯には応答時間が長くなってしまう。また、TranSHIPとそのアプリケーション・スキャナは、1日に何度もタイムアウトを引き起こす可能性があった。システム・データベースがクラッシュし、一時はアプリケーションが3日間機能停止になったこともあった。

 生産農家、梱包、流通、熟成施設からのデータ管理をTranSHIPに頼っていた各事業部門や物流部門のスタッフは、パフォーマンス低下に不満を募らせた。ドールの港湾施設や倉庫を担当するユーザーは、商品の流れを紙とペンで記録しなければならなくなった。このため、日々の発注業務は非常に複雑になり、生鮮品の物流においてきわめて重要な流通効率が大幅にダウンした。TranSHIPが障害から回復すると、ユーザーは複数のシステムにデータを再入力しなければならず、そのせいで業務や販売、財務会計にエラーや矛盾が出るといった悪影響を与えた。スコット氏によると、2008年半ばにはIT部門に対する信頼度は史上最低レベルに失墜したという。

 スコット氏率いるアプリケーション・チームやインフラストラクチャ・サポート・チームは、残業を重ねて試行錯誤を繰り返したが、何をやってもうまくいかなかった。

 「我々は必死だったが、システムの不安定を誘発している原因を特定する自信が持てずにいた。チームはかなりの長時間労働が続いてすっかり疲弊し、軌道修正できるという希望を失ってしまった」(スコット氏)

干し草の山の中の針を見つける

 原因はドールのシステムの複雑なアーキテクチャにあった。6つの主要アプリケーションがミドルウェアでひとまとめにされ、複数のリアルタイム処理/バッチ処理インターフェースを介して24時間やり取りを繰り返しており、数ある階層にITが完全対応できていなかった。

 スコット氏によれば、「システムには(潜在的な)障害がいくつもあった。それらは、通信、インフラ、データエラー、ユーザーエラー、その他原因不明の現象などと関係があるようだったが、我々はアプリケーションやサーバ、ネットワークの状態を監視する手段を持ち合わせていなかった」という。

 スコット氏とそのチームは2009年、ようやく解決の糸口を見つけることになる。コンピュウェアのアプリケーション・パフォーマンス管理ソリューション『Vantage』を4週間試験運用したことで、TranSHIPのデータベース、アプリケーション、サーバのパフォーマンス監視が可能になり、その結果、問題の根本原因を突き止めることができたのだ。応答時間が長かったのは、ネットワーク機器のトラフィック設定が誤っていたのが原因で、ミッションクリティカルな流通システムのトラフィック優先度が、EメールやWeb検索よりも低くなっていたからだった。

 IT部門はメモリ容量を追加して最適化を行い、TranSHIPトラフィックの優先度を引き上げた結果、応答時間やアップタイムが改善され、タイムアウトやスローダウンの回数が減って、流通効率とデータ完全性が回復した。

 コンピュウェアのソリューションを導入したドールのITチームは、いまではIT環境をプロアクティブに監視し、ユーザーがそれに気付く前にパフォーマンス問題を解決している。一時は揺らいでいたIT部門とビジネス部門の関係性も修復できた。

 「ビジネス・ユーザーの満足度は以前より格段に上がった。連日発生していた障害が減ったこと、そしてITチームはビジネスに対して、業務改善の為の機能やプロジェクトといった付加価値の高いサービスを提供しているのだということにユーザーは気付いてくれた」(スコット氏)

go_to_top

ページの先頭へ戻る