1990年代、PCサーバーによる超高速データ分析を実現したDIAPRISM開発秘話(前編)

左から、
三菱電機株式会社シニアアドバイザー 伏見 信也
三菱電機インフォメーションネットワーク株式会社 クラウドプラットフォーム事業部 クラウド開発部 次長 鈴木 雅也
三菱電機インフォメーションネットワーク株式会社 クラウドプラットフォーム事業部 データソリューション部管理課 シニアアドバイザー 森田 登
三菱電機インフォメーションネットワーク株式会社 クラウドプラットフォーム事業部 データソリューション部技術第二課 米田 定義

データ集計で数十〜百倍の圧倒的な処理速度を実現

三菱電機が1998年に発売した「DIAPRISM(ダイアプリズム)」は、PCサーバーによるデータ集計や分析で桁違いの高速化を実現し、市場に大きなインパクトを与えました。その性能は例えば他社製データベースでは420秒かかる集計処理を10秒で完了するほどの圧倒的なものでした。

当時は大容量データの高速処理には極めて高価な超並列コンピューターや汎用機が使われることが多く、PCサーバーによる高速処理を実現したDIAPRISMはビジネスにおけるデータ分析を身近なものにしました。

当時、開発チームのリーダーを務めていた伏見信也氏はプロジェクトの始まりを次のように振り返ります。

「開発は1995年頃にスタートしました。DIAPRISMの前にオフィスコンピュータ(オフコン)のデータベース処理を高速化する「GREO(グレオ)」という製品があり、これを共同で開発した東京大学の喜連川優助教授(当時)から、さらに高速化してPCサーバーのようなオープンプラットフォームに載せようといわれたのがDIAPRISMに取り組むきっかけでした。当時はデータを活用した意思決定や、そのためのシステムであるDWH(DataWarehouse)が注目され始めており、データを中心とした事業に取り組むことを検討していました。その中で、高速データ分析には将来性があると思いました」

ハードウエアソートでアルゴリズムの限界を突破

当時のハードウエアで高速処理を実現するためにブレークスルーが必要となり、2つの独自技術が投入されました。1つは集計、分析処理に不可欠なデータの並び替えを高速化するハードウエアソータ「DIAPRISM/SS」です。DIAPRISM/SSは、前述のGREOをコンパクトかつ高性能にしたもの。GREOは約30cm角の大きな基板でしたが、DIAPRISM/SSはPCサーバー内の拡張スロットに収まるように大幅に小型化されました。

「データの並び替え処理は、ソフトウエアではアルゴリズム的にこれ以上速くできないという限界が決まっていて、データ量に応じて処理時間も長くなります。しかしDIAPRISM/SSでは、データを投入し終わった直後に結果が出力されます。当時は入口からデータを入れると出口からソートされて出てくる“土管”のような物と表現していました」(伏見氏)

イメージ図
1999年1月に発売されたDIAPRISM

業界標準のソートベンチマークであるDatamationベンチマークにおいて、2000年の世界最高性能値を達成したDIAPRISMハードウエアソータボード。
その時に獲得したDatamationベンチマークアワード・トロフィー。

独自のデータ配置技術と専用I/Oプロセッサで
PCIバスの渋滞を回避

大容量データ処理のボトルネックとなったのがCPUとメモリや周辺機器を結ぶバスの転送速度でした。そこで開発されたのが、ディスク上のデータベースから必要なフィールドのみを読み込める独自のデータ配置と、データベース処理の前半部分を専用のI/O プロセッサ「DIAPRISM/SP」で並列処理する技術です。

「これはチームにいたエンジニアが考えたものです。彼は大量のデータがあっても、多くの場合、欲しいデータはその一部だけであることに着目し、必要なデータだけをバスに通す方法を追求しました。これによりデータ転送量を大幅に削減できました。最初に聞いた時は、よくそんなコトを思いつくものだと驚きました」(伏見氏)

現在とは開発環境も大きく異なっていました。ミドルウエアの開発を担当していた森田登氏は当時を次のように振り返ります。

「専用ハードを搭載したマシンは研究所にしかなく、マシンが空いている時間を選んで研究所に出向いて使用しました。当時は仮想環境などありませんから、実行環境を変更する時はOSなどもすべてインストールし直しです。当時はそれが当たり前でしたが、今考えると大変でしたね」

試行錯誤の末に完成したDIAPRISMは1998年に市場に投入され、いよいよ実際のビジネスの現場でその力を試されることになります。

MELTOPIA NO.261掲載(2022年9月)