導入された主な製品
11PBもの大規模ストレージへの高速アクセスとHSMによる効率的なデータ管理を実現できたのはSun StorageTek SAM-QFSでした。精巧な数値シミュレーションに不可欠な高速・大容量のストレージ・システム
冗長化は、ファイル・システムにハードウェア/ソフトウェア障害が発生したことを想定しての対策である。 「既存のストレージ・システムでは、ファイル・システムが単一障害点になっており、そこが止まると計算ジョブを走らせることができませんでした。そこで、新ストレージ・システムでは、ファイル・システムを冗長化することによって、稼動停止を避けようと考えました」(藤田氏)というわけだ。 以上の条件を含む要求仕様書に基づいて2007年10月に行われた競争入札で、ストレージ・システム管理ソフトウェアにSun StorageTek SAM-QFSソフトウェアを含んだシステム提案が落札された。2009年4月の本稼動開始を目指して、システム構築が始まった。 図1 数値シミュレーションに使用しているJAXAスーパーコンピュータ・システム(JSS)概略構成。調布航空宇宙センター内にあるスーパーコンピュータとストレージ・システムをSINET3経由でリモート利用する仕組みになっている
新しいストレージ・システムは、3台の富士通製SPARC Enterprise M9000サーバ、容量1PBの富士通製ディスクアレイ、容量10PBのIBM製テープ・ライブラリというハードウェア構成。SPARC Enterprise M9000では、Solaris 10 OSが動作し、その上でSun StorageTek SAM-QFSソフトウェアが稼動している(図1)。 Sun StorageTek SAM-QFSは高速ファイル共有機能により、スーパーコンピュータに対して共有ファイル・システムを供給。さらに、スーパーコンピュータの処理データをHSM方式でディスクからテープへ自動的にアーカイブするなど、効率のよいデータ管理機構も提供する。 また、サーバを3台構成にすることで、これらの機能を負荷分散、そして1台に障害が発生しても残りのサーバがその役割を引き継ぐことが可能な冗長化構成をとっている。 このシステムは国立情報学研究所(NII)が運営する学術情報ネットワーク「SINET3」にも接続されており、角田宇宙センター、相模原キャンパス、筑波宇宙センターの3事業所をはじめとする各事業所からも同等に利用できる。また、外部からの関係者がインターネット経由で利用することも可能だという。 I/O性能向上と大規模ストレージの容易な管理で最先端の研究を加速するインフラをサポート ![]() 画面1 「液体燃料微粒化過程の数値解析」では、数百TBのデータを使用して数値シミュレーションを行う
新ストレージ・システムの搬入と設置・構築が完了したのは、2009年1月のこと。3ヶ月のテスト・検証期間を経て、サービスインは2009年4月1日。新ストレージ・システムのテストにも参加したJAXA 研究開発本部 数値解析グループ 燃焼・乱流セクション 主任研究員 博士(工学)の新城淳史氏は、利用者としての立場からストレージ性能の向上を歓迎している。 新城氏が現在取り組んでいる研究テーマの1つは、噴射された液体ロケット燃料が霧になっていく過程を数値シミュレーションで明らかにする「液体燃料微粒化過程の数値解析」(画面1)。何十億、何百億もの格子点を用い、ミクロン(μm)サイズの多数の液滴粒子を何万ステップもかけてシミュレーションしていくと、数百TBもの容量になります。 計算規模が大きくなると、I/Oにかかる時間も計算自体にかかる時間も増えます。コンピュータの利用時間は限られていますので、I/O時間を短縮して実計算の時間を確保することは重要なことです」新城氏は、大型の数値シミュレーションの実行には、高速なI/Oが欠かせないと新ストレージ・システムの性能向上に期待を寄せる。 乱流の研究に携わっているJAXA 研究開発本部 数値解析グループ 研究員の阿部浩幸氏も、大きなデータ容量を求めている一人だ(図3)。 「2003年に行ったレイノルズ数41400(当時世界最高レイノルズ数)の平行平板間乱流の直接数値シミュレーション(DNS)では、大小様々な渦を忠実に計算するため約14億点の格子数を要しました。この計算は、3次元時間進行型の数値計算で、より高度な解析を行うため時系列にデータを蓄積した結果、データの総容量は数10TBまでに上りました。乱流のDNSでは、大容量のストレージが必要不可欠です」(阿部氏) 数値解析グループで行われている数値シミュレーションでは、世界初となるような成果も上げてきており、各国の研究機関からの注目度も高い。また、他の研究機関との競争も激しいことから、新ストレージ・システムに対する研究者の期待は自然と大きくなる。 図3 乱流の数値シミュレーションには大きなデータ容量が必要。乱流の複雑さはレイノルズ(Re)で決まり、JAXAのスーパーコンピュータではRe=41,400までの直接数値シミュレーション(DNS)に成功している
一方、システム管理者の立場から藤田氏が高く評価しているのは、Sun StorageTek SAM-QFSソフトウェアによるデータ管理のしやすさだ。 藤田氏は「計算機を使用したということはすなわち研究の資産ですので、将来役立てるよう、漏れなく消さずにアーカイブしておくのは研究機関としての使命だと考えています」と世界に冠たる研究機関としてのアーカイブの重要性を説明する。しかし新ストレージ・システムではこうしたデータ管理も効率化できているという。 「この新ストレージ・システムには、データをバックアップするという概念がありません。階層型ストレージ管理(HSM)によって、ハードディスク上のデータは自動的に2本のテープへとアーカイブされ、そのうちの1本がバックアップテープとしての役割も果たします」(藤田氏)というのが、その理由。 「将来的には、各事業所にある一般データのディザスタ・リカバリ先としても役立てていこうと考えています」と、藤田氏は付け加える。 最先端の数値シミュレーションが必要とする大容量のストレージ・システムへの高速アクセスと、効率的な管理を可能にするストレージ・ソリューション Sun StorageTek SAM-QFS。11PBという世界最大規模の巨大ストレージ・システムをハンドリングする実力は、数値シミュレーション以外でも、威力を発揮していくことになりそうだ。 導入された主な製品
関連事例
|
| |||||||||||||||||||||||||||||||||||||||||