ユーザー事例


コーネル大学が、研究プロジェクトを支えるHPC 環境のストレージを選定した決め手とは。

wcs-12-1-img01

ビジネスの課題
コーネル大学のCenter for Advanced Computing (CAC)では、高性能計算(HPC: High Performance Computing)環境でユーザーが利用するデータ集中型の研究プロジェクト向けに、拡張性と信頼性に優れたストレージソリューションを求めていました。

ソフトウェア
Red Hat Storage Software Appliance

ハードウェア
InfiniBandを介してDataDirect Networks(DDN) 9900に接続、Dell R610で158TBが利用可能

利点
Red Hat Storage Software Appliance は、CACの主要な教育機関の1つ、Cornell Institute for Biotechnologies and Life Science Technologiesの要件を満たすことができました。同機関は、DNA塩基配列解読、プロテオミクス、画像処理の実行に十分耐えうる堅牢なストレージプラットフォームを求めていました。

背景
1865年に創立されたコーネル大学は、アイビーリーグの中で最大規模を誇る大学で、米国各州および世界120ヵ国の学生20,000人以上が学んでいます。名高い学風と民主主義の理念を独自に併せ持つ同大学では、従来の科目とより実用的な科目を織り交ぜた講義を実施しており、アイビーリーグで最も広範な教育分野を提供しています。そのコーネル大学のCenter for Advanced Computing(CAC)は、大学、政府機関、企業にわたるデータ集中型の研究を支えるHPC構想を支援するため、2007年に設立されました。新たなテクノロジーを早期に採用したCACでは、さまざまな分野の科学者の研究を支援しています。15台で構成されたRed Hat® Enterprise Linux®ハイパフォーマンス・コンピューティングクラスタを運用し、大規模計算機システムの有用性分析、トレーニングおよび教育プログラムの開発/管理/評価において、その専門性が高く評価されています。

ビジネスの課題

バイオテクノロジーにおける研究、教育、技術転移を
促進するストレージソリューションの探求

CACには、教育機関、政府機関、企業にわたる多くの関連機関が存在します。その1つが、Cornell Institute for Biotechnologies and Life Science Technologiesです。同機関のITディレクター、James VanEe氏がCACのテクニカルスタッフに就任したのは2010年のことです。同氏は、バイオテクノロジーの研究を支援するストレージソリューションの決定と導入のために入所しました。バイオテクノロジーは、環境、農業、工学、獣医学、人間医学へ最終的に恩恵をもたらす研究領域でもあります。
Institute for Biotechnology and Life Science Technologiesには、生物学、物理学、工学、計算科学で研究を行う大学の科学者たちが集まっています。「同機関は共同研究の風土があり、非常に膨大なデータが生成されます」と、CACのシステムコンサルタント、Steven Lee氏は言います。
当時、同機関の科学者は非構造化データにアクセスできず、ノードあたり8TBと16TBの制限がある標準ファイルシステムしか利用できませんでした。その一方で、同機関では毎月20TB以上のデータが生成されており、拡張性に加えて可用性に優れたソリューションが必要でした。さらに、科学者は標準ファイルシステム以外からもアクセスできる環境を要求していました。これを実現するには、グローバル名前空間が必須です。
VanEe氏は、こう述べます。「スケールアウト可能なストレージソリューションの構想には常々関心があったのですが、コストの関係上、導入することができませんでした」。同氏は、Isilonなどの他のソリューションも検討しましたが、こうしたシステムにかかる膨大な資本コストを前に足踏みをしていたと言います。「 そこで、私たちは巨大な先行投資を必要としない、その他のストレージソリューションはないかとCACに相談したのです」。

ソリューション

CACのハイパフォーマンスコンピューティングクラスタ
におけるRed Hat Storageのベストソリューション

VanEe氏がRed Hat Storage(旧称Gluster)を初めて耳にしたのは、Bio-IT Worldでのことでした。 VanEe氏は、ソフトウェアのみで構成される同製品に瞬時に興味を持ちました。この構成であれば、CACの既存のストレージハードウェアインフラストラクチャを活用できるからです。このほか、大規模なデータセットでも高いパフォーマンスと可用性を実現できるスケールアウトアーキテクチャと大規模なグローバル名前空間にも魅力を感じたと言います。
CACは複数ベンダーの提案を検討した結果、ベストソリューションとしてRed Hat Storage Software Applianceの採用を決定しました。ソリューションは既存環境と混在する形で導入され、158TBのストレージを提供するDell PowerEdge R610ラックサーバーをInniBand経由でDDN 9900データインフラストラクチャプラットフォームに接続しました。
Red Hat Storage Software Applianceの設置は数日で完了し、すでに1年以上、不具合なく実稼動しています。現在、同機関はRed Hat Storageを主にDNA塩基配列解読の研究で生成されたデータの格納で使用しています。 また、同じ学部内の他グループのデータアーカイブ先としても利用しているとのことです。

利点

低コストで優れた拡張性と可用性を獲得

Red Hat Storage Software Applianceによって、Cornell Institute for Biotechnology and Life Science Technologiesは既存のストレージディスクを継続して活用することができました。おかげで、ハイパフォーマンスSANを利用しながら無理のない価格で拡張できました。また、Red Hatのソフトウェアのみのソリューションではインストールベースを置き換える必要がなかったので、サーバーやストレージハードウェアを追加することなく、必要に応じて拡張できるようになりました。
「新しいストレージソリューションの選定で重要な目標の1つが、コスト回避でした」と、VanEe氏は述べます。「私たちには、先行投資できる予算がありませんでした。Red Hat Storageは低コストのソフトウェアソリューションですので、大幅な支出を回避でき、同時に既存のインフラストラクチャを維持することができました。容易かつ無理のない価格で拡張できたのです」。
さらに、コーネル大学は標準ファイルシステムに制限されることなくデータにアクセスできる環境を科学者に提供できるようになりました。Red Hat Storageでは、非構造化データをより容易に扱うことができます。「グローバル名前空間に対応したソリューションを選択したことで、運用やデータ管理にかかる諸経費を削減でき、時間とコストを大幅に節約できました」と、VanEe氏は述べます。
Red Hat Storage Software Applianceを導入したことで、同機関は研究プログラムを継続して拡大すると同時に、研究者の生産性も向上させることができました。「ITディレクターとしての主要な目標の1つに、新規テクノロジーをすぐに採用できる環境の構築がありました」と、VanEe氏は言います。「 もしも学部で新しいシーケンサーを50万ドルで購入したら、データの格納先がすぐにでも必要になります。Red Hat Storageは、新規テクノロジーに適応する柔軟性をもって、私たちが先手を打って行動できるように支援してくれます」。