みなさん。こんばんは。小寺です。
AWSのマーケットプレイスで販売されている「Research Gateway」についてご紹介させていただきます。
Research Gatewayとは
大学及び研究機関向けのクラウド向けのセルフポータルです。
地域等の枠組みを超えてスムーズに研究開発を推進するには、研究される方の特定のニーズに対応することが求められています。
オープンデータ(AWS上のオープンデータなど) を活用することも、この研究分野における学内および学外も含めた共同研究にとって重要なニーズです。
研究者や主任研究者からなる科学研究コミュニティは、インフラストラクチャ、セキュリティ、データ プライバシー、ガバナンスについて懸念することなく、研究に集中したいというニーズがあります。大学や研究機関の IT チームは、予算がどのように使われたのかのモニタリング、承認されたバジェットの消費、安全なデータ分析を適切に制御することを求めています。
Relevance Lab社では 上記の研究者のニーズに応えるためにセルフサービス ポータルである Research Gateway を開発しているとのことです。
Research Gatewayはコスト効率が高く、導入が容易で、簡単にセットアップできることを重視しています。
また、AWSクラウドのナレッジがあまりなくても学習コストをかけずに、各サービスのカスタマイズを行うことなく、手軽にAWSを使うことができます。
ResearchGateができること
上記のようなアーキテクチャで構成されています。
・支出の管理
AWS Budgets と AWS Cost Explorer を使用してコスト管理し、プロジェクト、研究者、製品、パイプラインのモニタリングが可能です。
・ガード レール
ガードレールがプロジェクト レベルで実装され、プロジェクト予算を超えたときにフラグが立ち、プロジェクトの一時停止または終了が可能です。
・パブリックデータセットの利用
プロジェクトのゲノミクス データセットをマウントするためにS3が利用可能です。顧客がデフォルトで AWS オープンデータ スポンサーシップ プログラムでホストされているパブリック データセットの利用が可能です。
・データセットの再利用
オンプレミスの大規模なデータセットをData Sync持ち込んだり、ドラッグアンドドロップインターフェイスを使用してファイルをアップロードしたりすることもできます。
・ゲノムワークフロー
オープンソース フレームワーク エンジン (Cromwell および Nextflow) およびパートナー ソリューション (NVIDIA Parabricks および Illumina DRAGEN) を使用した二次分析のためのゲノム ワークフローが利用可能です。
・MLでの分析
Genomics Data Lake 統合、RStudio、Amazon SageMaker サービスを使い、MLベースの分析も可能です。 AWS Batch で実行するように事前設定された、一般的に使用される nf-core および GATK パイプラインを選択することで、調査時間を短縮します。
ResearchGateを始めるには
ポータルへログインした後の画面です。
AWSアカウントの情報を入力して、利用を開始します。
マーケットプレイスへのリンクはこちらから。