Snowflake Summit 2022
藤本和彦
(編集部)
2022-06-15 10:10
Snowflakeは米国時間6月13~16日に米国ラスベガスで年次カンファレンス「Snowflake Summit 2022」を開催している。それに併せ、同社データクラウド製品に対する一連の新機能が発表された。
Pythonのネイティブ対応とデータアクセスを拡充
まず、Pythonのサポート強化を中心とした、開発者向け機能の強化が発表された。具体的には、「Snowpark for Python」のパブリックプレビュー版を提供するとともに、現在開発中の「Streamlit」とのネイティブ統合によって高速なアプリケーションの開発サイクルを実現する。また、新たにストリーミングデータとの連動を強化すると同時に、オープンフォーマットのデータやオンプレミスで保存されているデータをデータクラウドで利用できるようにする。
Snowparkは、任意の開発言語やライブラリーを用いてスケーラブルなパイプライン、アプリケーション、機械学習(ML)ワークフローをSnowflake上で直接構築できるのデベロッパーフレームワーク。Snowpark for Pythonは、他の開発言語で記述されたSnowflakeのパイプラインやアプリケーションと同様に、Snowflakeのコンピューティングインフラストラクチャーで実行される。
さらに、Snowpark for Pythonを補完する次の新機能も追加される。
- Python用のSnowflakeワークシート(プライベートプレビュー):Snowflakeのユーザーインターフェース「Snowsight」上で直接、PythonやSnowparkのPython用DataFrame APIを使用してパイプライン、機械学習(ML)モデル、アプリケーションの開発を行い、コードの自動補完機能や数秒でカスタムロジックを生成する機能によって開発作業を効率化することができる
- SnowflakeとStreamlitの統合(開発中):Pythonベースのアプリケーション開発機能がSnowflakeに直接組み込まれる。ユーザーはインタラクティブなアプリケーションを開発し、安全にデータシェアリング、高速で反復的な開発サイクル、ビジネスチームとのコラボレーションを行って開発の影響力を高めることができる
- 大容量メモリーのウェアハウス(開発中):ユーザーはAnacondaとの統合によって利用可能となったPythonのオープンソースライブラリーを使用し、特徴量エンジニアリングや大量のデータセットを用いたモデルトレーニングなどのメモリー負荷の高い作業を安全に行えるようになる
- 時系列予測(プライベートプレビュー)をはじめとしたSQL機械学習:SQLユーザーはMLを駆使した予測を日々のビジネスインテリジェンス(BI)や分析に取り入れ、意思決定の質とスピードを高めることができる
加えて、サーバーレスでのストリーミングデータの取り込みを実現する「Snowpipe Streaming」(プライベートプレビュー)や宣言的なストリーミングデータの変換を簡略化する「Materialized Table」(開発中)も発表された。オープンソースのテーブルフォーマット「Apache Iceberg」を外部ストレージで利用できるようになったほか、SnowflakeがサポートするDell TechnologiesやPure Storageなどのオンプレミスストレージシステムに保存されているデータにもアクセスできるようになった。
データクラウドでアプリの開発・収益化・デプロイを可能に
次に、データクラウド上でデータ集約型アプリケーションを開発、収益化、デプロイできる新たなプラットフォームを開発者に提供すると発表した。
現在はプライベートプレビューの「ネイティブアプリケーションフレームワーク」を利用することで、開発者はストアドプロシージャー、ユーザー定義関数(UDF)、ユーザー定義テーブル関数(UDTF)といったSnowflakeの機能を活用してアプリケーションを開発できる。また、Python用のアプリケーションフレームワーク「Streamlit」との機能統合も進めている。
開発者は構築したアプリケーションを「Snowflakeデータマーケットプレース」で収益化することができる。Snowflakeの導入企業は2022年4月30日時点で6300社に及ぶ。ネイティブアプリケーションフレームワークは、データクラウドの可用性、障害回復力、セキュリティ体制を土台とするため、開発者は作業や運用の負荷を気にすることなく機能開発のみに専念できる。販売されたアプリケーションは顧客のSnowflakeアカウント内で実行される。データの移動や共有が不要で、開発者は顧客の機密データを管理する必要がない。
LiveRampやInformaticaなどの顧客やパートナーが、ネイティブアプリケーションフレームワークを利用してクラウドコスト管理、IDデータ検証・照合、データ収集などのさまざまなユースケース向けにアプリケーションを開発している。
トランザクション処理に対応する「Unistore」を提供
Snowflakeは単一のプラットフォームでトランザクションデータと分析データを組み合わせて利用する新たなワークロード「Unistore」の提供を開始すると発表した。
Unistoreは、単一のプラットフォーム上ででトランザクションデータと分析データを組み合わせて利用するための新しいワークロード。これまではトランザクションデータと分析データがサイロ化されていたため、システム間でのデータ移動が複雑化し、現代の開発に必要なスピードが損なわれていた。Unistoreを利用することで、トランザクションワークロードにもデータクラウドを活用できるようになる。
Snowflakeでは、Unistoreを支える新機能として「Hybrid Table」を導入した。高速に単一の行(レコード)を操作できることで、Snowflake上でトランザクションアプリケーションを開発できるようになる。また、トランザクションデータの分析を迅速に実行したり、既存の「Snowflake Table」を組み合わせてデータを統合的に把握したりすることもできるという。
Snowflakeのプロダクト担当上級副社長であるChristian Kleinerman氏は、「Unistoreは、Snowflakeデータクラウドに新たなイノベーションをもたらす基盤。われわれがデータレイクとデータウェアハウスに対する顧客の既成概念を打ち砕いてきたように、Unistoreはデータクラウド上での次世代アプリケーションの開発と導入の先駆けとなる」とコメントする。
新たにサイバーセキュリティワークロードの提供を開始
Snowflakeはまた、企業のサイバーセキュリティチームがデータクラウドを用いてより適切に自社を保護できるようにするために、新たなサイバーセキュリティワークロードの提供を開始することを発表した。
同社によると、古いセキュリティ情報管理システム(SIEM)を中心として構築された現行のセキュリティアーキテクチャーは、サイバー脅威の一歩先を行くために必要なデータの量や種類に対応できるように設計されていないという。データ取得コストや保持期間の制限、独自のクエリ言語といったさまざまな制約があるため、セキュリティチームは自社を守るために必要な可視化を担保できず悪戦苦闘している。
同社のサイバーセキュリティワークロードは、データクラウド基盤の処理能力と伸縮性を生かし、構造化ログ、半構造化ログ、非構造化ログをネイティブに処理する。現在はプライベートプレビュー。ユーザーは何年にもわたる大量のデータを効率的に保管し、データクラウドのコンピューティングリソースを利用して検索を行い、SQLやPythonなどの汎用言語を用いてインサイト(洞察)を獲得できるとしている。
また、企業はセキュリティデータとエンタープライズデータをシングル・ソース・オブ・トゥルース(信頼できる唯一の情報源)に一元化することで、人事(HR)システムやIT資産管理から取得したコンテキストデータを検知や調査に利用してアラートの忠実度を高めたり、大量のデータに対して高速でクエリーを実行したりできる。
セキュリティチームは、セキュリティ体制を総合的に可視化し、膨大なデータ取得コストやデータ保持コストを負担することなくデータサイロを解消することが可能。サイバーセキュリティワークロードは、脅威の検知と対処以外にも、セキュリティコンプライアンス、クラウドセキュリティ、ID/アクセス、脆弱性の管理など、幅広いユースケースに対応する。
0 コメント:
コメントを投稿