Data Lake Insight (DLI)

使いやすさ

テラバイトレベルのデータの結果を数秒で返すことが可能。標準SQLを使用したシンプルな開発。メンテナンス不要な運用によって省力化を実現。

オールインワンの分析

Spark、Flink、Trinoを組み合わせて、バッチデータとストリーミングデータの両方を処理するためのシームレスなインタラクティブ分析体験を実現。

優れた費用対効果

分離されたストレージとコンピューティングアーキテクチャによって、コストの削減、弾力性があるリソース、時間ベースの再利用、柔軟な優先度を実現。

オープンソース

普及しているオープンソースデータ形式をサポートし、主流なBI製品と連携することで、クロスソース分析機能を提供。

Huawei Cloud DLIを選ぶ理由

SQLであらゆることが可能に

SQLであらゆることが可能に

  • DLIでは、マルチモデルエンジンを使用して、ビッグデータのバックグラウンドを持たない人でも、SQLの知識さえあればビッグデータ分析を利用できるようにすることが可能です。また、Apache Spark、Apache Flink、Trinoエコシステムおよびインターフェースと完全に互換性があり、オフラインアプリケーションを手軽にクラウドへ移行できます。さらに、ワンセットのリソースで複数のタイプの計算(ストリーム処理、バッチ処理、インタラクティブ分析など)を処理できます。

弾力性があるリソースプール

弾力性があるリソースプール

  • リソースプールは柔軟性が高く、オフライン、リアルタイム、およびインタラクティブリソースの需要の増減に対してすばやく調整できます。また、ジョブレベルの優先度に対応しており、DataArts Studioと連携して効率化された運用を実現し、重要なタスクをタイムリーに完了できるようにします。

レイクハウス

レイクハウス

  • DLIは分析のためにHudiデータレイク形式を取り入れており、SparkやFlinkといった複数のエンジン向けの一元化されたソリューションに対応しています。さらに、SQLを使用してリアルタイムなデータの取り込みとレイクハウスの分析を行えます。

クロスソース分析

クロスソース分析

  • DLIは複数のデータ形式に対応しており、データを移行することなく、クラウド、オンプレミスデータベース、オフラインデータベースなどのさまざまなソースからのデータを分析できます。これにより、エンタープライズデータを一元化して確認できるようになり、企業で迅速にイノベーションを起こして、データの価値を引き出すことが可能になります。

あらゆるシナリオ向けの有益なデータインサイト

データベース分析
データベース分析

アプリケーションの登録情報など、リレーショナルデータベースに保存されたデータを分析します。

特長
わかりやすいSQL体験

DLIのSQL構文は、リレーショナルデータベース向けのANSI SQL 2003標準と完全に互換性があり、追加の学習は不要で、これまでと同じようにSQLを使用することが可能。

優れたパフォーマンス

DLIで分散型インメモリコンピューティングモデルを使用して、大量のデータを容易に処理。

ボトルネックを解決
データ量が増加するにつれて、リレーショナルデータベースで複雑なクエリを処理できなくなります。
シャーディングによって、徹底した分析が妨げられる場合があります。
企業データの分析は、オンラインの運用に影響を及ぼす場合があります。
関連サービス
eコマース
プレシジョンマーケティング

eコマース業界では、相関分析のために複数のソースから情報を取得し、プレシジョンマーケティングを最適化してコンバージョン率を向上させることが重要です。たとえば、「ページでの広告クリックイベントのデータ」と「ユーザーの登録データ」を相関させて、さまざまな年齢層に好まれる広告のタイプを特定すると、年齢に応じてより正確な広告がユーザーに配信されます。

特長
クロスソース分析

データを移行することなく、OBSに保存された「ページでの広告クリックイベントのデータ」とRDSに保存された「ユーザー登録データ」間でデータを相関させて分析することが可能。

Pure SQLの操作

DLIには複数のデータソースが統合されており、SQLテーブルの作成を通じてデータソースマッピングを直接完了することが可能。

関連サービス
ゲーミング
ログ解析

ゲーム会社は、データの力を活用して業界の課題を解決するために、データ分析プラットフォームに依存しています。この例としては、質が高い広告チャンネルの発見、新規プレイヤーの定着率の向上、プレイヤーによるアクティビティを増やすための運営活動の最適化、データを通じた製品イテレーションの促進などが挙げられます。

特長
従量課金制

DLIは使用中にのみ課金されるため、限定公開クラスターと比較してコストを50%以上削減することが可能。

収束分析

DLIの3つのエンジンでメタデータを共有し、オフラインのETL処理のために、データをリアルタイムでクリーニングしてから保存。処理結果は、インタラクティブ分析とデータ探索で直接使用可能。

ボトルネックを解決
通常、ログ解析のスケジュールは周期的に設定されるため、結果として各スケジュール間で多くのアイドル時間が生じます。
関連サービス
大企業
ログ解析

大企業では複数の部門でクラウドサービスを活用していることが多く、各部門内でさまざまな従業員の権限を管理する必要があります。これには、コンピューティングリソースの作成、削除、使用、分離の監督が含まれます。同時に、各部門のデータを管理し、適切な分離とプロトコルの共有が実施されていることを確認する必要もあります。

特長
きめ細かい権限コントロール

列レベルの権限コントロール、分離されたINSERT INTO/OVERWRITEの権限コントロール、テーブルメタデータの読み取り専用の権限コントロール。

一元化された管理

IAMを使用してユーザーを管理(分離されたDLIユーザーの作成は不要)、IAMを通じてきめ細かい認証に対応。

関連サービス
遺伝学
遺伝子データの管理

遺伝学の分野には、ADAMやHailなどのSpark分散型フレームワークに基づくサードパーティーの分析ライブラリが多くあります。

特長
カスタムイメージに対応

ベースイメージに基づいてADAMやHailなどのサードパーティーの分析ライブラリをパッケージ化し、SWRに直接アップロードすることが可能。DLIでジョブを実行する際に、SWR内のカスタムイメージを自動的にプル。

組み込みのベースイメージ

組み込みのHuaweiによる強化版のSpark/FlinkとTensorFlow、Keras、PyTorch向けのオープンソースAIイメージ。

関連サービス
金融
リアルタイムのリスク管理

リスクイベントの発生が排除または低減される確率を上げるには、登録、ログイン、取引管理などの典型的なシナリオに対するリスク管理システムが必要になります。

特長
高スループットと低レイテンシー

完全にリアルタイムなコンピューティングフレームワークであるApache FlinkのDataflowモデルを使用。パフォーマンスが高いコンピューティングリソースを活用して、CPU 1基あたりで1秒に1,000~20,000件のメッセージを処理することが可能。

豊富なクラウドエコシステム

SQLを使用し、処理したデータストリームをCloudTableやSMNなどの複数のクラウドサービスに書き込むことが可能。

関連サービス
政府機関
リアルタイムな大型のダッシュボード

COVID-19のパンデミックへのより適切な対処に向けて、政府機関はリアルタイムなダッシュボードを使用して、現在確認済みの患者数、確認済みの患者の累積数、輸送された患者数などの重要なデータをモニタリングし、一段先のパンデミック制御をデータでサポートする必要がありました。

特長
ミリ秒レベルのクエリのパフォーマンス

組み込みのopenLooKengエンジンで多数のクエリ最適化手法を使用し、インメモリコンピューティングフレームワークに加えて、パフォーマンスが高いミリ秒レベルのインタラクティブ分析のニーズを充足。

使いやすさ

標準的なANSI SQL 2003構文との完全な互換性を備えたPure SQLの開発手法。

関連サービス

多数のお客様との継続的なサービスのイノベーション

多数のお客様との継続的なサービスのイノベーション

今すぐジャーニーを開始して

有益なインサイトを獲得

今すぐ試す

その他のサービス

その他のサービス