Qu'est-ce que DLI ?

  • Facilité d'utilisation

    En l'espace de quelques secondes à peine, DLI vous permet d'explorer facilement des téraoctets de données dans votre lac de données à l'aide de SQL standard, et ce, sans aucune charge d'exploitation et de maintenance.

    En l'espace de quelques secondes à peine, DLI vous permet d'explorer facilement des téraoctets de données dans votre lac de données à l'aide de SQL standard, et ce, sans aucune charge d'exploitation et de maintenance.

  • Analyse en une étape

    Entièrement compatible avec Apache Spark, Flink et openLooKeng ; traitement en flux et par lots et analyse interactive en un seul endroit.

    Entièrement compatible avec Apache Spark, Flink et openLooKeng ; traitement en flux et par lots et analyse interactive en un seul endroit.

  • Ressources évolutives

    Accès partagé, à la demande, à des ressources mises en commun, échelonnement flexible basé sur des priorités prédéfinies.

    Accès partagé, à la demande, à des ressources mises en commun, échelonnement flexible basé sur des priorités prédéfinies.

  • Connexion inter-sources

    Accès facile aux données d'une source à l'autre pour une analyse collaborative avec les connexions de sources de données DLI, sans migration de données.

    Accès facile aux données d'une source à l'autre pour une analyse collaborative avec les connexions de sources de données DLI, sans migration de données.

Fonctions

  • Compatibilité complète avec SQL

    Réalisez des analyses de big data simplement à l'aide d'instructions SQL. La syntaxe ANSI SQL 2003 est entièrement compatible.

    Réalisez des analyses de big data simplement à l'aide d'instructions SQL. La syntaxe ANSI SQL 2003 est entièrement compatible.

  • Spark/Flink/openLooKeng sans serveur

    Migrez en toute transparence vos applications hors ligne vers le cloud grâce à la technologie sans serveur. DLI est entièrement compatible avec les écosystèmes et API Apache Spark, Apache Flink et Presto.

    Migrez en toute transparence vos applications hors ligne vers le cloud grâce à la technologie sans serveur. DLI est entièrement compatible avec les écosystèmes et API Apache Spark, Apache Flink et Presto.

  • Analyse croisée des sources

    Analysez vos données à travers les bases de données. Aucune migration n'est nécessaire. Une vue unifiée de vos données vous permet d'avoir une compréhension globale de vos données et vous aide à innover plus rapidement. Aucune restriction ne s'applique aux formats de données, aux sources de données cloud ou au fait que la base de données soit créée en ligne ou hors ligne.

    Analysez vos données à travers les bases de données. Aucune migration n'est nécessaire. Une vue unifiée de vos données vous permet d'avoir une compréhension globale de vos données et vous aide à innover plus rapidement. Aucune restriction ne s'applique aux formats de données, aux sources de données cloud ou au fait que la base de données soit créée en ligne ou hors ligne.

  • Entreprise multi-locataires

    Gérez les autorisations liées à l'informatique ou aux ressources par projet ou par utilisateur. Profitez d'un contrôle fin qui facilite le maintien de l'indépendance des données pour des tâches distinctes.

    Gérez les autorisations liées à l'informatique ou aux ressources par projet ou par utilisateur. Profitez d'un contrôle fin qui facilite le maintien de l'indépendance des données pour des tâches distinctes.

Mise en pratique

Analyses

Analyse des bases de données

Il est essentiel d'effectuer une analyse approfondie des données d'application stockées dans des bases de données relationnelles afin d'en extraire une valeur accrue. Par exemple, les Big Data issues des données d'enregistrement facilitent la prise de décisions commerciales.

Points de friction

- Les requêtes compliquées ne sont pas prises en charge pour les grandes bases de données relationnelles.

- Il n'est pas possible d'effectuer une analyse complète parce que les partitions des bases de données et des tables sont réparties dans plusieurs bases de données relationnelles. L'analyse des données commerciales risque de surcharger les ressources disponibles.

Avantages

  • Possibilité de transfert de l'expérience SQL

    Mettez le pied à l'étrier avec de nouveaux services. DLI prend en charge la syntaxe standard de la base de données relationnelle ANSI SQL 2003, de sorte qu'il n'y a pratiquement pas de courbe d'apprentissage.

  • Performance polyvalente et robuste

    Les modèles distribués de calcul en mémoire traitent sans effort les requêtes complexes, l'analyse des partitions et le traitement de l'informatique décisionnelle.

Services connexes
e-Commerce

Marketing précis

L'analyse associative combine des informations provenant de plusieurs canaux afin d'améliorer les taux de conversion.

Avantages

  • Analyse croisée des sources

    Les données CTR relatives à la publicité stockées dans OBS et les données relatives à l'enregistrement des utilisateurs dans RDS peuvent être interrogées directement sans migration vers DLI.

  • Seul SQL est nécessaire

    Les sources de données interconnectées sont mises en correspondance avec une table créée à l'aide de simples instructions SQL.

Services connexes
Jeux

Analyse des journaux

Les entreprises de jeu-vidéos requièrent une plateforme d'analyse de données de qualité afin d'optimiser le positionnement des publicités, d'accroître la fidélisation des nouveaux joueurs, d'améliorer les opérations et de recueillir des retours d'informations en vue des futures itérations de jeux.

Points de friction

L'analyse des journaux est généralement effectuée par période. Pendant les périodes d'inactivité entre chaque tâche, les ressources sont gaspillées.

Avantages

  • Paiement à l'utilisation et mise à l'échelle automatique

    En adoptant des politiques de mise à l'échelle flexibles, il est possible de libérer les ressources inutilisées et de réduire de manière significative les coûts associés aux clusters exclusifs.

  • Analyse convergente

    Une seule copie des métadonnées suffit pour le nettoyage en temps réel et le traitement ETL hors ligne. Le résultat du traitement des données peut être directement utilisé dans l'analyse interactive pour l'exploration de données.

Services connexes
Grandes entreprises

Contrôle des autorisations

Lorsqu'il est nécessaire que plusieurs services gèrent des ressources de manière indépendante, une gestion fine des autorisations permet d'améliorer à la fois la sécurité des données et l'efficacité des opérations.

Avantages

  • Attribution plus facile des autorisations

    Accordez des autorisations par colonne ou par opération spécifique, telle que INSERT INTO/OVERWRITE, et définissez les métadonnées en lecture seule.

  • Gestion unifiée

    Un seul compte IAM gère les autorisations pour tous les utilisateurs du personnel.

Génétique

Intégration de la bibliothèque

L'analyse du génome repose sur des bibliothèques d'analyse tierces, qui sont construites sur l'infrastructure logicielle distribué Spark.

Points de friction

- Des compétences techniques élevées sont nécessaires pour installer des bibliothèques d'analyse telles que ADAM et Hail.

- Chaque fois que vous créez un cluster, vous devez réinstaller ces bibliothèques d'analyse.

Avantages

  • Images personnalisées

    Plutôt que d'installer des bibliothèques dans le cadre d'un processus techniquement exigeant, vous pouvez les intégrer dans des images personnalisées téléchargées directement dans le Software Repository for Container (SWR). Lorsque vous utilisez DLI pour créer un cluster, les images personnalisées dans SWR sont automatiquement extraites, de sorte que vous n'avez pas besoin de réinstaller ces bibliothèques.

  • Images de base intégrées

    Des images Spark et Flink améliorées par Huawei (plusieurs versions) et des images IA open-source (TensorFlow/Keras/PyTorch) sont disponibles pour votre commodité.

Services connexes
Finances

Contrôle des risques en temps réel

Presque tous les aspects des services financiers nécessitent une gestion et une atténuation globales des risques.

Points de friction

En matière de contrôle des risques, la tolérance à l'égard d'une latence excessive est très faible.

Avantages

  • Haut débit

    L'analyse des données en temps réel dans DLI à l'aide d'un modèle de flux de données Apache Flink permet de réduire la latence. Un seul CPU traite de 1 000 à 20 000 messages par seconde.

  • Couverture de l'écosystème

    Sauvegarde des flux de données en temps réel vers plusieurs services en cloud tels que CloudTable et SMN pour une application complète.

Services connexes
Pouvoirs publics

Affichages en temps réel

Dans un contexte où la COVID-19 fait rage dans le monde entier, les pouvoirs publics doivent être en mesure de contrôler les données clés au moment même où les choses se produisent.

Points de friction

Les fonctionnaires n'ont pas nécessairement beaucoup d'expérience en matière de Big Data tandis que SQL leur est généralement beaucoup plus familier.

Avantages

  • Réactivité en quelques millisecondes

    Grâce à son infrastructure logicielle de calcul en mémoire performant, le moteur intégré d'openLooKeng optimise les performances des requêtes, permettant ainsi une analyse interactive sur le moment.

  • Compatibilité avec le marché général

    Les requêtes DLI utilisent la syntaxe SQL, de sorte que le personnel n'a pas besoin d'une formation en Big Data. Cette syntaxe familière est entièrement compatible avec la norme ANSI SQL 2003.

Services connexes
Géographie

Analyse du Big Data

Les volumes massifs de données englobent des quantités de l'ordre des pétaoctets d'images satellites, ainsi que divers types de données, tels que des données matricielles de télédétection structurées, des données vectorielles et des données de localisation spatiale non structurées. L'analyse et l'exploitation de toutes ces données nécessitent des outils efficaces.

Avantages

  • Analyse des données spatiales

    Les opérateurs d'algorithmes Spark dans DLI permettent le traitement de flux en temps réel et le traitement par lots hors ligne. Ils prennent en charge un grand nombre de types de données, y compris les données d'images de télédétection structurées, la modélisation 3D non structurée et les données issues d'un nuage de points laser.

  • Fonctionnalité SQL de CEP

    Des instructions SQL suffisent pour la détection de lacet et la gestion de géobarrières.

  • Traitement de données lourdes

    Migrez rapidement des quantités d'images de télédétection pouvant aller jusqu'à des exaoctets vers le cloud, puis découpez-les en sources de données pour un traitement distribué par lots.

Services connexes

DLI vs Hadoop auto-construction

Data Lake Insight

Système Hadoop auto-construction

Coût

Facturation en fonction du volume réel de données numérisées ou utilisées unité de calcul à l'heure (UCE).

Les coûts sont réduits.

Facturation en fonction des ressources occupées.

L'occupation de longue durée est coûteuse et inutile.

Évolutivité élastique

L'intelligence de Kubernetes, basé sur la technologie de conteneurisation

N/A

Exploitation et maintenance et

disponibilité

Architecture prête à l'emploi et sans serveur

Des compétences techniques solides sont requises pour la

configuration, l'exploitation et la maintenance.

Coût de l'apprentissage

Les paramètres d'optimisation sont normalisés sur la base de 10 ans d'expérience dans des milliers de projets. En outre, DLI fournit une interface graphique pour une optimisation intelligente.

Nécessité d'apprendre des centaines de paramètres de réglage.

Sources de données prises en charge

Cloud : OBS/RDS/DWS/CSS/MongoDB/Redis ;

Sur site : base de données auto-construite/MongoDB/Redis

Cloud : OBS ;

Sur site : HDFS

Compatibilité avec les écosystèmes

Data Lake Visualization (DLV), Tableau, Yonghong BI, et Fanruan BI

Outil de l'écosystème du big data

Image personnalisée

Pris en charge. Des dépendances peuvent être ajoutées si nécessaire pour répondre aux exigences de diversité des services.

N/A

Planification des flux de travail

Planification via Data Lake Factory (DLF) dans DGC

Outils de planification auto-construits, tels que Airflow

Autorisations pour les locations

d'entreprises

Basé sur des tableaux avec granularité au niveau des colonnes

Basés sur des fichiers

Performance

Plus élevé grâce à des logiciels et du matériel optimisés

Compatibles avec des versions open-source de Hadoop

Coût

Data Lake Insight

Facturation en fonction du volume réel de données numérisées ou utilisées unité de calcul à l'heure (UCE).

Les coûts sont réduits.

Système Hadoop auto-construction

Facturation en fonction des ressources occupées.

L'occupation de longue durée est coûteuse et inutile.

Évolutivité élastique

Data Lake Insight

L'intelligence de Kubernetes, basé sur la technologie de conteneurisation

Système Hadoop auto-construction

N/A

Exploitation et maintenance et

disponibilité

Data Lake Insight

Architecture prête à l'emploi et sans serveur

Système Hadoop auto-construction

Des compétences techniques solides sont requises pour la

configuration, l'exploitation et la maintenance.

Coût de l'apprentissage

Data Lake Insight

Les paramètres d'optimisation sont normalisés sur la base de 10 ans d'expérience dans des milliers de projets. En outre, DLI fournit une interface graphique pour une optimisation intelligente.

Système Hadoop auto-construction

Nécessité d'apprendre des centaines de paramètres de réglage.

Sources de données prises en charge

Data Lake Insight

Cloud : OBS/RDS/DWS/CSS/MongoDB/Redis ;

Sur site : base de données auto-construite/MongoDB/Redis

Système Hadoop auto-construction

Cloud : OBS ;

Sur site : HDFS

Compatibilité avec les écosystèmes

Data Lake Insight

Data Lake Visualization (DLV), Tableau, Yonghong BI, et Fanruan BI

Système Hadoop auto-construction

Outil de l'écosystème du big data

Image personnalisée

Data Lake Insight

Pris en charge. Des dépendances peuvent être ajoutées si nécessaire pour répondre aux exigences de diversité des services.

Système Hadoop auto-construction

N/A

Planification des flux de travail

Data Lake Insight

Planification via Data Lake Factory (DLF) dans DGC

Système Hadoop auto-construction

Outils de planification auto-construits, tels que Airflow

Autorisations pour les locations

d'entreprises

Data Lake Insight

Basé sur des tableaux avec granularité au niveau des colonnes

Système Hadoop auto-construction

Basés sur des fichiers

Performance

Data Lake Insight

Plus élevé grâce à des logiciels et du matériel optimisés

Système Hadoop auto-construction

Compatibles avec des versions open-source de Hadoop

Témoignages de clients

Mengxiang.com

Mengxiang utilise les services Huawei Cloud DLI et DGC pour effectuer une analyse en temps réel des données comportementales et pour personnaliser les produits en fonction des besoins spécifiques des clients.

Cette entreprise à forte croissance était confrontée à des problèmes de stabilité du service lors des pics de trafic et des promotions. La solution DLI+DGC fournit à Mengxiang une architecture élastique et un lac de données de haute performance pour le traitement intégré des lots et des flux.

Technologie DIANCHU

DIANCHU a utilisé Huawei Cloud DLI et le lac de données intelligent DGC pour établir une plateforme d'analyse de données pour les jeux. La plateforme réalise une analyse en temps réel des revenus, du taux de rétention des joueurs et du taux de paiement, afin de faciliter la planification des activités, le marketing ciblé et la prise de décisions éclairées.

Dragonest

Dragonest travaille avec Huawei Cloud pour effectuer des requêtes et analyser les données de jeu. L'analyse est utile pour les différentes divisions qui lancent de nouveaux services. Les applications de données sont intégrées, ce qui profite à l'ensemble de l'organisation.

Inscrivez-vous et lancez-vous dans un incroyable voyage dans le cloud

Essayer gratuitement