Data Lake Insight (DLI)

Data Lake Insight (DLI)

Facilidad de uso

Los resultados de los datos a nivel de TB se pueden devolver en cuestión de segundos, además el desarrollo es sencillo gracias al uso del lenguaje de consulta estructurado (SQL) estándar, mientras que las operaciones libres de mantenimiento representan una inversión en mano de obra considerablemente baja.

Análisis todo en uno

Spark, Flink y Trino se combinan para proporcionar una experiencia de análisis interactivo sin inconvenientes para procesar datos por lotes y de flujos.

Alta rentabilidad

La arquitectura de almacenamiento y cómputo desacoplados representan costos más bajos, recursos elásticos, reutilización basada en el tiempo y prioridades flexibles.

Código abierto

Las capacidades de análisis entre fuentes son proporcionadas mediante la admisión de formatos de datos de código abierto populares y la integración con productos de BI convencionales.

Por qué DLI de Huawei Cloud

Todo en SQL

Todo en SQL

  • Gracias al uso de los motores multimodelo, DLI hace que el análisis de big data sea accesible incluso para aquellos sin experiencia en este campo, todo lo que necesitan es conocimiento de SQL. Es totalmente compatible con los ecosistemas e interfaces de Apache Spark, Apache Flink y Trino, además las aplicaciones fuera de línea se pueden migrar fácilmente a la nube. Un conjunto de recursos puede manejar múltiples tipos de cómputo, incluyendo procesamiento de flujos, procesamiento por lotes y análisis interactivo.

Grupo de recursos elástico

Grupo de recursos elástico

  • El grupo de recursos es flexible y se puede ajustar rápidamente a las fluctuaciones de la demanda de recursos fuera de línea, en tiempo real y de manera interactiva. También admite la prioridad a nivel de trabajo y se integra con DataArts Studio para optimizar las operaciones, asegurando la finalización oportuna de las tareas críticas.

Lakehouse

Lakehouse

  • DLI incorpora el formato de lago de datos Hudi para el análisis y admite una solución unificada para múltiples motores, tales como Spark y Flink. Además permite la ingesta de datos en tiempo real y el análisis de lakehouse mediante el uso de SQL.

Análisis entre fuentes

Análisis entre fuentes

  • DLI admite múltiples formatos de datos y puede analizar datos de diversas fuentes, tales como la nube, las bases de datos locales y las bases de datos fuera de línea, sin necesidad migrarlos. Esto posibilita la creación de una visión unificada de los datos empresariales, lo que permite a las empresas innovar rápidamente y liberar todo el potencial de sus datos.

Información de datos valiosa para cualquier escenario

Análisis de bases de datos
Análisis de bases de datos

Analice los datos almacenados en una base de datos relacional, tal como la información de registro para una aplicación.

Ventajas
Familiaridad de experiencia con SQL

La sintaxis SQL de DLI es totalmente compatible con el estándar ANSI SQL 2003 para bases de datos relacionales, no requiere aprendizaje adicional y le permite utilizar SQL como siempre lo ha hecho.

Rendimiento superior

DLI utiliza un modelo de cómputo en memoria distribuido para procesar fácilmente grandes cantidades de datos.

Cuellos de botella resueltos
Las bases de datos relacionales no pueden manejar consultas complejas a medida que crece el volumen de datos.
La fragmentación puede dificultar el análisis exhaustivo.
El análisis de datos empresariales puede afectar a las operaciones en línea.
Servicios relacionados
Comercio electrónico
Marketing de precisión

En la industria del comercio electrónico, es crucial obtener información desde múltiples fuentes para el análisis correlacional con la finalidad de optimizar el marketing de precisión y mejorar las tasas de conversión. Por ejemplo, correlacionar "datos de eventos de clics en anuncios en la página" con "datos de registro de usuarios" para identificar los tipos de anuncios preferidos por los diferentes grupos de edad, y ofrecer anuncios más precisos a los usuarios según su edad.

Ventajas
Análisis entre fuentes

Los "datos de eventos de clics en anuncios de la página" almacenados en OBS y los "datos de registro de usuarios" almacenados en Relational Database Service (RDS) pueden correlacionarse y analizarse sin necesidad de migrarlos.

Operaciones puramente en SQL

DLI ha integrado múltiples fuentes de datos y su mapeo se puede completar directamente a través de la creación de tablas SQL.

Servicios relacionados
Videojuegos
Análisis de registros

Las empresas de videojuegos dependen de plataformas de análisis de datos para superar los desafíos de la industria aprovechando el poder de los datos. Por ejemplo, encontrar canales de publicidad de alta calidad, mejorar la retención de nuevos jugadores, optimizar las actividades operativas para aumentar la actividad de los jugadores e impulsar la iteración del producto a través de los datos.

Ventajas
Pago por uso

El DLI se factura solo durante el uso, lo que reduce los costos en más de un 50 % en comparación con los clústeres de uso exclusivo.

Análisis convergente

Los tres motores de DLI comparten metadatos y los datos se depuran en tiempo real antes de ser almacenados para su posterior procesamiento de extracción, transformación y carga (ETL) fuera de línea. Los resultados del procesamiento pueden utilizarse directamente para el análisis interactivo y la exploración de datos.

Cuello de botella resuelto
El análisis de registros se planifica generalmente por período, lo que resulta en una gran cantidad de tiempo inactivo entre cada planificación.
Servicios relacionados
Grandes empresas
Análisis de registros

Las grandes empresas a menudo tienen varios departamentos que utilizan servicios en la nube, lo que requiere la gestión de permisos para varios empleados dentro de cada departamento. Esto incluye supervisar la creación, eliminación, uso y aislamiento de los recursos de cómputo. Al mismo tiempo, también es necesario gestionar los datos de cada departamento, asegurando que se establezcan protocolos de aislamiento y uso compartido adecuados.

Ventajas
Control detallado de permisos

Control de permisos a nivel de columnas, control de permisos independiente para INSERT INTO/OVERWRITE, control de permisos de solo lectura para metadatos de tablas.

Gestión unificada

Uso de Identity and Access Management (IAM) para la gestión de usuarios (sin necesidad de crear usuarios DLI aparte) y admisión de autorización precisa a través de IAM.

Servicios relacionados
Genética
Gestión de datos de genética

En el campo de la genética, existen muchas bibliotecas de análisis de terceros basadas en el framework distribuido de Spark, tales como ADAM y Hail.

Ventajas
Admite la personalización de imágenes

Empaquete bibliotecas de análisis de terceros tales como ADAM y Hail basadas en imágenes base, que se pueden cargar directamente en SWR. Al ejecutar trabajos en DLI, las imágenes personalizadas en SWR se extraerán automáticamente.

Imágenes base incorporadas

Versiones integradas mejoradas por Huawei de Spark/Flink e imágenes de IA de código abierto para TensorFlow, Keras y PyTorch.

Servicios relacionados
Finanzas
Control de riesgos en tiempo real

Para aumentar la probabilidad de eliminación o reducción de ocurrencias de eventos de riesgo, se necesita un sistema de control de riesgos para escenarios típicos tales como registro, inicio de sesión y control de transacciones.

Ventajas
Alto throughput y baja latencia

Esto es posible gracias al uso del modelo de flujo de datos de Apache Flink, el cual es un framework de cómputo en tiempo real, el cual utiliza recursos de cómputo de alto rendimiento para procesar entre 1,000 a 20,000 mensajes por segundo por unidad central de procesamiento (CPU).

Abundante ecosistema en la nube

Mediante el uso de SQL, los flujos de datos procesados se pueden escribir en múltiples servicios en la nube tales como CloudTable y SMN.

Servicios relacionados
Gobierno
Pantallas en tiempo real

Para realizar una mejor gestión de la pandemia de COVID-19, los gobiernos necesitaban utilizar paneles de control en tiempo real para monitorear datos clave, tales como casos confirmados actuales, casos confirmados acumulativos y casos importados, con la finalidad de proporcionar soporte de datos para la siguiente etapa de control de la pandemia.

Ventajas
Rendimiento de consultas a nivel de milisegundos

El motor openLooKeng incorporado utiliza muchas técnicas de optimización de consultas para cumplir con los requerimientos de análisis interactivo de alto rendimiento a nivel de milisegundos, además de un framework de cómputo en memoria.

Fácil de usar

Método de desarrollo puramente en SQL, que ofrece total compatibilidad con la sintaxis estándar ANSI SQL 2003.

Servicios relacionados

Continua innovación de servicios con decenas de miles de clientes

Continua innovación de servicios con decenas de miles de clientes

Emprenda su recorrido hacia la

obtención de información valiosa

inmediatamente
Probar ahora

Más servicios

Más servicios