搜索_华为云

Hudi表模型设计规范 - 数据湖探索 DLI

Hudi表模型设计规范规则 Hudi表必须设置合理的主键。 Hudi表提供了数据更新和幂等写入能力，该能力要求Hudi表必须设置主键，主键设置不合理会导致数据重复。主键可以为单一主键也可以为复合主键，两种主键类型均要求主键不能有null值和空值，可以参考以下示例设置主键： SparkSQL：

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Hudi数据表设计规范
Hudi数据表设计规范 - 数据湖探索 DLI

Hudi数据表设计规范 Hudi表模型设计规范 Hudi表索引设计规范 Hudi表分区设计规范父主题： DLI Hudi开发规范

 帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范
Hudi表分区设计规范 - 数据湖探索 DLI

表的使用属性看事实表和维度表具有的特点：事实表：数据总量大，增量大，数据读取多以日期做切分，读取一定时间段的数据。维度表：总量相对小，增量小，多以更新操作为主，数据读取会是全表读取，或者按照对应业务ID过滤。基于以上考虑，维度表采用天分区会导致文件数过多，而且是全表读取，会

 帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Hudi数据表设计规范
使用DLI分析电商实时业务数据 - 数据湖探索 DLI

空间。了解Kafka计费说明。 RDS MySQL 数据库 RDS for MySQL提供在线云数据库服务。 RDS对您选择的数据库实例、数据库存储和备份存储（可选）收费。了解RDS计费说明。 DLV DLV适配云上云下多种数据源，提供丰富多样的可视化组件，快速定制数据大屏。

帮助中心 > 数据湖探索 DLI > 最佳实践
Hudi表索引设计规范 - 数据湖探索 DLI

Hudi表索引设计规范规则禁止修改表索引类型。 Hudi表的索引会决定数据存储方式，随意修改索引类型会导致表中已有的存量数据与新增数据之间出现数据重复和数据准确性问题。常见的索引类型如下：布隆索引：Spark引擎独有索引，采用bloomfiter机制，将布隆索引内容写入到Parquet文件的footer中。

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Hudi数据表设计规范
在DataArts Studio开发DLI SQL作业 - 数据湖探索 DLI

进入DataArts Studio数据开发页面步骤1：创建数据库和表开发创建数据库和表的SQL脚本数据库和表是SQL作业开发的基础，在执行作业前您需要根据业务场景定义数据库和表。本节操作介绍提交SQL脚本创建数据库和表的操作步骤。在DataArts Studio数据开发页面，选择左侧导航栏的“数据开发

 帮助中心 > 数据湖探索 DLI > 开发指南 > SQL作业开发指南
程序包管理概述 - 数据湖探索 DLI

程序包管理概述在执行DLI作业前需要将UDF Jar包或Jar作业程序包上传到云平台进行统一的管理和维护。有以下两种方式管理程序包：（推荐使用）上传至OBS管理程序包：提前将对应的jar包上传至OBS桶中，在作业配置时选择对应的OBS路径。（DLI程序包功能即将停用）上传

 帮助中心 > 数据湖探索 DLI > 用户指南 > DLI常用管理操作 > 管理Jar作业程序包
配置SuperSet通过Kyuubi连接DLI进行数据查询和分析 - 数据湖探索 DLI

Superset是一个开源的数据探索和可视化平台，支持对数据进行快速、直观的探索，同时支持创建丰富的数据可视化和交互式仪表板。 Kyuubi是一个分布式 SQL 查询引擎，它提供了标准的SQL接口，使用户能够方便地访问和分析存储在大数据平台中的数据。通过将Superset与Kyu

帮助中心 > 数据湖探索 DLI > 最佳实践 > 使用BI工具连接DLI分析数据
DLI Flink与MRS Flink有什么区别？ - 数据湖探索 DLI

ctor，包括数据库（RDS、GaussDB）、消息队列（DMS）、数据仓库（DWS）、对象存储（OBS）相比开源connector有较多易用性和稳定性提升。仅提供开源connector。开发与运维监控、告警支持对接华为云CES监控平台，支持对接华为云SMN告警系统，用

 帮助中心 > 数据湖探索 DLI > 常见问题 > DLI产品咨询类
应用场景 - 数据湖探索 DLI
应用场景 - 数据湖探索 DLI

游戏公司不同部门日常通过游戏数据分析平台，分析每日新增日志获取所需指标，通过数据来辅助决策。例如：运营部门通过平台获取新增玩家、活跃玩家、留存率、流失率、付费率等，了解游戏当前状态及后续响应活动措施；投放部门通过平台获取新增玩家、活跃玩家的渠道来源，来决定下一周期重点投放哪些平台。优势高效的S

帮助中心 > 数据湖探索 DLI > 产品介绍
使用DLI分析电商BI报表 - 数据湖探索 DLI

创建demo数据库，请参见图1。图1 创建数据库 “default”为内置数据库，不能创建名为“default”的数据库。选择demo数据库，在编辑框中输入以下SQL语句： create table user( user_id int, age int, gender

帮助中心 > 数据湖探索 DLI > 最佳实践
Flink Jar 包冲突，导致作业提交失败 - 数据湖探索 DLI

用户Flink程序的依赖包与DLI Flink平台的内置依赖包冲突，导致提交失败。解决方案首先您需要排除是否有冲突的Jar包。含DLI Flink提供了一系列预装在DLI服务中的依赖包，用于支持各种数据处理和分析任务。如果您上传的Jar包中包含DLI Flink运行平台中已经存在的包，则会提示Flink

帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类 > Flink Jar作业类
DLI内置依赖包 - 数据湖探索 DLI

DLI内置依赖包 DLI内置依赖包是平台默认提供的依赖包，用户打包Spark或Flink jar作业jar包时，不需要额外上传这些依赖包，以免与平台内置依赖包冲突。 Spark 3.1.1 依赖包表1 Spark 3.1.1 依赖包依赖包名称 accessors-smart-1

帮助中心 > 数据湖探索 DLI > 用户指南 > DLI常用管理操作 > 管理Jar作业程序包
配置SQL防御规则 - 数据湖探索 DLI

的问题，例如SQL输入语句质量良莠不齐、SQL问题难定位、大SQL语句消耗资源过多等。低质量的SQL会对数据分析平台系统带来不可预料的冲击，影响系统的性能或者平台稳定性。 DLI在Spark SQL引擎中增加SQL防御能力，基于用户可理解的SQL防御策略，实现对典型大SQL、低

 帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交SQL作业
Hudi开发规范概述 - 数据湖探索 DLI

Hudi开发规范概述范围本节内容介绍DLI-Hudi组件进行湖仓一体、流批一体方案的设计与开发方面的规则，适用于Hudi开发场景的表的设计、管理与作业开发。主要包括以下方面的规范：数据表设计资源配置性能调优常见故障处理常用参数配置术语约定本规范采用以下的术语描述：

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范
配置Fine BI通过Kyuubi连接DLI进行数据查询和分析 - 数据湖探索 DLI

单击“添加数据源”创建一个新的数据源。在数据源的向导中选择数据库类型。本例选择“Hadoop Hive” 配置数据库连接信息：数据连接名称：用户自定义数据连接名称。驱动：选择2.a中的驱动。数据库名称：DLI的数据库名称。主机：安装Kyuubi主机IP地址。端口：访问Kyuubi主机的端口。端口默认10009

帮助中心 > 数据湖探索 DLI > 最佳实践 > 使用BI工具连接DLI分析数据
OpenTSDB结果表 - 数据湖探索 DLI
OpenTSDB结果表 - 数据湖探索 DLI

OpenTSDB结果表功能描述 OpenTSDB是基于HBase分布式的，可伸缩的时间序列数据库。OpenTSDB的设计目标是用来采集大规模集群中的监控类信息，并可实现数据的秒级查询，解决海量监控类数据在普通数据库中查询存储的局限性，可用于系统监控和测量、物联网数据、金融数据和科学实验结果数据的收集监控。

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 数据定义语句DDL > 创建结果表
迁移数据场景概述 - 数据湖探索 DLI

典型场景示例：迁移RDS数据至DLI DWS CDM 典型场景示例：迁移DWS数据至DLI 数据迁移数据类型映射将其他云服务或业务平台数据迁移到DLI ，或者将DLI数据迁移到其他云服务或业务平台时，涉及到源和目的端数据类型的转换和映射，根据表2可以获取到源和目的端的数据类型映射关系。表2 数据类型映射表

 帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 迁移外部数据源数据至DLI
DWS Connector概述 - 数据湖探索 DLI

Service，简称DWS）是一种基于基础架构和平台的在线数据处理数据库，为用户提供海量数据挖掘和分析服务。DLI将Flink作业从数据仓库服务（DWS）中读取数据。DWS数据库内核兼容PostgreSQL，PostgreSQL数据库可存储更加复杂类型的数据，支持空间信息服务、多版

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > DWS
Flink Opensource SQL Elasticsearch结果表failure-handler参数填写retry_rejected导致提交失败 - 数据湖探索 DLI

Opensource SQL Elasticsearch结果表failure-handler参数填写retry_rejected导致提交失败问题说明 Flink Opensource SQL Elasticsearch结果表failure-handler参数填写retry_rejected导致提交失败

 帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类 > Flink SQL作业类

总条数： 339

上一页
1
2
3
4
5
...
17
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

Hudi表模型设计规范 - 数据湖探索 DLI

Hudi数据表设计规范 - 数据湖探索 DLI

Hudi表分区设计规范 - 数据湖探索 DLI

使用DLI分析电商实时业务数据 - 数据湖探索 DLI

Hudi表索引设计规范 - 数据湖探索 DLI

在DataArts Studio开发DLI SQL作业 - 数据湖探索 DLI

程序包管理概述 - 数据湖探索 DLI

配置SuperSet通过Kyuubi连接DLI进行数据查询和分析 - 数据湖探索 DLI

DLI Flink与MRS Flink有什么区别？ - 数据湖探索 DLI

应用场景 - 数据湖探索 DLI

使用DLI分析电商BI报表 - 数据湖探索 DLI

Flink Jar 包冲突，导致作业提交失败 - 数据湖探索 DLI

DLI内置依赖包 - 数据湖探索 DLI

配置SQL防御规则 - 数据湖探索 DLI

Hudi开发规范概述 - 数据湖探索 DLI

配置Fine BI通过Kyuubi连接DLI进行数据查询和分析 - 数据湖探索 DLI

OpenTSDB结果表 - 数据湖探索 DLI

迁移数据场景概述 - 数据湖探索 DLI

DWS Connector概述 - 数据湖探索 DLI

Flink Opensource SQL Elasticsearch结果表failure-handler参数填写retry_rejected导致提交失败 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线