搜索_华为云

Hbase维表 - 数据湖探索 DLI
Hbase维表 - 数据湖探索 DLI

该场景作业需要运行在DLI的独享队列上，因此要与HBase建立增强型跨源连接，且用户可以根据实际所需设置相应安全组规则。如何建立增强型跨源连接，请参考《数据湖探索用户指南》中增强型跨源连接章节。如何设置安全组规则，请参见《虚拟私有云用户指南》中“安全组”章节。如果使用MRS HBase，

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > Hbase
权限管理概述 - 数据湖探索 DLI

于策略的授权是一种更加灵活的授权方式，能够满足企业对权限最小化的安全管控要求。例如：针对DLI服务，管理员能够控制IAM用户仅能对某一类云服务器资源进行指定的管理操作。了解DLI SQL常用操作与系统策略的授权关系，请参考常用操作与系统权限关系。表1 DLI系统权限系统角色/策略名称

 帮助中心 > 数据湖探索 DLI > 用户指南 > 权限管理
通用队列操作OBS表如何设置AK/SK - 数据湖探索 DLI

用户获取Spark作业委托临时凭证本操作介绍获取Spark Jar作业委托临时凭证的操作方法。方案2：Spark Jar作业设置获取AK/SK 获取结果为AK/SK时，设置如下：代码创建SparkContext val sc: SparkContext = new SparkContext()

帮助中心 > 数据湖探索 DLI > 常见问题 > Spark作业相类 > Spark作业开发类
设置多版本备份数据保留周期 - 数据湖探索 DLI

days 多版本中备份数据保留的日期。默认为7天，建议设置在1到7天范围内。注意事项 DLI数据多版本功能当前仅支持通过Hive语法创建的OBS表，具体建表语法可以参考使用Hive语法创建OBS表。示例在DLI数据多版本中，设置备份数据保留时间为5天。 1 2 ALTER TABLE

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 表相关 > 多版本备份恢复数据
查询所有作业 - 数据湖探索 DLI

false } ] } 状态码状态码如表6所示。表6 状态码状态码描述 200 查询成功。 400 请求错误。 500 内部服务器错误。错误码调用接口出错后，将不会返回上述结果，而是返回错误码和错误信息，更多介绍请参见错误码。父主题： SQL作业相关API

帮助中心 > 数据湖探索 DLI > API参考 > SQL作业相关API
Spark异步任务执行表compaction参数设置规范 - 数据湖探索 DLI

compaction命令时，禁止将hoodie.run.compact.only.inline设置成false，该值需要设置成true。错误示例：配置参数 hoodie.run.compact.only.inline=false 随后执行SQL run compaction on

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Spark on Hudi开发规范
设置普通队列的弹性扩缩容定时任务 - 数据湖探索 DLI

激活队列扩缩容定时任务。默认开启。如果关闭，则系统不会触发执行当前设置的定时规格变更任务。有效期设置执行定时任务的时间段。包括“日期”和“时间”。说明： “有效期”中的“开始时间”需要晚于当前的系统时间。如果只设置了扩容，在“有效期”结束之后，系统不会自动缩容，需要手动修改或设置缩容定时任务。反之亦然。即为单次执行定时扩缩容。

帮助中心 > 数据湖探索 DLI > 用户指南 > 创建弹性资源池和队列 > 管理队列
Confluent Avro Format - 数据湖探索 DLI

根据kafka和ecs所在的虚拟私有云和子网创建相应的跨源，并绑定所要使用的队列。然后设置安全组，入向规则，使其对当前将要使用的队列放开，并根据kafka和ecs的地址测试队列连通性（通用队列-->找到作业的所属队列-->更多-->测试地址连通性-->输入kafka或ecs的地址-->

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > Format
Flink Jar作业设置backend为OBS，报错不支持OBS文件系统 - 数据湖探索 DLI

Flink Jar作业设置backend为OBS，报错不支持OBS文件系统问题现象客户执行Flink Jar作业，通过设置checkpoint存储在OBS桶中，作业一直提交失败，并伴有报错提交日志，提示OBS桶名不合法。原因分析确认OBS桶名是否正确。确认所用AKSK是否有权限。

帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类 > Flink Jar作业类
Delta常见配置参数 - 数据湖探索 DLI

Delta常见配置参数提交DLI Spark SQL作业时，在“SQL编辑器”界面右上角的“设置 > 参数设置”中配置Delta参数。表1 Delta常见配置项参数描述默认值 spark.databricks.delta.retentionDurationCheck.enabled

帮助中心 > 数据湖探索 DLI > Delta SQL语法参考
添加分区（只支持OBS表） - 数据湖探索 DLI

ADD [IF NOT EXISTS] PARTITION partition_specs1 [LOCATION 'obs_path1'] PARTITION partition_specs2 [LOCATION 'obs_path2']; 关键字 IF NOT EX

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 表相关 > 分区相关
Hudi表模型设计规范 - 数据湖探索 DLI

Hudi表模型设计规范规则 Hudi表必须设置合理的主键。 Hudi表提供了数据更新和幂等写入能力，该能力要求Hudi表必须设置主键，主键设置不合理会导致数据重复。主键可以为单一主键也可以为复合主键，两种主键类型均要求主键不能有null值和空值，可以参考以下示例设置主键： SparkSQL： //

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Hudi数据表设计规范
配置DBeaver连接DLI进行数据查询和分析 - 数据湖探索 DLI

dependencies.jar。图3 上传驱动添加后驱动类为空，需要单击“找到类”。识别出来的驱动类，需要与“设置”页的“类名”一致。单击“确定”，驱动设置完成。步骤2：测试连接数据库在DBeaver客户端单击“数据库 > 新建数据库连接”，选择步骤1：在DBeaver新建DLI

帮助中心 > 数据湖探索 DLI > 最佳实践 > 使用BI工具连接DLI分析数据
Hbase结果表 - 数据湖探索 DLI
Hbase结果表 - 数据湖探索 DLI

它能提升写入HBase数据库的性能，但是也可能增加延迟。设置为 "0" 关闭此选项。注意："sink.buffer-flush.max-size" 和 "sink.buffer-flush.max-rows" 同时设置为 "0"，并设置刷新缓存的间隔，则以完整的异步处理方式刷新缓存。格式为：{length

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > Hbase
Confluent Avro Format - 数据湖探索 DLI

根据kafka和ecs所在的虚拟私有云和子网创建相应的跨源，并绑定所要使用的队列。然后设置安全组，入向规则，使其对当前将要使用的队列放开，并根据kafka和ecs的地址测试队列连通性（通用队列 > 找到作业的所属队列 > 更多 > 测试地址连通性 > 输入kafka或ecs的地址 >

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Format
Kafka - 数据湖探索 DLI
Kafka - 数据湖探索 DLI

具体方式请参考客户端SSL加密功能使用说明。端口请注意使用KafKa服务配置中设置的ssl.port端口，默认值为9093。 with参数中security.protocol请设置为SSL。 MRS集群kafka服务配置中，设置ssl.mode.enable请设置为true，并重启kafka with参数中properties

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表
Spark作业运行大批量数据时上报作业运行超时异常错误 - 数据湖探索 DLI

据倾斜、网络问题或任务过多导致的。解决方案：设置并发数：通过设置合适的并发数，可以启动多任务并行运行，从而提高作业的处理能力。例如访问DWS大批量数据库数据时设置并发数，启动多任务的方式运行，避免作业运行超时。具体并发设置可以参考对接DWS样例代码中的partitionC

帮助中心 > 数据湖探索 DLI > 常见问题 > Spark作业相类 > Spark作业运维类
创建Spark作业 - 数据湖探索 DLI
创建Spark作业 - 数据湖探索 DLI

Executor CPU核数用于设置Spark作业申请的每个Executor的CPU核数，决定每个Executor并行执行Task的能力。 Executor个数用于设置Spark作业申请的Executor的数量。 driver CPU核数用于设置driver CPU核数。 driver内存

 帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交Spark作业
DWS结果表（不推荐使用） - 数据湖探索 DLI

该场景作业需要运行在DLI的独享队列上，因此要与DWS集群建立增强型跨源连接，且用户可以根据实际所需设置相应安全组规则。如何建立增强型跨源连接，请参考《数据湖探索用户指南》中增强型跨源连接章节。如何设置安全组规则，请参见《虚拟私有云用户指南》中“安全组”章节。 Flink跨源开发场景中直接

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > DWS
使用DLI提交SQL作业查询RDS MySQL数据 - 数据湖探索 DLI

安全组限制实例的安全访问规则，加强云数据库RDS服务与其他服务间的安全访问。数据源的安全组需放通DLI弹性资源池的网段。 - 设置密码设置实例的登录密码。 - 管理员账号 root root 管理员密码设置管理员密码。 - 参数模板数据库参数模板就像是数据库引擎配置值的容器，参数模板中的参数可应用于一个或多个相同类型的数据库实例。

帮助中心 > 数据湖探索 DLI > 快速入门

总条数： 468

上一页
1
...
6
7
8
...
24
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

Hbase维表 - 数据湖探索 DLI

权限管理概述 - 数据湖探索 DLI

通用队列操作OBS表如何设置AK/SK - 数据湖探索 DLI

设置多版本备份数据保留周期 - 数据湖探索 DLI

查询所有作业 - 数据湖探索 DLI

Spark异步任务执行表compaction参数设置规范 - 数据湖探索 DLI

设置普通队列的弹性扩缩容定时任务 - 数据湖探索 DLI

Confluent Avro Format - 数据湖探索 DLI

Flink Jar作业设置backend为OBS，报错不支持OBS文件系统 - 数据湖探索 DLI

Delta常见配置参数 - 数据湖探索 DLI

添加分区（只支持OBS表） - 数据湖探索 DLI

Hudi表模型设计规范 - 数据湖探索 DLI

配置DBeaver连接DLI进行数据查询和分析 - 数据湖探索 DLI

Hbase结果表 - 数据湖探索 DLI

Confluent Avro Format - 数据湖探索 DLI

Kafka - 数据湖探索 DLI

Spark作业运行大批量数据时上报作业运行超时异常错误 - 数据湖探索 DLI

创建Spark作业 - 数据湖探索 DLI

DWS结果表（不推荐使用） - 数据湖探索 DLI

使用DLI提交SQL作业查询RDS MySQL数据 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线