搜索_华为云

管理DLI全局变量 - 数据湖探索 DLI

变量删除后，SQL中将无法使用该变量。全局变量权限管理针对不同用户，可以通过权限设置分配不同的全局变量，不同用户之间互不影响。管理员用户和全局变量的所有者拥有所有权限，不需要进行权限设置且其他用户无法修改其全局变量权限。给新用户设置全局变量权限时，该用户所在用户组的所属区域需具有Tenant Guest权限。关于Tenant

帮助中心 > 数据湖探索 DLI > 用户指南 > DLI常用管理操作
Spark作业访问OBS数据时报ResponseCode: 403和ResponseStatus: Forbidden错误 - 数据湖探索 DLI

Forbidden 解决方案 Spark程序访问OBS数据时，需要通过配置AK、SK的访问进行访问。具体访问方式可以参考：通用队列操作OBS表如何设置AK/SK。父主题： Spark作业运维类

 帮助中心 > 数据湖探索 DLI > 常见问题 > Spark作业相类 > Spark作业运维类
对象存储OBS结果表 - 数据湖探索 DLI

归档等场景。考虑到输入流可以是无界的，每个桶中的数据被组织成有限大小的Part文件。完全可以配置为基于时间的方式往桶中写入数据，比如可以设置每个小时的数据写入一个新桶中。即桶中将包含一个小时间隔内接收到的记录。桶目录中的数据被拆分成多个Part文件。对于相应的接收数据的桶的S

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > 对象存储OBS
创建Hbase维表 - 数据湖探索 DLI
创建Hbase维表 - 数据湖探索 DLI

该场景作业需要运行在DLI的独享队列上，因此要与HBase建立增强型跨源连接，且用户可以根据实际所需设置相应安全组规则。如何建立增强型跨源连接，请参考《数据湖探索用户指南》中增强型跨源连接章节。如何设置安全组规则，请参见《虚拟私有云用户指南》中“安全组”章节。若使用MRS HBase，请

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 数据定义语句DDL > 创建维表
Kafka源表 - 数据湖探索 DLI
Kafka源表 - 数据湖探索 DLI

息处理场景中使用。前提条件 Kafka是线下集群，需要通过增强型跨源连接功能将Flink作业与Kafka进行对接。且用户可以根据实际所需设置相应安全组规则。注意事项对接的Kafka集群不支持开启SASL_SSL。语法格式 1 2 3 4 5 6 7 8 9

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 数据定义语句DDL > 创建源表
Doris维表 - 数据湖探索 DLI
Doris维表 - 数据湖探索 DLI

该场景作业需要运行在DLI的独享队列上，因此要与HBase建立增强型跨源连接，且用户可以根据实际所需设置相应安全组规则。如何建立增强型跨源连接，请参考《数据湖探索用户指南》中增强型跨源连接章节。如何设置安全组规则，请参见《虚拟私有云用户指南》中“安全组”章节。如果使用MRS Doris，

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > Doris
修改DLI程序包所有者 - 数据湖探索 DLI

在“程序包管理”页面，单击程序包“操作 ”列中的“更多 > 修改所有者”。如果该程序包进行过分组设置，选择“组”或者“程序包”进行修改。图1 修改程序包所有者如果该程序包没有进行过分组设置，则可以参考下图，直接修改该程序包的所有者。图2 程序包管理-修改程序包所有者表1 参数说明

 帮助中心 > 数据湖探索 DLI > 用户指南 > DLI常用管理操作 > 管理Jar作业程序包
最新动态 - 数据湖探索 DLI
最新动态 - 数据湖探索 DLI

用户可以在DLI管理控制台采用API接口模式设置参数及参数值。商用创建批处理作业API 2020年5月序号功能名称功能描述阶段相关文档 1 支持数据扫描量套餐包 DLI增加数据扫描量套餐包，降低数据扫描量费用。商用产品价格详情 2 支持全局变量功能 DLI支持设置全局变量，用于保护用户关键信息。

帮助中心 > 数据湖探索 DLI > 最新动态
DLI Delta常见问题 - 数据湖探索 DLI

predicate on partitioned table `777dd`.`test_delta_parts1` 解决方案：在console页面设置中添加参数spark.sql.forcePartitionPredicatesOnPartitionedTable.enabled值为false。

帮助中心 > 数据湖探索 DLI > Delta SQL语法参考
FileSystem结果表 - 数据湖探索 DLI

归档等场景。考虑到输入流可以是无界的，每个桶中的数据被组织成有限大小的Part文件。完全可以配置为基于时间的方式往桶中写入数据，比如可以设置每个小时的数据写入一个新桶中。即桶中将包含一个小时间隔内接收到的记录。桶目录中的数据被拆分成多个Part文件。对于相应的接收数据的桶的S

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建结果表
队列权限管理 - 数据湖探索 DLI

在对应队列“权限信息”区域的用户列表中，选择需要修改权限的用户，在“操作”列单击“权限设置”。在队列“权限设置”对话框中，对当前用户具备的权限进行修改。详细权限描述如表1所示。当“权限设置”中的选项为灰色时，表示您不具备修改此队列权限的权限。可以向管理员用户、队列所有者等具有

 帮助中心 > 数据湖探索 DLI > 用户指南 > 创建弹性资源池和队列 > 管理队列
离线Compaction配置 - 数据湖探索 DLI

离线Compaction配置对于MOR表的实时业务，通常设置在写入中同步生成compaction计划，因此需要额外通过DataArts或者脚本调度SparkSQL去执行已经产生的compaction计划。执行参数 set hoodie.compact.inline = true;

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Bucket调优示例
Hudi存储结构 - 数据湖探索 DLI
Hudi存储结构 - 数据湖探索 DLI

Hudi存储结构 Hudi在写入数据时会根据设置的存储路径、表名、分区结构等属性生成Hudi表。在DLI环境，Hudi表的数据文件存储在OBS上，因此可以通过查看OBS文件检查。如下，展示了Hudi 多级分区COW表存储结构的示意。 hudi_table ├── .hoodie

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > Hudi表概述
DIS源表 - 数据湖探索 DLI
DIS源表 - 数据湖探索 DLI

"[0:2]"时，表示读取的分区范围是1-3，包括分区1、分区2和分区3，范围设置要在dis相应通道的范围内。 connector.offset 否用户可以根据需求设置该参数的数值，读取数据的起始位置，与start-time不能同时设置。 connector.start-time 否 DIS数据读取从该起始时间的数据。

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 数据定义语句DDL > 创建源表
Flink SQL作业Kafka分区数增加或减少，怎样不停止Flink作业实现动态感知？ - 数据湖探索 DLI

用户执行Flink Opensource SQL, 采用Flink 1.10版本。初期Flink作业规划的Kafka的分区数partition设置过小或过大，后期需要更改Kafka区分数。解决方案在SQL语句中添加如下参数： connector.properties.flink.partition-discovery

帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类 > Flink SQL作业类
LOAD数据到OBS外表报错：IllegalArgumentException: Buffer size too small. size - 数据湖探索 DLI

sql.shuffle.partitions参数设置的并行度过大，导致缓存区大小不够而导入数据报错。解决方案建议可以尝试调小spark.sql.shuffle.partitions参数值来解决缓冲区不足问题。具体该参数设置步骤如下：登录DLI管理控制台，单击“作业管理 >

帮助中心 > 数据湖探索 DLI > 常见问题 > SQL作业类 > SQL作业运维类
添加Python包后，找不到指定的Python环境 - 数据湖探索 DLI

添加Python包后，找不到指定的Python环境添加Python3包后，找不到指定的Python环境。可以通过在conf文件中，设置spark.yarn.appMasterEnv.PYSPARK_PYTHON=python3，指定计算集群环境为Python3环境。目前，新

 帮助中心 > 数据湖探索 DLI > 常见问题 > Spark作业相类 > Spark作业开发类
创建Bucket索引表调优 - 数据湖探索 DLI

024 分区表桶数 = 单分区数据量大小(G)/2G，再后向上取整，最小设置1个桶需要使用的是表的总数据大小，而不是压缩以后的文件大小桶的设置以偶数最佳，非分区表最小桶数请设置4个，分区表最小桶数请设置1个。父主题： Bucket调优示例

 帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Bucket调优示例
Hudi Clean操作说明 - 数据湖探索 DLI

SparkDataSource（option里设置如下参数，写数据时触发） hoodie.clean.automatic=true hoodie.cleaner.commits.retained=10 // 默认值为10，根据业务场景指定 Flink（with属性里设置如下参数，写数据时触发） clean

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > 数据管理维护
Orc Format - 数据湖探索 DLI
Orc Format - 数据湖探索 DLI

String 指定要使用的格式，这里应该是 'orc'。 Orc 格式也支持来源于 Table properties 的表属性。举个例子，您可以设置 orc.compress=SNAPPY 来允许spappy压缩。数据类型映射 Orc 格式类型的映射和 Apache Hive 是兼容的。下面的表格列出了

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Format

总条数： 459

上一页
1
...
7
8
9
...
23
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

管理DLI全局变量 - 数据湖探索 DLI

Spark作业访问OBS数据时报ResponseCode: 403和ResponseStatus: Forbidden错误 - 数据湖探索 DLI

对象存储OBS结果表 - 数据湖探索 DLI

创建Hbase维表 - 数据湖探索 DLI

Kafka源表 - 数据湖探索 DLI

Doris维表 - 数据湖探索 DLI

修改DLI程序包所有者 - 数据湖探索 DLI

最新动态 - 数据湖探索 DLI

DLI Delta常见问题 - 数据湖探索 DLI

FileSystem结果表 - 数据湖探索 DLI

队列权限管理 - 数据湖探索 DLI

离线Compaction配置 - 数据湖探索 DLI

Hudi存储结构 - 数据湖探索 DLI

DIS源表 - 数据湖探索 DLI

Flink SQL作业Kafka分区数增加或减少，怎样不停止Flink作业实现动态感知？ - 数据湖探索 DLI

LOAD数据到OBS外表报错：IllegalArgumentException: Buffer size too small. size - 数据湖探索 DLI

添加Python包后，找不到指定的Python环境 - 数据湖探索 DLI

创建Bucket索引表调优 - 数据湖探索 DLI

Hudi Clean操作说明 - 数据湖探索 DLI

Orc Format - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线